AIPerf500全称国际人工智能算力AIPerf500排行榜,是一个面向全球超级计算机,评估AI计算性能的排行榜。它由中国科学院计算技术研究所研究员张云泉、清华大学教授陈文光、阿尔贡国家实验室研究员帕万·巴拉吉(Pavan Balaji)和苏黎世联邦理工学院教授托斯顿·赫夫勒,从2020年起开始发布。最早的AIPerf榜采用经典卷积模型来评价智能算力的训练性能,后来推出的AIPerf-LLM榜则采用大语言模型来评价智能算力的训练性能,2024年又新增了AIPerf-Inference榜来评价智能算力的推理性能。[1]
TOP500等榜单通常使用双精度浮点数(64位)运算来评测机器的运算性能,[2]而AI训练主要要求的则是单精度浮点数(32位)和16位浮点数的运算性能,推理则主要要求8位整数的运算性能,[3]这便是AIPerf500诞生的背景。用户可以在其官方网站下载其评分程序,并上传评分结果。[4]榜单虽然是面向国际的,不过截至2022年,上报结果的机器仍以中国国内为主。[5]
排行
AIPerf500
2024年AIPerf500排行榜前10名[6]
排名 |
系统 |
AIPerf分数(TOPS[注 1]) |
地点 |
制造商 |
节点数 |
内存(TB)
|
1 |
鹏城云脑II |
194,527.50 |
鹏城实验室 |
鹏城实验室 |
512 |
|
2 |
某主机系统 |
100,168.41 |
北京超级云计算中心 |
北京北龙超级云计算 |
878 |
439
|
3 |
某主机系统 |
82,088.79 |
北京超级云计算中心 |
北京北龙超级云计算 |
276 |
176
|
4 |
某主机系统 |
64,098.16 |
北京超级云计算中心 |
北京北龙超级云计算 |
246 |
246
|
5 |
某主机系统 |
55,543.06 |
北京超级云计算中心 |
北京北龙超级云计算 |
207 |
|
6 |
神威MPP |
53,704.50 |
某超级计算中心 |
某超级计算中心 |
|
|
7 |
2100IG集群 |
16,361.28 |
某视频公司 |
LTHPC |
276 |
|
8 |
某主机系统 |
14,909.25 |
CASDAO苏州 |
CASDAO |
50 |
|
9 |
4800IG集群 |
14,220.42 |
某视频公司 |
LTHPC |
295 |
|
10 |
4800IG集群 |
10,360.00 |
某技术公司 |
LTHPC |
70 |
|
AIPerf-LLM
2024年AIPerf-LLM排行榜前10名[6]
排名 |
地点 |
AIPerf分数(TOPS) |
制造商 |
节点数 |
内存(TB)
|
1 |
北京超级云计算中心 |
303,784.42 |
北京北龙超级云计算 |
246 |
246
|
2 |
复旦大学 |
208,300 |
阿里云 |
150 |
150
|
3 |
北京超级云计算中心 |
190,204.19 |
北京北龙超级云计算 |
276 |
176
|
4 |
CASDAO苏州 |
138,862 |
CASDAO |
32 |
64
|
5 |
北京超级云计算中心 |
122,900 |
北京北龙超级云计算 |
207 |
207
|
6 |
北京超级云计算中心 |
78,769.70 |
北京北龙超级云计算 |
878 |
439
|
7 |
北京师范大学 |
18,842 |
英伟达 |
19 |
38
|
8 |
某技术公司 |
17,740.80 |
华为 |
16 |
2
|
9 |
WQ与中国科学院大学研究院智能计算中心 |
15,425 |
宁畅信息 |
16 |
32
|
10 |
清华大学 |
753 |
英伟达 |
1 |
0.5
|
AIPerf-Inference吞吐榜
AIPerf-Inference延迟榜
2024年AIPerf-Inference延迟榜前10名[6]
排名 |
地点 |
AIPerf分数(TOPS) |
制造商 |
节点数
|
1 |
北京超级云计算中心 |
0.36 |
北京北龙超级云计算 |
4
|
2 |
LTHPC |
0.46 |
LTHPC |
6
|
3 |
中国人民大学 |
0.50 |
英伟达 |
2
|
4 |
上海交通大学 |
0.52 |
英伟达 |
4
|
5 |
天津Tier |
0.53 |
天津Tier |
1
|
6 |
清华大学 |
0.64 |
英伟达 |
4
|
7 |
HPC+AI团队(ICT) |
0.69 |
英伟达 |
1
|
8 |
天津Tier |
0.75 |
天津Tier |
1
|
9 |
西安电子科技大学 |
0.77 |
英伟达 |
1
|
10 |
某技术公司 |
0.91 |
华为 |
1
|
注释
- ^ Tera Operations Per Sencond,意为每秒操作数,以太拉计,也即T、太、万亿或1012。
参考资料