TOPS
TOPS是Tera Operations Per Second的缩写,1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。
与此对应的还有GOPS(Giga Operations Per Second),MOPS(Million Operation Per Second)算力单位。1GOPS代表处理器每秒钟可进行十亿次(109)操作,1MOPS代表处理器每秒钟可进行一百万次(106)操作。TOPS同GOPS与MOPS可以换算,都代表每秒钟能处理的次数,单位不同而已。
在某些情况下,还使用 TOPS/W 来作为评价处理器运算能力的一个性能指标,TOPS/W 用于度量在1W功耗的情况下,处理器能进行多少万亿次操作。
GOPS
OPS与FLOPS类似,只不过OPS一个是操作次数,FLOPS一个是浮点操作次数。
FLOP与GOPS之间的换算
(FLOP与GOPS之间的换算需要查相关资料,后续查找资料给出)
不确定的看法是OPS是操作数量,FLOPS为浮点操作数量,两者可近似于相等,FLOPS比OPS稍大。
GOPS与FLOPS
1.1 FLOPS
FLOPS定义
是“每秒所执行的浮点运算次数”(floating-point operations per second)的缩写。它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S,代表秒,而不是复数,所以不能省略掉。
在这里所谓的“浮点运算”,实际上包括了所有涉及小数的运算。这类运算在某类应用软件中常常出现,而它们也比整数运算更花时间。现今大部分的处理器中,都有一个专门用来处理浮点运算的“浮点运算器”(FPU)。也因此FLOPS所量测的,实际上就是FPU的执行速度。而最常用来测量FLOPS的基准程式(benchmark)之一,就是Linpack。
FLOPS换算
一个MFLOPS(megaFLOPS)等于每秒一百万(=10^6)次的浮点运算,
一个GFLOPS(gigaFLOPS)等于每秒十亿(=10^9)次的浮点运算,
一个TFLOPS(teraFLOPS)等于每秒一万亿(=10^12)次的浮点运算,(1太拉)
一个PFLOPS(petaFLOPS)等于每秒一千万亿(=10^15)次的浮点运算,
前标的十进制与二进制
此处存在疑问,从M到G再到T,到底是1024近似为1000,还是采用二进制的乘以1024,还是确实为十进制的1000
倾向于FLOP的前标与内存一样,是以二进制算,每进一级是1024为单位的。
但是10243是1073741824,可以近似为109。所以采用10^3来近似1024问题不大。
赋常见显卡的算力:
1、RTX3090
35.6 TFLOPS
2、tesla T4:
Single Precision Performance (单精度性能FP32)
8.1 TFLOPS
Mixed Precision(混合精度 FP16/FP32)
65 FP16 TFLOPS
INT8 Precision(INT8 精度)
130 INT8 TOPS
3、tesla A100(40G和80G两种):
常见开发板的算力:
1、英伟达Xavier
30TOPS
2、瑞芯微rk3399开发板
3 TOPS