大模型评测指标集
- (☆)SuperCLUE
- (1)SuperCLUE-V(中文原生多模态理解测评基准)
- (2)SuperCLUE-Auto(汽车大模型测评基准)
- (3)AIGVBench-T2V(文生视频基准测评)
- (4)SuperCLUE-Coder(代码助手测评基准)
- (5)SuperCLUE-RAG(中文原生检索增强生成测评基准)
- (6)SuperCLUE-Agent(Agent能力测评基准)
- (7)SuperCLUE-Image(中文原生文生图测评基准)
- (8)“巢燧”(大模型测评基准)
(☆)SuperCLUE
- CLUE官网: https://www.CLUEBenchmarks.com
- SuperCLUE排行榜网站: https://www.superclueai.com
- Github地址: https://github.com/CLUEbenchmark/SuperCLUE
![Panda](https://img-blog.csdnimg.cn/direct/02989d2daf954a75a8a511dff5f31dba.png)
(1)SuperCLUE-V(中文原生多模态理解测评基准)
- 推荐文章: SuperCLUE-V: 中文原生多模态理解测评基准
- 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-V
![Panda](https://img-blog.csdnimg.cn/direct/9d3f3b2b4499428eba415ed03a5e7b56.png)
(2)SuperCLUE-Auto(汽车大模型测评基准)
- 推荐文章: SuperCLUE-Auto:首个汽车行业中文大模型测评基准发布
- 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-auto
![Panda](https://img-blog.csdnimg.cn/direct/ba90b63fa5b04cd78b0a2f8da56c1be1.png)
(3)AIGVBench-T2V(文生视频基准测评)
- 推荐文章: AIGVBench文生视频测评首期结果公布,1000个AI视频对比,最高72.9分,Luma仅第3
- AIGVBench登录页: www.AIGVBench.com
![Panda](https://img-blog.csdnimg.cn/direct/84303f32cf604f5ca5e5e3e02641874b.png)
(4)SuperCLUE-Coder(代码助手测评基准)
- 推荐文章: 代码助手测评」启动,SC-Coder测评方案公布
![Panda](https://img-blog.csdnimg.cn/direct/1a14c7b4d07442ae897a4633d0152dc3.jpeg)
(5)SuperCLUE-RAG(中文原生检索增强生成测评基准)
- 推荐文章: 中文RAG检索增强生成榜单出炉!仅有一家刚刚及格
- 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-RAG
![Panda](https://img-blog.csdnimg.cn/direct/be387b848b1a417a88ae4e8439ecf747.jpeg)
(6)SuperCLUE-Agent(Agent能力测评基准)
- 推荐文章: SuperCLUE-Agent: Agent智能体中文原生任务能力测评基准
- 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-Agent
![Panda](https://img-blog.csdnimg.cn/direct/97c7aa7b15ed4a45b17a55e7f821065a.png)
(7)SuperCLUE-Image(中文原生文生图测评基准)
- 推荐文章: 文生图大模型基准测评首期榜单公布,DALL-E 3取得最高76.94分
- 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-Image
![Panda](https://img-blog.csdnimg.cn/direct/e830c202bc4540f38879a1d95d2241d0.jpeg)
![Panda](https://img-blog.csdnimg.cn/direct/94c52b8d53d549c893b91e03ea38b79b.jpeg)
(8)“巢燧”(大模型测评基准)
- 推荐文章: “巢燧”大模型基准综合评测:国内大模型中文能力首超GPT-4,多个中文大模型超过GPT-3.5
- 项目地址: http://openeval.org.cn/
![Panda](https://img-blog.csdnimg.cn/direct/82075455defb404b934414ed5b5d013c.png)