本心、输入输出、结果
文章目录
- 国内外大模型 SuperCLUE 基准测试
- 前言
- 国内外大模型 SuperCLUE 基准测试榜单
- 什么是中文大模型基准 SuperCLUE
国内外大模型 SuperCLUE 基准测试
编辑 | 简简单单 Online zuozuo
地址 | https://blog.csdn.net/qq_15071263
如果觉得本文对你有帮助,欢迎点赞、收藏、评论
前言
国内外大模型 SuperCLUE 基准测试
国内外大模型 SuperCLUE 基准测试榜单
中文大模型测评基准 SuperCLUE 发布 2024 上半年报告,披露针对国内外 33 个大模型的综合测评结果
从代表通用能力的一级总分来看,OpenAI 的 GPT-4o 以 81 分高居榜首,Claude-3.5-Sonnet 与通义千问开源模型 Qwen2-72B-Instruct 并列第二,得分均为 77。
通义千问 (Qwen2-72B) 既是排名最高的中国大模型,也是全球最强的开源大模型,性能超越文心一言 4.0、讯飞星火 V4.0、Llama-3-7