大语言模型通用能力排行榜(2024年11月8日更新)

数据来源SuperCLUE

榜单数据为通用能力排行榜

排名

模型名称

机构

总分

理科

文科

Hard

使用方式

发布日期

-

o1-preview

OpenAI

75.85

86.07

76.6

64.89

API

2024年11月8日

-

Claude 3.5 Sonnet(20241022)

Anthropic

70.88

82.48

76.56

53.6

POE

2024年11月8日

-

ChatGPT-4o-latest

OpenAI

70.85

84.65

77.1

50.8

API

2024年11月8日

🏅

GLM-4-Plus

智谱AI

69.64

81.41

76.44

51.08

API

2024年11月8日

🏅

SenseChat 5.5

商汤

69

81.17

76.67

49.16

API

2024年11月8日

🏅

AndesGPT-2.0

OPPO

68.91

81.46

76.61

48.64

API

2024年11月8日

🏅

Qwen2.5-72B-Instruct

阿里巴巴

68.9

83.12

76.96

46.64

API

2024年11月8日

-

Claude 3.5 Sonnet(20240620)

Anthropic

68.23

81.68

76.54

46.48

poe

2024年11月8日

-

Gemini-1.5-Pro-002

Google

68.19

80.42

76.32

47.82

API

2024年11月8日

-

Qwen-max-0919

阿里巴巴

68

83.03

76.5

44.48

API

2024年11月8日

-

GPT-4-Turbo-2024-04-09

OpenAI

67.48

80.78

74.85

46.82

API

2024年11月8日

🥈

Hunyuan-Turbo

腾讯

67.35

81.47

76.84

43.74

API

2024年11月8日

🥈

360gpt2-pro

360

67.19

82.95

74.94

43.68

API

2024年11月8日

🥈

Step-2-16k

阶跃星辰

67.02

80.52

76.65

43.91

API

2024年11月8日

🥈

DeepSeek-V2.5

深度求索

66.87

81.69

75.42

43.5

API

2024年11月8日

🥈

Doubao-pro-0828

字节跳动

66.43

79.98

75.1

44.22

API

2024年11月8日

🥉

Baichuan4

百川智能

66.28

81.81

75.94

41.1

API

2024年11月8日

🥉

山海大模型4.0

云知声

66.26

80.05

75.38

43.34

API

2024年11月8日

🥉

TeleChat2-Large

TeleAI

66.23

78.85

75.54

44.28

API

2024年11月8日

-

Llama-3.1-405B-Instruct

Meta

65.84

80.54

71.53

45.46

API

2024年11月8日

4

Ernie-4.0-turbo-8k-preview

百度

64.93

78.69

74.4

41.7

API

2024年11月8日

-

GPT-4o-mini

OpenAI

64.85

79.84

73.24

41.46

API

2024年11月8日

4

Moonshot(kimi)

月之暗面

63.93

74.37

75.08

42.34

网页

2024年11月8日

5

Sky-Chat-3.0

昆仑万维

62.64

74.32

75.46

38.12

API

2024年11月8日

5

TeleChat2-35B

TeleAI

62.46

74.07

74.05

39.26

模型

2024年11月8日

-

Llama-3.1-70B-Instruct

Meta

61.62

77.52

69.64

37.7

API

2024年11月8日

6

Qwen2.5-7B-Instruct

阿里巴巴

60.61

74.62

73.28

33.92

API

2024年11月8日

-

Llama-3.2-90B-Instruct

Meta

60.58

75.89

69

36.84

API

2024年11月8日

7

讯飞星火V4.0

科大讯飞

59.4

72.49

71.55

34.16

API

2024年11月8日

8

GLM-4-9B-Chat

智谱AI

56.83

69.22

71.94

29.32

模型

2024年11月8日

-

Gemma-2-9b-it

Google

55.48

67.78

69.62

29.02

模型

2024年11月8日

9

MiniCPM3-4B

面壁智能

53.16

63.04

69.87

26.56

模型

2024年11月8日

-

Llama-3.1-8B-Instruct

Meta

51.42

63.27

65.3

25.69

API

2024年11月8日

10

Yi-1.5-9B-Chat-16K

零一万物

51.37

59.2

67.86

27.06

模型

2024年11月8日

-

Llama-3.2-11B-Instruct

Meta

50.61

63.1

64.02

24.72

API

2024年11月8日

11

Yi-1.5-6B-Chat

零一万物

48.69

57.03

63.89

25.16

模型

2024年11月8日

12

Qwen2.5-1.5B-Instruct

阿里巴巴

43.92

46.14

64.54

21.1

API

2024年11月8日

-

Gemma-2-2b-it

Google

42.25

43.36

63.72

19.67

模型

2024年11月8日

-

Phi-3-Mini-4K-Instruct

微软

39.98

52.28

44.75

22.9

模型

2024年11月8日

-

Mistral-7B-Instruct-v0.3

Mistral AI

37.11

41.06

51.21

19.05

模型

2024年11月8日

13

Baichuan2-7B-Chat

百川智能

33.59

28.46

58.09

14.22

模型

2024年11月8日

13

Qwen2.5-0.5B-Instruct

阿里巴巴

32.85

30.53

54.13

13.9

API

2024年11月8日

13

RWKV-6-World-7B

RWKV

32.76

27.46

58.05

12.76

模型

2024年11月8日

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/473830.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何轻松导出所有 WordPress URL 为纯文本格式

作为一名多年的 WordPress 使用者,我深知管理一个网站的复杂性。从迁移网站、设置重定向到整理内容结构,每一步都需要精细处理。而拥有所有 URL 的清单,不仅能让这些工作变得更加简单,还能为后续的管理提供极大的便利。其实&#…

vue项目使用eslint+prettier管理项目格式化

代码格式化、规范化说明 使用eslintprettier进行格式化,vscode中需要安装插件ESLint、Prettier - Code formatter,且格式化程序选择为后者(vue文件、js文件要分别设置) 对于eslint规则,在格式化时不会全部自动调整&…

Ubuntu 18.04 配置sources.list源文件(无法安全地用该源进行更新,所以默认禁用该源)

如果你 sudo apt update 时出现诸如 无法安全地用该源进行更新,所以默认禁用该源 的错误,那就换换源吧,链接: https://mirror.tuna.tsinghua.edu.cn/help/ubuntu/ 注意版本: 修改源文件: sudo nano /etc…

5. langgraph中的react agent使用 (从零构建一个react agent)

1. 定义 Agent 状态 首先,我们需要定义 Agent 的状态,这包括 Agent 所持有的消息。 from typing import (Annotated,Sequence,TypedDict, ) from langchain_core.messages import BaseMessage from langgraph.graph.message import add_messagesclass …

【网络】什么是交换机?switch

交换机(Switch)意为“开关”,是一种用于电(光)信号转发的网络设备。以下是关于交换机的详细解释: 一、交换机的基本定义 功能:交换机能为接入交换机的任意两个网络节点提供独享的电信号通路&am…

【AlphaFold3】开源本地的安装及使用

文章目录 安装安装DockerInstalling Docker on Host启用Rootless Docker 安装 GPU 支持安装 NVIDIA 驱动程序安装 NVIDIA 对 Docker 的支持 获取 AlphaFold 3 源代码获取基因数据库获取模型参数构建将运行 AlphaFold 3 的 Docker 容器 参考 AlphaFold3: https://github.com/goo…

【免越狱】iOS砸壳 可下载AppStore任意版本 旧版本IPA下载

软件介绍 下载iOS旧版应用,简化繁琐的抓包流程。 一键生成去更新IPA(手机安装后,去除App Store的更新检测)。 软件界面 支持系统 Windows 10/Windows 8/Windows 7(由于使用了Fiddler库,因此需要.Net环境…

shell 100例

1、每天写一个文件 (题目要求) 请按照这样的日期格式(xxxx-xx-xx每日生成一个文件 例如生成的文件为2017-12-20.log,并且把磁盘的使用情况写到到这个文件中不用考虑cron,仅仅写脚本即可 [核心要点] date命令用法 df命令 知识补充&#xff1…

Acrobat Pro DC 2023(pdf免费转化word)

所在位置 通过网盘分享的文件:Acrobat Pro DC 2023(64bit).tar 链接: https://pan.baidu.com/s/1_m8TT1rHTtp5YnU8F0QGXQ 提取码: 1234 --来自百度网盘超级会员v4的分享 安装流程 打开安装所在位置 进入安装程序 找到安装程序 进入后点击自定义安装,这里…

linux之调度管理(5)-实时调度器

一、概述 在Linux内核中,实时进程总是比普通进程的优先级要高,实时进程的调度是由Real Time Scheduler(RT调度器)来管理,而普通进程由CFS调度器来管理。 实时进程支持的调度策略为:SCHED_FIFO和SCHED_RR。 SCHED_FIFO&#xff…

在arm64架构下, Ubuntu 18.04.5 LTS 用命令安装和卸载qt4、qt5

问题:需要在 arm64下安装Qt,QT源码编译失败以后,选择在线安装! 最后安装的版本是Qt5.9.5 和QtCreator 4.5.2 。 一、ubuntu安装qt4的命令(亲测有效): sudo add-apt-repository ppa:rock-core/qt4 sudo apt updat…

Qt 之 qwt和QCustomplot对比

QWT(Qt Widgets for Technical Applications)和 QCustomPlot 都是用于在 Qt 应用程序中绘制图形和图表的第三方库。它们各有优缺点,适用于不同的场景。 以下是 QWT 和 QCustomPlot 的对比分析: 1. 功能丰富度 QWT 功能丰富&a…

实用教程:如何无损修改MP4视频时长

如何在UltraEdit中搜索MP4文件中的“mvhd”关键字 引言 在视频编辑和分析领域,有时我们需要深入到视频文件的底层结构中去。UltraEdit(UE)和UEStudio作为强大的文本编辑器,允许我们以十六进制模式打开和搜索MP4文件。本文将指导…

使用nossl模式连接MySQL数据库详解

使用nossl模式连接MySQL数据库详解 摘要一、引言二、nossl模式概述2.1 SSL与nossl模式的区别2.2 选择nossl模式的场景三、在nossl模式下连接MySQL数据库3.1 准备工作3.2 C++代码示例3.3 代码详解3.3.1 初始化MySQL连接对象3.3.2 连接到MySQL数据库3.3.3 执行查询操作3.3.4 处理…

Linux下编译MFEM

本文记录在Linux下编译MFEM的过程。 零、环境 操作系统Ubuntu 22.04.4 LTSVS Code1.92.1Git2.34.1GCC11.4.0CMake3.22.1Boost1.74.0oneAPI2024.2.1 一、安装依赖 二、编译代码 附录I: CMakeUserPresets.json {"version": 4,"configurePresets": [{&quo…

号卡分销系统,号卡系统,物联网卡系统源码安装教程

号卡分销系统,号卡系统,物联网卡系统,,实现的高性能(PHP协程、PHP微服务)、高灵活性、前后端分离(后台),PHP 持久化框架,助力管理系统敏捷开发,长期持续更新中。 主要特性 基于Auth验证的权限…

Java基础-集合

(创作不易,感谢有你,你的支持,就是我前行的最大动力,如果看完对你有帮助,请留下您的足迹) 目录 前言 一、Java集合框架概述 二、Collection接口及其实现 2.1 Collection接口 2.2 List接口及其实现 …

基于Python的仓库管理系统设计与实现

背景: 基于Python的仓库管理系统功能介绍 本仓库管理系统采用Python语言开发,利用Django框架和MySQL数据库,实现了高效、便捷的仓库管理功能。 用户管理: 支持员工和管理员角色的管理。 用户注册、登录和权限分配功能&#x…

机器学习(基础2)

特征工程 特征工程:就是对特征进行相关的处理 一般使用pandas来进行数据清洗和数据处理、使用sklearn来进行特征工程 特征工程是将任意数据(如文本或图像)转换为可用于机器学习的数字特征,比如:字典特征提取(特征离散化)、文本特征提取、图像特征提取。 特征工程API 实例化…

MATLAB向量元素的引用

我们定义一个向量后,如果想引用的话,可以通过索引 i n d ind ind来实现。 注意:MATLAB中向量的开始索引是1,与许多编程语言不同。 例如: 如果想引用多个的话,可以用索引 i n d ind ind来提取多个位置 例如…