2024年大型语言模型（LLMs）的发展回顾

2024年大型语言模型（LLMs）的发展回顾

news/2025/1/6 5:00:09/文章来源:https://blog.csdn.net/luwei42768/article/details/144918369

2024年对大型语言模型（LLMs）来说是充满变革的一年。以下是对过去一年中LLMs领域的关键进展和主题的总结。
在这里插入图片描述

GPT-4的壁垒被打破

去年，我们还在讨论如何构建超越GPT-4的模型。如今，已有18个组织拥有在Chatbot Arena排行榜上超越原始GPT-4的模型，共计70个模型。其中，Google的Gemini 1.5 Pro和Anthropic的Claude 3系列尤为突出，它们不仅达到了GPT-4的水平，还引入了新功能，如更长的输入上下文和视频输入能力。

LLMs价格大幅下降

得益于竞争和效率提升，运行顶级托管LLMs的成本在过去一年中大幅下降。OpenAI的最贵模型价格从GPT-3时代的100倍降低到现在的1/100。这种价格下降直接关系到运行提示所消耗的能量，对环境影响的担忧有所减轻。

多模态视觉成为常态，音频和视频开始兴起

2024年，几乎所有重要的模型供应商都发布了多模态模型。这些模型能够处理图像、音频和视频，为用户提供了新的应用方式。

语音和实时摄像头模式让科幻成为现实

语音和实时视频模式的发展尤为引人注目。GPT-4o和Google的Gemini等模型现在可以接受音频输入并输出非常逼真的语音，而不需要单独的TTS或STT模型。

提示驱动的应用生成已成为商品

LLMs在2023年已经能够生成代码，而2024年它们能够生成完整的交互式应用程序。Anthropic的Claude Artifacts和GitHub的GitHub Spark等功能允许用户直接在界面中使用生成的应用程序。

最佳模型的普遍访问仅持续了几个月

今年初，GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro等最佳模型对大多数人免费开放。然而，随着OpenAI推出ChatGPT Pro订阅服务，免费访问最佳模型的时代可能已经结束。

“代理”仍未真正实现

“代理”一词缺乏明确且广泛理解的含义。尽管如此，代理的概念仍然让人感觉“即将到来”，但基于LLMs的代理在实用性上仍存在挑战。

评估（Evals）至关重要

为LLM驱动的系统编写良好的自动化评估是构建有用应用程序的关键技能。拥有强大的评估套件可以帮助你更快地采用新模型，更好地迭代，并构建比竞争对手更可靠和有用的产品特性。

Apple Intelligence不佳，但Apple的MLX库表现出色

Apple的MLX库为在Mac上运行各种MLX兼容模型提供了极好性能。然而，Apple自己的“Apple Intelligence”功能大多令人失望。

推理扩展“推理”模型的崛起

OpenAI的o1模型是这类模型的代表，它们通过在模型内部花费“推理令牌”来思考问题，然后输出最终结果。这种模型为扩展模型性能提供了新的方式。

最佳可用LLM是否在中国以不到600万美元训练而成？

DeepSeek v3是一个拥有685B参数的大型模型，其训练成本仅为5,576,000美元，这是一个非常积极的迹象，表明训练成本可以且应该继续下降。

环境影响有所改善

模型效率的提高导致运行提示的能量使用和环境影响大幅下降。OpenAI的提示费用比GPT-3时代降低了100倍。

环境影响变得更糟

大型科技公司正在花费数十亿美元建设新数据中心，对电网和环境产生实质性影响。这种基础设施建设是否必要，还是一个未知数。

“slop”成为行业术语

“slop”一词被用来描述未经请求且未经审查的AI生成内容。这个概念已经成为讨论现代AI的简洁方式。

合成训练数据效果显著

尽管有关模型崩溃的讨论，但AI实验室越来越多地在训练中使用合成内容，以引导模型朝着正确的方向发展。

LLMs变得更加难以使用

LLMs是复杂的工具，需要深入了解和经验才能充分利用并避免陷阱。随着系统的增多，用户需要了解不同系统的工具和限制。

知识分布极不均匀

大多数人可能听说过ChatGPT，但对其他模型如Claude的了解甚少。这种知识差距对社会发展不利。

LLMs需要更好的批评

LLMs确实值得批评，我们需要讨论这些问题，找到缓解方法，并帮助人们学习如何负责任地使用这些工具。

以上是对2024年LLMs发展的总结，这一年在LLMs领域发生了很多变化，从技术进步到环境影响，再到社会接受度，LLMs正以前所未有的速度发展和影响着我们的世界。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/501206.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Servlet解析

Servlet解析

概念 Servlet是运行在服务端的小程序（Server Applet)，可以处理客户端的请求并返回响应，主要用于构建动态的Web应用，是SpringMVC的基础。生命周期加载和初始化默认在客户端第一次请求加载到容器中，通过反射实例化…

阅读更多...

图片验证码如何显示在 Apifox 的响应控制台中

图片验证码如何显示在 Apifox 的响应控制台中

当接口返回的响应数据结构非常复杂，充斥着嵌套的对象和数组，其中还可能包含着图片的 URL 时，如果要查找特定信息，你需要不断上下滚动 JSON 响应，试图找到所需的字段。这不仅让人恼火，还浪费了宝贵的时间。 …

阅读更多...

设计模式创建型单例模式（Singleton Pattern）与常见技术框架应用解析

设计模式创建型单例模式（Singleton Pattern）与常见技术框架应用解析

单例模式（Singleton Pattern）是一种创建型设计模式，旨在确保某个类在应用程序的生命周期内只有一个实例，并提供一个全局访问点来获取该实例。这种设计模式在需要控制资源访问、避免频繁创建和销毁对象的场景中尤为有用。一、核心…

阅读更多...

《Xsens动捕与人形机器人训练》讲座将于1月9日下午2:30在线上召开

《Xsens动捕与人形机器人训练》讲座将于1月9日下午2:30在线上召开

《Xsens动捕与人形机器人训练》讲座将于1月9日下午2:30在线上召开，本次讲座中来自Xsens的人形机器人与动捕技术专家Jeffrey Muller与Dennis Kloppenburg不仅将就Xsens动作捕捉系统与人形机器人行为训练中的实际应用进行详细讲解，同时还会对目前大家所关注…

阅读更多...

Flutter踩坑记-第三方SDK不兼容Gradle 8.0，需适配namespace

Flutter踩坑记-第三方SDK不兼容Gradle 8.0，需适配namespace

最近需要集成Flutter作为Module，Flutter依赖了第三方库，Gradle是8.0版本。编译报错： 解决办法是在.android根目录下的build.gradle下新增一行代码： buildscript {ext.kotlin_version "1.8.22"repositories {google()…

阅读更多...

Linux驱动开发学习准备(Linux内核源码添加到工程-Workspace)

Linux驱动开发学习准备(Linux内核源码添加到工程-Workspace)

Linux内核源码添加到VsCode工程下载Linux-4.9.88源码： 没有处理同名文件的压缩包： https://pan.baidu.com/s/1yjIBXmxG9pwP0aOhW8VAVQ?pwde9cv 已把同名文件中以大写命名的文件加上_2后缀的压缩包： https://pan.baidu.com/s/1RIRRUllYFn2…

阅读更多...

ImageNet 2.0？自动驾驶数据集迎来自动标注新时代

ImageNet 2.0？自动驾驶数据集迎来自动标注新时代

引言： 3DGS因其渲染速度快和高质量的新视角合成而备受关注。一些研究人员尝试将3DGS应用于驾驶场景的重建。然而，这些方法通常依赖于多种数据类型，如深度图、3D框和移动物体的轨迹。此外，合成图像缺乏标注也限制了其在下游任务中的…

阅读更多...

朱姆沃尔特隐身战舰：从失败到威慑

朱姆沃尔特隐身战舰：从失败到威慑

前言 "朱姆沃尔特"号驱逐舰是美国海军雄心勃勃的项目，旨在重塑未来海战。它融合了隐身、自动化和强大火力，然而由于技术问题和预算超支，原计划建造32艘的目标被大幅缩减，最终只建造了三艘。该舰的设计特点包括“穿浪逆船…

阅读更多...

电子电器框架 --- 电动汽车上的车载充电器（OBC）

电子电器框架 --- 电动汽车上的车载充电器（OBC）

我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的…

阅读更多...

【C语言的小角落】--- 深度理解取余/取模运算

【C语言的小角落】--- 深度理解取余/取模运算

Welcome to 9ilks Code World (๑•́ ₃ •̀๑) 个人主页: 9ilk (๑•́ ₃ •̀๑) 文章专栏： C语言的小角落本篇博客我们来深度理解取余/取模，以及它们在不同语言中出现不同现象的原因。 🏠 关于取整 🎵 向0取整…

阅读更多...

快速上手LangChain（三）构建检索增强生成（RAG）应用

快速上手LangChain（三）构建检索增强生成（RAG）应用

文章目录快速上手LangChain（三）构建检索增强生成（RAG）应用概述索引阿里嵌入模型 Embedding检索和生成RAG应用（demo：根据我的博客主页，分析一下我的技术栈）快速上手LangChain（三）构建检索增强生成（RAG）应用 langchain官方文档：https://python.langchain.ac.cn/do…

阅读更多...

Spring源码分析之事件机制——观察者模式（二）

Spring源码分析之事件机制——观察者模式（二）

目录获取监听器的入口方法实际检索监听器的核心方法监听器类型检查方法监听器的注册过程监听器的存储结构过程总结 Spring源码分析之事件机制——观察者模式（一）-CSDN博客 Spring源码分析之事件机制——观察者模式（二&#xff…

阅读更多...

redux react-redux @reduxjs/toolkit

redux react-redux @reduxjs/toolkit

redux团队先后推出了redux、react-redux、reduxjs/toolkit，这三个库的api各有不同。本篇文章就来梳理一下当我们需要在项目中集成redux，从直接使用redux，到使用react-redux，再到react-redux和reduxjs/toolkit配合使用，…

阅读更多...

OpenHarmony通过挂载镜像来修改镜像内容，RK3566鸿蒙开发板演示

OpenHarmony通过挂载镜像来修改镜像内容，RK3566鸿蒙开发板演示

在测试XTS时会遇到修改产品属性、SElinux权限、等一些内容，修改源码再编译很费时。今天为大家介绍一个便捷的方法，让OpenHarmony通过挂载镜像来修改镜像内容！触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器，树…

阅读更多...

网安数学基础期末复习

网安数学基础期末复习

目录整除同余同余方程群和环整除 a的显然因数/平凡因数1，a整除的传递性和组合性若 a ∣ b , b ∣ a a|b,b|a a∣b,b∣a 则 a b a\pm b ab欧几里得带余除法公因数和最大公因数在整除里的定义，最大公因数为1则两数互质，注意公因数有正…

阅读更多...

NSGA-II(非支配排序遗传算法II)详解与实现

NSGA-II(非支配排序遗传算法II)详解与实现

NSGA-II(非支配排序遗传算法II)详解与实现 1. 算法简介 NSGA-II(Non-dominated Sorting Genetic Algorithm II)是一种高效的多目标优化算法，由Deb等人在2002年提出。它主要解决多个目标之间相互冲突的优化问题。 1.1 核心特点快速非支配排序时间复杂度&#xf…

阅读更多...

Fabric环境部署

Fabric环境部署

官方下载文档：A Blockchain Platform for the Enterprise — Hyperledger Fabric Docs main documentation 1.1 创建工作目录将Fabric代码按照GO语言的推荐方式进行存放，创建目录结构并切换到该目录下。具体命令如下： mkdir -p ~/go/src/g…

阅读更多...

回归预测 | MATLAB实现CNN-SVM多输入单输出回归预测

回归预测 | MATLAB实现CNN-SVM多输入单输出回归预测

回归预测 | MATLAB实现CNN-SVM多输入单输出回归预测目录回归预测 | MATLAB实现CNN-SVM多输入单输出回归预测预测效果基本介绍模型架构程序设计参考资料预测效果基本介绍 CNN-SVM多输入单输出回归预测是一种结合卷积神经网络（CNN）和支持向量机&#…

阅读更多...

SOLIDWORKS Composer在产品设计、制造与销售中的应用

SOLIDWORKS Composer在产品设计、制造与销售中的应用

SOLIDWORKS Composer是一款专为技术团队设计的高效沟通工具，广泛应用于产品设计、制造、销售及售后等领域。它能从复杂的CAD数据中提取关键信息，轻松转化为高质量的产品文档、交互式3D动画及说明视频，显著提升产品沟通效率。 Composer擅长制…

阅读更多...

【数据结构Ⅰ复习题】

【数据结构Ⅰ复习题】

如有错误欢迎指正，题目根据教材----------严蔚敏数据结构（c语言版第2版）人民邮电电子版数据结构Ⅰ复习题一、填空题1．算法应该具备的5个重要特性有___有穷性___、确定性、可行性、输入和输出。2．非空单链表L中*p是头…

阅读更多...

最新文章

推荐文章