阅读时间:3-4min
更新时间:2024.9.16-2024.9.20
目录
OpenAI 推出 o1:一种新的“推理”人工智能模型
微软为 Excel 和 Word 添加了更快的 Copilot
World Labs 利用 AI 创建 3D 世界
AI 利用文本创建开放世界视频游戏
OpenAI 推出 o1:一种新的“推理”人工智能模型
概要
OpenAI 已正式发布“o1”(内部称为 Project Strawberry/Q*),这是其第一个具有先进“推理”功能的 AI 模型,现已集成到针对 Premium 和 Teams 用户的 ChatGPT 中。
详情
- o1 使用强化学习和思维链处理进行“思考”,模仿人类解决问题的方式。
- 它在博士级科学问题上的表现优于人类专家,并且在竞争性编程方面排名第 89%。
- 该模型还解决了 83% 的国际数学奥林匹克资格考试问题,而 GPT-4o 的解决率为 13%。
-
提供两个版本:o1-preview 和 o1-mini已向所有ChatGPT Premium 和 Teams 用户推出。
-
API 访问比 GPT-4o 昂贵得多,每 100 万个输入代币为 15 美元,每 100 万个输出代币为 60 美元。
-
未来计划o1-mini免费开放给用户
推荐理由
OpenAI发布了o1系列模型,在数学、代码、长程规划等问题上,取得了显著的提升。纯粹预训练阶段的Scaling Up带来的边际收益开始递减。后训练阶段的缩放法则,Post-Training Scaling Law,可能会引发我们对于算力分配、后训练能力的重新思考。模型参数只是用作记忆和存储,只有学习和搜索可以随着算力而增长。
平衡推理能力和指令跟随能力,将成为构建通用智能体和大模型发展的核心问题。
链接
https://openai.com/index/introducing-openai-o1-preview/?utm_source=www.therundown.ai&utm_medium=referral&utm_campaign=openai-shocks-the-ai-world-with-o1
微软为 Excel 和 Word 添加了更快的 Copilot
概要
微软推出了下一波 AI 助手 Copilot,引入了新功能并扩展了其与 Excel、PowerPoint、Teams、Outlook、Word 和 OneDrive 等 Microsoft 365 应用程序的集成。
详情
-
Copilot Pages:用于人工智能辅助团队合作的新协作画布,可在持久的可编辑内容上与人工智能进行实时、多用户交互。
- Copilot Agents:高级人工智能助手,可自动执行复杂的业务流程,在后台运行以自主执行任务。
- Agent Builder:用于创建自定义 Copilot 代理的无代码工具,使非技术用户更轻松地进行 AI 开发。
-
性能提升:在 GPT-4 集成的支持下,Copilot 响应速度现在提高了一倍,用户满意度提高了三倍。
推荐理由
微软正在让非技术用户比以往更轻松地将人工智能工作流程添加到他们的生产力工具套件中。这可能是数百万人第一次体验快速、智能、人工智能驱动的 Excel 表格和 Word 文档。
链接
Microsoft 365 Copilot Wave 2: Pages, Python in Excel, and agents | Microsoft 365 Blog
World Labs 利用 AI 创建 3D 世界
概要
被誉为“人工智能教母”的著名人工智能研究员李飞飞创立了World Labs,这是一家空间智能公司,开发能够理解和生成 3D 环境的人工智能模型。
详情
-
World Labs 正在开创“大世界模型”(LWM),用于感知、生成 3D 世界并与之交互,将物理和语义融入 2D 图像之外。
- 最初的应用程序侧重于为创意专业人士和普通用户创建和编辑虚拟 3D 空间。
- 该团队旨在弥合人工智能当前基于文本的理解与现实世界复杂的空间关系之间的差距。
推荐理由
目前,人工智能严重依赖人类提供的文本描述。但弄清楚空间智能并将人工智能超越LLMs和语言可能会极大地影响和加速智能 AR/VR、机器人、建筑、游戏设计等领域的发展。
链接
Hello, World Labs
AI 利用文本创建开放世界视频游戏
概要
腾讯推出了GameGen-O,能够根据文本提示生成开放世界的视频游戏内容,并允许交互式游戏模拟。
详情
-
GameGen-O 可以通过简单的文本提示创建多样化的游戏元素,例如角色、环境、动作和事件。
- 它还允许对其创建的生成的视频游戏内容进行交互式控制,以构建游戏玩家可以交互的世界。
- AI 模型在 OGameData 上进行训练,OGameData 是一个包含 4,000 多个小时的高质量视频游戏镜头的新数据集,并采用两阶段训练过程:基础预训练和指令调整。
推荐理由
这项技术将大大减少构建开放世界游戏的时间和成本,从而使较小的游戏开发团队创建出更高质量的游戏。
链接
https://x.com/_akhaliq/status/1834590455226339492
GitHub - GameGen-O/GameGen-O