o1驾驶无人机后空翻,OpenAI开发者日惊掉下巴!2分钟爆改代码写App

【导读】OpenAI伦敦开发者日上,首次曝出了o1五大核心能力,还有图像理解。o1两分钟构建应用驾驶无人机、电话订餐、讲解太阳系,现场演示让所有开发者沸腾。

完整版o1的解禁,离我们不远了!

就在刚刚举办的OpenAI伦敦开发者日上,开发者体验主管Romain Huet带着o1模型来秀场了。

图片

o1 mini联动Cursor在不到2分钟时间内,搭建了一个可以交互的应用,驾驶无人机表演后空翻。

图片

现场数百名开发者, 掌声不断。

图片

还有利用RealTimeAPI,构建的实时语音AI智能体向人一样,电话卖家订购200个派。而且,o1还不忘了幽默风趣,对话情商非常高。

图片

不仅如此,有了o1构建的太阳系可视化介绍应用,想必未来的教学一定非常有趣。

图片

这还仅仅是预览版+mini版o1的功能,在演讲末,一张PPT展示了未来o1的五大能力:

函数调用、开发者message、流式传输、结构化输出、图像理解。

 o1演示炸场,台下观众欢呼不断

写代码搭App,驾驶无人机后空翻

整场最让人震撼的是,用o1 mini+Cursor搭建应用驾驶无人机飞行。

Romain Huet告诉o1,我现在有一架无人机,还缺少一个用JavaScript编写的交互界面,但是我不会如何编程。

接下来,他要求o1去构建这个应用,并设定好所有的交互按钮和组件。

并且,他向模型发送了一个样本视频,作为参考。

o1收到请求后,开始执行所有的任务。

在这过程中,为了确保应用程序搭建能够实时更新,Huet通过在UDP数据库上发送可能与用户-按钮交互相关信息,从而实现实时数据传输。

并且,这个操作也非常简单,只需要点击每个按钮,并发送更改评论,便可以在应用中得到更新。

图片

最后,我们就得到了这样的一个交互界面。

左边黑的的框框是无人机摄像头显示屏,右边就是各种交互的按钮了。

 

见证奇迹的时刻到了,Huet将无人机放置在地面上,打开终端,开始运行o1搭建的应用。

图片

只见o1驾驶的无人机演讲台上飞起,与台下的观众来了一张大合影。

图片

更惊喜的是,无人机现场还来一个360度的运镜。

图片

整个应用构建,用了不到2分钟的时间。

图片

无人机demo完整视频,如下:

AI实时语音订购派,堪比真人

另外,Huet还秀了一波用RealTimeAPI构建实现实时语音的能力。这一功能实际上在上个月已经推出。

图片

他表示,现在能够实现更长时间、更稳定的对话。

旅行应用程序Wanderlust中,Huet假设自己正计划伦敦和新加坡之旅,假设下周就要去新加坡。

他问道,你能给我提供一些游览的景点吗?

随后,在屏幕右边可视化图中,展示除了新加坡一些著名打卡点。

图片

紧接着,Huet又让他为自己推荐酒店,以及更多细节。

实时语音一边说,一边给出了结果。

图片

接下里,他又让o1在伦敦chiswell街区的当地商店订购一份pie。

图片

OpenAI开发者论坛负责人Spencer Bentley分享

Huet:我们台下有数百位开发者,他们可能喜欢吃一些甜点,你能帮我看看附近这儿可能有哪些商店?

o1:这是一些关于pie商店更多的细节。

不过,o1给出的结果中,第二个并非是真实存在的商店,只有其余两个是。

图片

为了方便演示,让现场工作人员担任卖家,Huet邀请同伴上台,一起来完成这个任务。

「在预算允许的情况下,帮我们订购200个pie,可以是肉和蔬菜的混合馅料」。

o1直接给IIan's Poah Pies打去了电话,并像人一样主动订购。

介绍太阳系,让教学更有趣

另外一个用RealTimeAPI构建太阳系导航应用程序,利用o1实时语音能力介绍星系。

从太阳系中最大的木星,到地球,再到火星深入介绍,o1全部都能娓娓道来。

OpenAI研究员表示,这一功能教会了自己:在教女儿新知识时如何成为有趣的父母。

图片

奥特曼QA环节,自曝最敬佩Cursor

没有Sam Altamn的开发者日,就不算是完整的。在整场演讲结束后,最后一个环节,就是Altamn QA问答了。

图片

在线上,奥特曼抛出了一个深刻的思考:

人们总是倾向于用历史上的技术革命来类比当前的AI革命。

但这种类比方式本身是存在问题的。比如说,互联网革命就与现在的情况有很大的不同。

也许拿晶体管来做比较会更恰当。

晶体管是物理学领域的重大发现,它具有惊人的规模化潜力,并且迅速在全球范围内得到应用和普及。

虽然晶体管技术让整个人类社会受益,但现在人们并不会把那些最早开发晶体管的公司仅仅定义为「晶体管公司」。

 「我不祈求上帝站在我这边,而是祈求自己能够站在上帝这边。在开发这些人工智能模型的过程中,我确实感觉自己是在追随光明与正义的道路。」

问:我们应该期待像o1这样的模型还是更大规模的模型?

奥特曼:希望全面提升大语言模型的性能,但这个推理思路很重要。

「不方便透露太多细节...但我预计视觉模型领域会有突破性进展。」(这似乎暗示即将推出比GPT-4更强大的视觉模型)

问:在技术整合方面会达到什么程度?基于OpenAI构建产品的AI创业公司应该如何规划?

奥特曼:建议创始人应该打造这样的公司——既能充分利用当前大语言模型的优势,又能在未来模型升级时获得更大发展空间。

问:开源的定位是什么?

奥特曼:答案表明开源确实有其存在空间,但同时也需要很好地整合专有模型。不过,这个回答似乎没有提供太多实质性内容。

问:什么是AI智能体(Agent)?

奥特曼:「一个可以接受长期任务并且在执行过程中只需少量监督的系统。」我认为Harrison Chase在Langchain的博客中给出的定义更加严谨,但从商业角度来看,这个定义很实用。

问:AI智能体能做什么?

奥特曼:它们能够完成人类因能力限制而无法完成的任务,比如同时与300家餐厅进行通话,让AI智能体在每家餐厅进行交谈并即时收集信息。

或者说,它像一位极其智慧的高级同事,你可以放心地交给他两天或一周的工作任务。

说实话,我很讨厌「agentic」这个词。不让我们一起边讨论边思考,然后创造一个新词吧!

问:在过去10年里,他的领导方式发生了哪些变化?

奥特曼:公司发展速度惊人,仅用两年时间就实现了数十亿美元的营收规模。从追求10%的提升转向追求10倍的突破,这需要进行大量的调整和改变。

问:对于Peter Thiel「要招聘30岁以下的员工」的建议,你怎么看?

奥特曼:我创立OpenAI时就已经过了30岁。团队需要不同年龄层的人才,真正重要的是要始终保持极高的人才标准。

问:你最担忧的是什么?

奥特曼:从整个行业角度来看,我们正在尝试解决的问题的系统性复杂度。

问:如果现在要创建新公司,他会选择什么方向?

奥特曼:专注于某个特定领域,比如开发AI法律顾问或AI工程师助手。

问:你觉得有什么重要信息需要让更多人知道?

奥特曼:一个能够全面了解并陪伴你生活的智能助手。

问:除了OpenAI的团队,你最敬佩谁?

奥特曼:Cursor团队——他们打造了一个极具突破性的AI应用体验。

问:如果能够实现理想中的未来,你觉得会是什么样子?

奥特曼:在接下来的5年里,我们可能会看到AI技术以难以想象的速度进步。但有趣的是,社会表面的变化可能并不会那么剧烈——真正的影响可能要在更长远的未来才会完全显现。

如下,是Sam Altman现场一部分QA视频。

参考资料:

https://x.com/tarekayed00/status/1851570058285232392

https://x.com/morqon/status/1851580985562779890

https://x.com/caromcc_/status/1851570587287601237

https://x.com/Foxalabs/status/1851574681112879535

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/461553.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

利用AWS服务轻松迁移数据上云

在数字化转型的浪潮中,越来越多的企业意识到将数据迁移至云端的重要性。云服务不仅能够提供更高的灵活性和可扩展性,还能显著降低IT成本。AWS(Amazon Web Services)作为全球领先的云服务提供商,为企业提供了一系列高效…

期货跟单、量化交易模拟演示系统

演示版可直接下载本文绑定资源。 一、跟单下单 在“排行榜”中选择要跟单的用户,合约可以跟全部,也可以指定跟该用户的某一合约操作,选定跟单的倍数(操作手数的倍数)/手数(指定手数,可以不是对…

界面控件DevExpress WPF中文教程:Data Grid——卡片视图概述

DevExpress WPF拥有120个控件和库,将帮助您交付满足甚至超出企业需求的高性能业务应用程序。通过DevExpress WPF能创建有着强大互动功能的XAML基础应用程序,这些应用程序专注于当代客户的需求和构建未来新一代支持触摸的解决方案。 无论是Office办公软件…

【数据结构二叉树】补充:C实现二叉树的层次遍历

1、层次遍历 按层次遍历二叉树的方式:按照“从上到下,从左到右”的顺序遍历二叉树,即先遍历二叉树的第一层的结点,然后是第二层的结点,直到最底层的结点,对每一层的遍历按照从左到右的次序进行。 2、层次…

供应商图纸外发:如何做到既安全又高效?

供应商跟合作伙伴、客户之间会涉及到图纸外发的场景,这是一个涉及数据安全、效率及合规性的重要环节。供应商图纸发送流程一般如下: 1.申请与审批 采购人员根据需要提出发放图纸的申请并提交审批; 采购部负责人审批发放申请,确…

MySQL 9从入门到性能优化-系统信息函数

【图书推荐】《MySQL 9从入门到性能优化(视频教学版)》-CSDN博客 《MySQL 9从入门到性能优化(视频教学版)(数据库技术丛书)》(王英英)【摘要 书评 试读】- 京东图书 (jd.com) MySQL9数据库技术_夏天又到了…

【第一个qt项目的实现和介绍以及程序分析】【正点原子】嵌入式Qt5 C++开发视频

qt项目的实现和介绍 1.第一个qt项目  (1).创建qt工程    [1].创建一个存放qt的目录    [2].新建一个qt工程    [3].编译第一个工程    发生错误时的解决方式 二.QT文件介绍  (1).工程中文件简单介绍  (2).项目文件代码流程介绍    [1].添…

推荐一款开源的免费PDF编辑工具:CubePDF Utility

CubePDF Utility是一款功能强大的开源免费PDF编辑器,它采用了基于缩略图的界面设计,为用户提供了直观且高效的PDF编辑体验。该软件特别针对那些希望以简单直观方式编辑 PDF 文件的用户而设计,支持多种操作,如合并、提取、拆分、更…

shodan7,shodan参数使用,常用端口,Google语法

参数使用 alert shodan alert -h(查看帮助文档 这个就是怎么去配置ip监控)我们能在web页面上面去做,而且更加方便,所以就不多讲了 info shodan info(查看你查询的扫描的一些次数每个账户都是每个月有限制次数的)domain shodan domain(查询域名信息…

不是她所期待的那个人

今天那,我又来写用AI小说辣。 从最初的喜欢到最后的讨厌,她对他的感觉经历了一段奇妙的变化。一开始,当她第一次看到他时,她被他的外表所吸引。他高大英俊,阳光活泼的笑容总是让她心生好感。她喜欢和他在一起的感觉&am…

智能合约分享

智能合约练习 一、solidity初学者经典示例代码: 1.存储和检索数据: // SPDX-License-Identifier: MIT pragma solidity ^0.8.0; // 声明 Solidity 编译器版本// 定义一个名为 SimpleStorage 的合约 contract SimpleStorage {// 声明一个公共状态变量 d…

硬件在环仿真建模之电路拓扑建模与数学建模

我们需要先明确一个问题,什么是电路拓扑式建模(后面简称拓扑建模)和数学建模? 电力电子系统的拓扑建模,从大类上都可以归入为物理式建模(Physics-Based Modeling),物理式建模的最大特点就是用户…

根据提交的二维数据得到mysql建表和插入数据实用工具

根据提交的二维数据得到mysql建表和插入数据实用工具,这是重构版本(之前有过)。 会通过数据的长度&#xff0c;类型&#xff0c;是否数字&#xff0c;是否唯一等做判断&#xff0c;且每千条一个插入语句以优化性能。 <?php //整理与分享&#xff1a;yujianyue<1505859…

从0开始electron+vue2搭建环境

使用环境&#xff1a;node版本16.16.0 目录 搭建vue项目安装electron打包electron 搭建vue项目 已有vue2的环境直接进项安装electron步骤 没有的请先移动到这里查看 vue2脚手架搭建项目流程 我就不另外记录了 安装electron 直接运行 vue add electron-builder安装完成后&…

Qt——QWidget

一.控件概述 Widget 是 Qt 中的核心概念. 英文原义是 "小部件"&#xff0c;我们也把它翻译为 "控件" 。 控件是构成⼀个图形化界面的基本要素。 像上述示例中的, 按钮, 列表视图, 树形视图, 单行输入框, 多行输入框, 滚动条, 下拉框等, 都可以称为 "…

最经典盲超分辨率数据集

一、背景 底层视觉的发展是否能够让我们真正地看清这个世界呢&#xff1f; 在单图超分中&#xff0c;非盲超分已经发展得较为成熟了&#xff0c;而盲超分和真实超分仍然有很多问题尚未解决。在我看来&#xff0c;盲超分只是真实超分的一个过渡&#xff0c;由于真实世界中退化…

Spring Boot 配置文件详解与最佳实践

目录 前言1. 配置文件的作用2. Spring Boot 主要配置内容2.1 Actuator 配置2.2 缓存配置2.3 核心配置2.4 数据库与数据迁移配置2.5 开发工具配置2.6 Docker Compose 配置2.7 JSON 配置2.8 安全配置 3. 多个配置文件的处理方法3.1 使用 Profile 文件区分环境3.2 结合优先级加载配…

【Stable Diffusion】

1、SD 模型 安装完SD软件后&#xff0c;必须搭配基础模型才能使用。 不同的基础模型&#xff0c;其画风和擅长的领域会有侧重。 Checkpoint大模型 大模型是 SD 的核心&#xff0c;用来控制生成图片的整个画面风格走势。 出图前要选择好合适的大模型&#xff0c;比如有些擅长…

吉林大学2023级数据结构上机实验第(1~2周)参考答案(关注我,在系统关闭后持续更新)

A 括号匹配&#xff08;进阶版&#xff09; 分数 10 编写程序检查给定字符串中包含的括号是否正确匹配&#xff0c;本题中的括号有{ }、[ ]、( )、< >四种。另外再加上一个新的约束条件&#xff1a;当有多种括号嵌套时&#xff0c;嵌套的顺序应为{ → [ → ( → <&…

【综合算法学习】(第十三篇)

目录 解数独&#xff08;hard&#xff09; 题目解析 讲解算法原理 编写代码 单词搜索&#xff08;medium&#xff09; 题目解析 解析算法原理 编写代码 解数独&#xff08;hard&#xff09; 题目解析 1.题目链接&#xff1a;. - 力扣&#xff08;LeetCode&#xff09;…