2023.03.06-2023.03.11
News
1.OpenAI 发布了ChatGPT 和 Whisper API
OpenAI 以比预期低得多的价格发布了 ChatGPT 和 Whisper API,部分原因是为了响应开源 LLM 和竞争对手模型的进步。ChatGPT 可通过 GPT-Turbo 以每 1k 代币 0.002 美元的价格获得,比其达芬奇模型便宜 10 倍(9 月份其价格降低了 3 倍)并且与 OpenAI 较小的居里模型的定价一致(居里估计为7-100 亿个参数对比达芬奇的 1750 亿个参数)。在我们看来,这种定价使 GPT-Turbo 在许多应用程序中都可以使用和负担得起,并且只会加速生成 AI 产品和初创公司的推出。目前尚不清楚 GPT-Turbo 是如何实现比达芬奇更低的价格的——它可以作为一个较小的模型进行训练,并且可以从修剪、稀疏性和模型蒸馏等方法中获得成本效益收益。
2.谷歌大模型LLaMA遭泄露
在 Meta 上周公开发布其 650 亿参数的 LLaMA模型(仅供研究人员使用)之后,完整的模型权重迅速在 Torrent 网站上泄露。最新估计的培训成本仅为 0.5-100 万美元,我们还认为,由非营利组织或科技公司完全开源地训练和发布大小和质量与 GPT-3.5 相当的开源模型只是时间问题.增加研究人员和企业家试验这些模型的灵活性应该会加速进展——但也会带来一些问题,即如果使用不当,这些模型可能会带来什么风险。此外,谷歌还宣布了几个新模型,例如它的通用语音模型,它为 100 多种语言改进了语音人工智能,以及 Palm-E 模型,这是一种融合了 PaLM-540B 和 ViT-22B 的“具体化”多模态语言模型。该模型在跨多个领域的积极迁移方面取得的早期成功表明我们将来会听到更多关于具身多模态语言模型的信息。
3.微软将其 New Bing 带到 Windows 11 任务栏
微软今天发布了 Windows 11 的重大更新,其中包括该公司在任务栏上新推出的 AI 驱动的 Bing 搜索。除了一系列新功能,例如对小部件的改进、更好的触摸模式、屏幕录制功能以及记事本中的选项卡。
4.生成式 AI 初创公司 Anthropic 再融资 3 亿美元,其价值达到 41亿美元
今在从谷歌有限责任公司筹集数亿美元资金后不到一个月,总部位于旧金山的人工智能初创公司 Anthropic 又完成了另一轮融资,据说价值 3 亿美元。这轮融资使 Anthropic 的价值达到 41 亿美元,由 Spark Capital 领投。Anthropic 成立于 2021 年 1 月,由一组研究人员、工程师、政策专家和其他具有 AI 突破经验的人员组成,例如 GPT-3 等大型语言模型,它为 ChatGPT 提供动力。其团队还专注于从人类反馈中强化学习,使机器学习模型能够快速学习,从而根据正面或负面反馈变得更具对话性。这家初创公司专注于 AI 安全,并决心构建更可靠、更可控的系统,以提供更可预测的结果。该团队希望通过这种方式消除偏见并克服会话式 AI 的关键限制之一。
5.谷歌将人工智能模型结合,为自主机器人提供动力
谷歌公司和柏林工业大学的研究人员本周推出了一款人工智能驱动的机器人,该机器人在具有超过 5620 亿个参数的多模式体现视觉语言模型上进行训练。PaLM-E,正如该模型所称,集成了 AI 驱动的视觉和语言以实现自主机器人控制,使机器人能够根据人类语音命令执行各种任务,而无需不断进行再培训。换句话说,它是一个可以理解它被告知要做什么的机器人,然后继续并立即执行这些任务。PaLM-E 的工作原理是通过机器人的摄像头查看其周围环境,并且无需任何类型的预处理场景表示即可完成此操作。它只是简单地查看并接受它所看到的内容,然后根据这些内容计算出它需要做什么。这意味着无需人工首先对视觉数据进行注释。谷歌的研究人员表示,PaLM-E 在执行任务时还可以对环境变化做出反应。例如,如果它去拿那些米片,而其他人从机器人那里拿走了它们并将它们放在房间的桌子上,机器人会看到发生了什么,找到这些米片,再次抓住它们并把它们带给那个人谁首先要求他们。
6.Hailo 推出新的 Hailo-15 AI 视觉处理器
初创公司 Hailo Technologies Ltd. 最近推出了一系列新的人工智能处理器,即 Hailo-15 系列,该系列针对运行计算机视觉模型进行了优化。Hailo 的新 Hailo-15 芯片系列包括三个处理器:Hailo-15L、Hailo-15M 和高端 Hailo-15H。这三者都旨在为智能相机提供动力,这些相机可以在本地运行人工智能模型来分析它们记录的镜头。在本地运行 AI 模型无需将数据发送到云端进行处理,从而降低带宽成本并无需维持稳定的互联网连接。制造商可以使用 AI 驱动的智能摄像头来监控工厂车间的生产错误。反过来,公共交通提供商可以利用该技术来发现丢失的行李。Hailo 表示,其芯片还适用于一系列其他应用,包括智能城市自动化用例。
7.李沐被曝离职,投身大模型创业
亚马逊首席科学家李沐,被曝已离职创业!其创业项目,名为Boson.ai。从官网信息来看,创业内容与大模型应用有关。与其携手创业的,是李沐的导师:Alex Smola。据悉,今年 2 月,“参数服务器之父” Alex Smol 教授从亚马逊云科技(AWS)离职,创办了一家名为 Boson.ai 的人工智能公司。同月,Alex Smol 教授在领英宣布成立了新公司并担任 CEO。“我很高兴地告诉大家,我将在 Boson.ai 开始担任首席执行官兼联合创始人的新职务!” 。Alex Smol 称,公司的新目标是“scalable foundation models”(可扩展基础模型)。这被认为是,最近大火的人工智能聊天程序 ChatGPT 的挑战者。
8.何恺明被曝回归学界,面试MIT教职
MIT CSAIL实验室发布公告,3月13日下周一,何恺明将到MIT做学术演讲。此事引起AI圈广泛关注。在相关知乎问题下,MIT博士@Charles指出,何恺明参加的这个研讨会全是Job Talks(求职演讲)。求职演讲是学术界一大传统,指申请博士或教职者到校做学术报告,内容是他们自己的研究成果,通常正是在每年三四月份集中进行。并且进入这个阶段,就代表何恺明至少已经通过了简历筛选,研究成果和能力受到了MIT的认可。
9.GPT-4下周发布,剑指多模态
据德国媒体Heise消息,当地时间3月9日一场人工智能相关活动上,四名微软德国员工在现场介绍了包括GPT系列在内的大语言模型(LLM)。微软德国CTO Andreas Braun谈到了LLM的颠覆性影响,是“游戏规则的改变者”——因为他们教会机器理解自然语言,然后从统计学角度理解以往只有人类才能读懂的东西。目前这一技术,已经发展到基本上“适用于所有的语言”。巧的是,谷歌前两天也发了个5620亿超大模型PaLM-E。甚至连机器人都能用,在学术圈引发了不小的热议。微软谷歌这两家巨头的第二波之争,开始了?