今日值得关注的人工智能新动态:
-
将GPT-4用在课程设计中
-
哈佛大学“AI教授”即将上线
-
微软推出首个生成式AI技能专业证书
-
纽约州议会:伤害或羞辱他人的deepfake是非法的
-
阿诺德·施瓦辛格:《终结者》中的AI已成现实
-
AI诊断“老年痴呆”,准确率高达90%
-
Inflection AI:风投圈新晋“明星”
-
MIT:如何编写更好的图注?AI来帮你
-
花园里的AI:帮昆虫授粉
-
DragDiffusion:基于扩散模型的交互式图像编辑
-
Kosmos-2:奠定多模态大型语言模型的基础
-
香港推出首个初中AI课程
-
电话推销员很烦?AI帮你“制裁”他
-
LongMem:用长期记忆增强语言模型
-
李开复大模型创业公司名为“零一万物”
01
将GPT-4用在课程设计中
当前,关于 GPT-4 等大型语言模型在教育中的机会(如内容生成、解释)和风险(如作弊)的讨论有很多,但很少有关于这些模型在支持课程设计和高质量学习目标(LOs)撰写方面的能力的探讨。该研究评估了 GPT-4 在 AI 课程中自动生成高质量学习目标(LOs)的能力。数据显示,生成的 LOs 是合理的,且表达恰当(如以动词开头),表明 先进的生成模型有潜力帮助教师进行课程设计。
论文链接:
https://arxiv.org/abs/2306.17459
02
哈佛大学“AI教授”即将上线
自今年秋季学期起,哈佛大学将引入一个类似于 ChatGPT 的人工智能聊天机器人,作为其著名的 CS50 (计算机科学导论)课程的讲师。该课程的主讲教授 David Malan 表示,这个 AI 聊天机器人将为学生提供基于软件的工具,24 小时支持他们学习,适应学生的个人喜好和节奏。Malan 还表示,“尽管该机器人本质上与 ChatGPT 类似,但其工作原理是‘引导学生找到答案,而不是把答案交给他们’,学生应该始终具有批判性思维。”
03
首个生成式AI技能专业证书
近日,微软推出了一项新的 AI 技能计划,任何人都可以通过 LinkedIn 接受免费在线培训,学习 AI 概念和框架,从而获得生成式 AI 技能证书。该证书目前以英语提供,未来几个月将提供中文、法语和德语等版本。该课程预计将在 2025 年之前免费上线。
04
纽约州议会:伤害或羞辱他人的deepfake是非法的
纽约州议会日前通过了一些法案,其中包括一项禁止网上“深度伪造”(deepfake)图像的法案。deepfake 是指图像或视频被篡改,使其看起来好像某人在说或做他们从未说过或做过的事情。该法案将规定,创建或传播用于伤害或羞辱某人的 deepfake 是非法的。
05
阿诺德·施瓦辛格:《终结者》中的AI已成现实
日前,75 岁的阿诺德·施瓦辛格在一场活动中表示,在电影《终结者》中预言的 AI 世界已经“成为现实”。
“今天,每个人都害怕它,害怕它成为我们不愿意看到的样子,” 施瓦辛格在谈到当前 AI 现状时说道,“在《终结者》中,我们谈论机器变得具有自我意识并接管一切…现在几十年过去了,这已经成为现实。”
06
AI诊断“老年痴呆”,准确率高达90%
近日,为简化痴呆症和阿尔茨海默病的诊断,研究人员开发了一款 AI 工具 CognoSpeak 。该工具利用虚拟代理让患者参与认知测试并分析他们的语言和言语模式,从而提供快速有效的评估。CognoSpeak 可通过网络浏览器访问,允许患者在家中进行测试。初步试验表明,该工具在区分阿尔茨海默病患者和认知健康个体方面的准确率高达 90%。
07
Inflection AI:风投圈新晋“明星”
近日,Inflection AI 宣布在新一轮融资中筹集了 13 亿美元,该轮融资由微软和英伟达领投,新一轮融资使公司融资总额达到 15.25 亿美元,在 AI 领域的估值仅次于 OpenAI 。目前 Inflection AI 与合作伙伴 CoreWeave 和 NVIDIA 一起,正在构建世界上最大的人工智能集群,该集群包含 22000 个 NVIDIA H100。Inflection AI 表示,新一轮融资将继续用于人工智能集群和新产品 Pi 的开发。
08
MIT:如何编写更好的图注?AI来帮你
为了编写高质量的图注,麻省理工学院的研究人员推出了一个名为 VisText 数据集。使用该数据集,研究人员可以教会机器根据用户需求改变图注中的内容。基于数据集开发的自动系统可以为无字幕的在线图表提供更丰富的描述,提高视力障碍人士的可访问性。
09
花园里的AI:帮昆虫授粉
AI 又有了新用途——帮助昆虫完成授粉。为保护昆虫传粉媒介,艺术家 Alexandra Daisy Ginsberg 等联合开发了一种用于花园规划的 AI 算法——Pollinator Pathmaker。他们希望通过使用该算法精确选择植物品种和精心布置来最大限度地增加昆虫传粉媒介的数量,从而帮助减缓当地飞虫的数量下降。
10
DragDiffusion:基于扩散模型的交互式图像编辑
近来大火的 DragGAN 实现了一个基于点的交互式图像编辑框架,并以像素级的精度取得了令人印象深刻的编辑结果。然而,由于该方法是基于生成对抗网络(GAN),其通用性受到预先训练好的GAN模型能力的限制。来自新加坡国立大学和字节跳动的研究团队将这样一个编辑框架扩展到扩散模型,并提出了 DragDiffusion。与现有的大部分基于扩散模型的图像编辑方法不同,DragDiffusion 通过优化扩散潜变量(diffusion latent)实现了精确的空间控制,能够高效地完成高质量编辑,且具有多功能性和通用性。
论文链接:
https://arxiv.org/abs/2306.14435
11
Kosmos-2:奠定多模态大型语言模型的基础
近日,微软研究院发布了“升级版”多模态大型语言模型(MLLM)——Kosmos-2。Kosmos-2 不仅具备感知一般模态、遵循指令和执行上下文学习的功能,还能将 grounding 能力集成到下游应用中。该研究为具身 AI 的发展奠定了基础,同时也为语言、多模态感知、行动和世界建模的大融合提供了重要启示。
论文链接:
https://arxiv.org/abs/2306.14824
12
香港推出首个初中AI课程
中国香港为初中学生推出了该市首个 AI 课程,包括 ChatGPT 的使用以及该技术的道德和社会影响。当地教育局要求 450 多所公立学校将 AI 教育纳入初中一至三年级学生的信息与通信技术(ICT)科目中。
13
电话推销员很烦?AI帮你“制裁”他
美国一男子开发了一款 AI 聊天机器人,用来浪费电话推销员的时间。该男子告诉《华尔街日报》,该聊天机器人使用了预设的表达和针对特定话题的回答,并通过语音克隆器传递出来,真实到推销员以为自己在和真人交谈。
14
LongMem:用长期记忆增强语言模型
为了使大型语言模型能够记忆长期(对话)历史,来自加州大学圣塔芭芭拉分校和微软研究院的研究团队提出了一个用长期记忆增强的语言模型 LongMem。当该模型通过使用传统的大型语言模型检查输入时,会将一些输入存储在内存库中。它还将每个当前提示(prompt)的输出传递给另一个名为 SideNet 的神经网络中。结果表明,该方法在 ChapterBreak(一个具有挑战性的长文本建模基准)上优于强长文本模型,并在内存增强的 in-context 学习上比其他 LLMs 取得了显著的改进。
论文链接:
https://arxiv.org/abs/2306.07174
15
李开复大模型创业公司名为“零一万物”
李开复以 Project AI2.0 之名入局大模型的创业公司和官网今日正式亮相,公司名为“零一万物”,总部位于北京。该公司定位为打造 AI 2.0 的平台和应用,技术路线为自研大模型,三个月内已实现百亿参数规模的模型内测,目前正向 300 亿到 700 亿参数规模扩大。已加入的联创团队成员包括前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管等,记者在官网注意到,“零一万物”正面向全球招募AI人才。