开源ChatGPT要来了;软件2.0智能革命;GLM、Diffusion模型大加速

aa728efdf8fa2edb0b633aa8a68b6da3.png

1. 2023年AI十大展望:GPT-4领衔大模型变革,谷歌拉响警报,训练数据告急

新年伊始,大模型的话题热度不减。ChatGPT展现的惊人能力将大模型研究和应用热度推向高潮,人们激烈讨论着这个高级“物种”的推出意味着什么。

本文作者Rob Toews发布了2023年AI发展的十大预测,整体来看,大部分预测都离不开“大模型”这个关键词,具体分析也有其道理。当然,其中的文生图、人形机器人等领域的发展也举足轻重。2023,让我们拭目以待。

链接:

https://mp.weixin.qq.com/s/E_v7k_VlbHA8of8smlqikQ

2. 机器之心的进化 / 理解AI驱动的软件2.0智能革命

本文将带你领略一次人工智能领域波澜壮阔的发展史,从关键人物推动的学术进展、算法和理念的涌现、公司和产品的进步、还有脑科学对神经网络的迭代影响,这四个维度来深刻理解“机器之心的进化”。先忘掉那些花里胡哨的图片生产应用,我们一起来学点接近AI本质的东西。

链接:

https://mp.weixin.qq.com/s/5s1hLaXnWVPSuElkGMhXxw

3. AGI的孤勇者,传奇工程师John Carmack:惊讶看不到如我这样的人

AGI是人工智能的圣杯,这位达拉斯最著名的科技奇才对AGI的追求就好比是百年难遇的登月行动。在这场针对AGI的角逐当中,参与方还有来自科学家、学者和大型科技公司的“群体思维(groupthink)”的独立竞争,他们也在积极寻求解决方案。

去年8月,Carmack宣布,他的AGI初创公司Keen Technologies在新一轮融资中从多个知名投资者手中筹集了2000万美元。2022年12月,卡马克辞去了Meta虚拟现实部门的领导职务,全身心投入AGI研发。

链接:

https://mp.weixin.qq.com/s/MMfWc6ss8w8QgnC_-cUnwg

4. OpenAI掌门人Sam Altman的成功学

如今,已成为OpenAI CEO的Sam Altman是全球范围内当之无愧的科技领军人物。在离任YC总裁的那一年,曾与无数创业者和技术人才交流过的Sam Altman发表了一篇博客,总结了他眼中获得成功所要具备的13个特质,如果你渴求成功,或者至少希望自己变得优秀,这篇博客对你的个人成长将有所启发。如果你恰好在职业生涯早期就看过,无疑是幸运的。

链接:

https://mp.weixin.qq.com/s/AHEbDPSCUEvRrdq9zn5YmQ

5. ChatGPT,和聪明地设计Infra

作者主要有四个观点:ChatGPT并不是黑科技,是持续开放科研的产物;ChatGPT是工程、产品的胜利;ChatGPT不会让人失业,反而会带来更多的机会;Infrastructure 会是这一场仗当中的赢家,但是要聪明地设计Infra。

链接:

https://mp.weixin.qq.com/s/oM0V0MymMbanJddzABYDDQ

6. Open Assistant:LAION发起开源ChatGPT项目

ChatGPT的效果惊人,但不开源。显然开源社区有人憋不住了。LAION(代表作是赫赫有名的数据集LAION-5B)的组织者Christoph Schuhmann与Yannic Kilcher(AI圈知名的YouTube大V)一通视频电话,就启动了项目,很快项目的Discord讨论组就进了很多人,无比活跃起来。最开始项目名称是open-chat-gpt,大约一周后改为Open Assistant。

链接:

https://hub.baai.ac.cn/view/22872

7. 国内开发者发起ChatRWKV项目,做开源ChatGPT

ChatRWKV 类似于 ChatGPT,但由RWKV(100% RNN)语言模型提供支持,这是目前唯一可以在质量和缩放方面与 Transformer 相媲美的 RNN,同时速度更快并节省 VRAM。

链接:

https://zhuanlan.zhihu.com/p/603840957

8. 通向AGI之路:大型语言模型(LLM)技术精要

ChatGPT出现后惊喜或惊醒了很多人。惊喜是因为没想到大型语言模型(Large Language Model)效果能好成这样;惊醒是顿悟到我们对LLM的认知及发展理念,距离世界最先进的想法,差得有点远。作者称,作为既惊喜又惊醒的那一批,也是典型的中国人,中国人善于自我反思,于是开始反思,而这篇文章正是反思的结果。

链接:

https://mp.weixin.qq.com/s/eMrv15yOO0oYQ-o-wiuSyw

9. Jeff Dean发推:谷歌年终总结「第三弹」,大力发展Jax

随着算法和硬件越来越复杂,以及运行规模越来越大,执行日常任务所需的软件的复杂性也在不断增加。

在这篇文章中,研究人员概述了过去一年整个谷歌在ML系统方面取得的众多进展,这些进展使谷歌能够支持复杂模型的服务和训练,同时减轻了终端用户的实施复杂性。同时,这篇文章还提到了谷歌如何利用ML本身来改进和设计下一代系统堆栈的研究。

链接:

https://mp.weixin.qq.com/s/TVMYYPK_Ct_dEROzrBnZvg

10. 和TensorFlow一样,英伟达CUDA的垄断格局将被打破?

谷歌早期在机器学习模型架构、训练、模型优化方面都具有很大优势,但现在却难以充分发挥这些优势。而在硬件方面,其他 AI 硬件公司很难削弱英伟达的统治地位。直到 PyTorch 2.0 和 OpenAI Triton 出现,机器学习模型的默认软件堆栈将不再是英伟达的闭源 CUDA。

链接:

https://mp.weixin.qq.com/s/dGpf6DOyaozMwpOtp8vS-g

11. OneFlow v0.9.0正式发布

本次更新包含 640 个 commit,完整更新列表请查看链接:https://github.com/Oneflow-Inc/oneflow/releases/tag/v0.9.0,欢迎下载体验新版本,期待你的反馈。OneFlow v0.9.0 主要包括9大新增亮点功能和优化。

链接:

https://mp.weixin.qq.com/s/8Vb9fIQs0vSiM5_0M3SaGg

12. GLM国产大模型训练加速:性能最高提升3倍,显存节省1/3,低成本上手

OneFlow近期将原始的 GLM 项目移植到了使用 OneFlow 后端进行训练的 One-GLM 项目。得益于 OneFlow 和 PyTorch 无缝兼容性,我们快速且平滑地移植了 GLM,并成功跑通了预训练任务(训练 GLM-large)。

此外,由于 OneFlow 原生支持 DeepSpeed 和 Apex 的很多功能和优化技术,用户不再需要这些插件就可训练 GLM 等大模型。更重要的是,针对当前 OneFlow 移植的 GLM 模型,在简单调优后就能在性能以及显存占用上有大幅提升。

链接:

https://mp.weixin.qq.com/s/dkTGXuJV38KuLb4_LmM20Q

13. A16Z:生成式AI平台,谁主沉浮?

不像许多热门的技术趋势在市场跟上其步伐前就被过度炒作了,生成式AI的热潮却伴随着极高的市场欢迎度以及真实的市场收益。如Stable Diffusion和ChatGPT的模型们正在创造用户增长的历史记录,一些应用在发布不到一年的时间里就实现了1亿美元的年营收。

对照表明,AI模型在某些任务上的表现优于人类好几个数量级。已有足够的早期数据表明范式转移正在发生。

链接:

https://mp.weixin.qq.com/s/bh5uw06IzTCO9jQBa-rlfQ

14. 35张图,直观理解Stable Diffusion

Stable Diffusion用途多样,是一款多功能模型。首先它可以根据文本生成图像(text2img)。上图是从文本输入到图像生成的示例。除此之外,我们还可以使用Stable Diffusion来替换、更改图像(这时我们需要同时输入文本和图像)。

本文介绍了Stable Diffusion的内部结构,了解内部结构可以让我们更好地理解Stable Diffusion的组成、各组成部分的交互方式、以及各种图像生成选项/参数的含义。

链接:

https://mp.weixin.qq.com/s/8C2RqYrHZTpFFzaHIbPhRw

15. “零”代码改动,静态编译让太乙Stable Diffusion推理速度翻倍

近期,OneFlow 团队为太乙 Stable Diffusion 适配了 OneFlow 后端,大大提升了推理性能,也可以做到一秒出图。不少开发者好奇OneFlow使用了哪些优化“秘笈”,后文将进行简要解读。

链接:

https://mp.weixin.qq.com/s/XaR1W8yKPYxN5PR1RPMepA

16. “一键”模型迁移,性能翻倍,多语言AltDiffusion推理速度超快

由于目前大部分团队主要是基于翻译 API + 英文 Stable Diffusion 模型进行开发,所以在使用中文独特的叙事和表达时,英文版模型就很难给出正确匹配的图片内容,这对部分国内用户来说不太方便。

为此,智源研究院出品了首个支持 9 种语言的 AltDiffusion。近期,OneFlow 团队为其适配了 OneFlow 后端,大大提升了推理性能,也可以做到一秒出图。

链接:

https://mp.weixin.qq.com/s/whJlFifyzcCAX5DqA7hA_A

17. Runway发布视频生成器GEN-1,结果比Stable Diffusion 1.5提升73.83%,比Text2Live提升88.24%

Runway成立于2018年,是一家AI视频编辑软件提供商,主要为设计师、艺术家和开发人员提供一系列的工具和平台,产品是帮助专业人士生成各种内容。其发布的GEN-1可通过将图像或文本提示符的组成和样式应用到源视频的结构上,实际地并始终如一地合成新视频,演示效果惊人。GEN-1目前仍处于内测阶段。

链接:

https://hub.baai.ac.cn/view/23978

其他人都在看

  • ChatGPT背后的经济账

  • OneFlow v0.9.0正式发布

  • Sam Altman的成功学|升维指南

  • 比快更快,开源Stable Diffusion刷新作图速度

  • OneEmbedding:单卡训练TB级推荐模型不是梦

  • GLM训练加速:性能最高提升3倍,显存节省1/3

  • “一键”模型迁移,性能翻倍,多语言AltDiffusion推理速度超快

    欢迎Star、试用OneFlow最新版本:https://github.com/Oneflow-Inc/oneflow/icon-default.png?t=N176https://github.com/Oneflow-Inc/oneflow/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5331.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

被ChatGPT带热的最新技术岗:无需编码,年薪超200万

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年1月份热门报告合集 ChatGPT调研报告 ChatGPT团队背景研究报告 ChatGPT的发展历程、原理、技术架构及未来方向 ChatGPT使用总结:150个ChatGPT提示此模板 Ch…

AI提效工具|借助chatgpt快速读论文,快速总结、归纳、索引相似文章

目前新论文层出不穷,“快速阅读论文”成为研究者们一个必备能力。本文简单记录了近期出现的两个借助chatgpt来帮助我们快速读论文的“神器”,帮助大家快速上手应用,迅速提升论文阅读速度。 此外,本人也会定期更新记录一些类似的“…

获取全球各大证券交易所的全部股票交易信息

幻想过这样的两种能力,一是回到过去,二是预见未来。时间逆转回到过去,这更多的是在文艺作品中能够出现的情节。而预见未来,我们正在努力,希望可以更准确地预见更长时间内更多的细节。例如在瞬息万变的股票交易市场中&a…

如何使用chatGPT辅助开发复杂D3图表

如何使用chatGPT辅助开发一个复杂的D3图表 首先简单介绍一下实现的表单。 在线地址:https://2guliang.top/temperature/timeChat 引言 什么是 D3 D3 (Data-Driven Documents) 是一个基于数据驱动的 JavaScript 库,用于创建可交互的数据可视化图表。…

如何在代码开发中便捷使用 ChatGPT 协助开发

在五一节前后,抽空测试了下网上推荐的开发环境和开发插件,在这里推荐给前后端代码开发的同胞们。 方法一:IDEA 安装 插件 bito 习惯使用 IDEA 开发代码的同胞,可以尝试直接在 IDEA 中安装插件 bito,注意操作过程中需要…

ChatGPT 嵌入开发

为了提高问答「准确率」,有两个优化方向 1、增加训练集数据 2、增加提问上下文语料,答案就在其中 OpenAI 是不允许用户来训练数据的,他的 model 是固定且通用的。所以增加训练集数据并不可行。 使用chatgpt 嵌入,让chatgpt根据语料内容回答。 实际应用,产品客服、产品…

ChatGPT Plugin 开发流程图

有关如何设置、开发和部署 ChatGPT 检索插件的详细信息请参照 https://github.com/openai/chatgpt-retrieval-plugin

如何用ChatGPT使开发效率提高50%以上?

简介 ChatGPT是一个大型语言模型,由OpenAI开发。它被训练用于进行对话式交互,能够理解和生成自然语言文本。ChatGPT可以用于多种任务和场景,包括但不限于:智能助手、创意生成、语言学习、编程辅助等。ChatGPT的优势在于它的广泛知…

ChatGPT 插件系统,正式上线!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 自 ChatGPT 诞生以来,技术圈内有不少开发者基于它的功能实现了不少优秀的产品,现如今在 GitHub 上新增的 ChatGPT 项目更是多不胜数。 为了能够更加灵活的扩展 Chat…

【最新整理】一起看看86 个 ChatGPT 插件

今天我们来看看这86个插件都是做什么的? Shimmer:跟踪膳食并获得更健康生活方式的见解 World News:总结新闻头条 Bohita:用您能描述的任何图像制作服装 Portfolio Pilot:您的 AI 投资指南:投资组合评估…

ChatGPT写的C++学习路线是怎样的

ChatGPT写的C学习路线是怎样的 图片版 文字版 请为我写一条C全栈学习路线,有以下要求: 1、搜索了以下所有要求的相关资料后再做回答,注意逻辑 2、20000字以上,如果没有说完,自己继续 3、求职路线适用于刚进入职场一年…

如何利用ChatGPT-4完成一篇爆款引流文章

ChatGPT4已经来了,今天小编就带大家学习学习,如何利用ChatGPT4完成一篇爆款引流的文章;本文将详细介绍如何使用先进的人工智能语言模型ChatGPT-4来撰写一篇爆款流量文章。我们将探讨选择合适的主题、关键词和结构,以及如何运用Cha…

ChatGPT专业应用:基于关键词撰写原创文章

正文共 485 字,阅读大约需要 2 分钟 内容运营/SEO投放必备技巧,您将在2分钟后获得以下超能力: 基于关键词撰写原创文章 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐人 | Kim 编辑者 …

ChatGPT专业应用:自动撰写SEO文章

正文共 388 字,阅读大约需要 2 分钟 市场运营/SEO投放必备技巧,您将在2分钟后获得以下超能力: 快速生成SEO文章 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐人 | 菜菜子 编辑者 | 奈奈…

ChatGPT批量生成文章软件:创意无限,助力高效创作

随着人工智能技术的不断发展,ChatGPT批量生成文章软件成为了一种强大的创作工具。这款软件以其无限创意和高效助力,极大地提升了文章创作的效率。在本文中,我们将从多个方面详细阐述ChatGPT软件的特点和优势。 一、智能创作能力 ChatGPT软件…

chatgpt赋能python:Python中如何对文本进行修改

Python中如何对文本进行修改 在Python编程中,涉及到文本操作的场合并不少见。我们可能需要读取文件、解析HTML网页、处理字符串等等。而在对文本进行操作的过程中,修改文本是非常常见的需求。本文将介绍Python中对文本进行修改的几种基本方法。 1. 字符…

ChatGPT 大规模封号,并停止注册!

责编 | 王子彧 出品 | CSDN云计算(ID:CSDNcloud) 4 月 2 日,大量用会反馈 ChatGPT 账号被封,其中亚洲地区成为重灾区。据相关统计,已有数百万用户的账号受到了影响。 一时间,各种关于 ChatGPT 的…

ChatGPT告诉你:想在领英开发国外客户,可以使用哪些工具?

提问:想在领英开发国外客户,可以使用哪些工具? ChatGPT:如果你想在领英上开发国外客户,可以使用以下几种工具: 1.领英助理:领英助理是一款基于人工智能技术的工具,可以帮助用户自动…

首个开源低成本复现 ChatGPT 完整流程!1.62GB显存即可体验,单机训练提速7.73倍...

来源:机器之心 编辑:机器之心编辑部 火爆全网的 ChatGPT,仿佛开启了第四次工业革命,让微软、谷歌等全球科技巨头打得昏天黑 火爆全网的 ChatGPT,仿佛开启了第四次工业革命,让微软、谷歌等全球科技巨头打得…

AI:DeepSpeed Chat(一款帮用户训练自己模型的工具且简单/低成本/快 RLHF 训练类ChatGPT高质量大模型)的简介、安装、使用方法之详细攻略

AI:DeepSpeed Chat(一款帮用户训练自己模型的工具且简单/低成本/快 RLHF 训练类ChatGPT高质量大模型)的简介、安装、使用方法之详细攻略 目录 DeepSpeed Chat的简介 DeepSpeed-Chat的产生背景 DeepSpeed-Chat的简介 DeepSpeed-Chat的三大功能 DeepSpeed-RLHF 系…