Stable Diffusion公司开源大语言模型StableLM,网友:能把人逼疯!

833c2e023a92da10e981ee731d9daa7b.gif

整理 | 朱珂欣

出品 | CSDN(ID:CSDNnews)

众所周知,去年初创公司 Stability AI 发布的 AI 图像生成工具 Stable Diffusion,成为一种革命性的图像模型,也使 AI“文生图”实现了飞速的发展。

满载着大家对其“不再局限于开发图像生成”和“开源”的期待,在 4 月 20 日, Stability AI 宣布推出开源大型语言模型(LLM)—— StableLM。

fac439461497ee91111cadbf3d3cea34.png

(图源:Stability AI 官方博客截图)

1715547529538891281e8127558303b9.png

小参数大训练,开源备受热捧

据 Stability AI 官方报道,StableLM 模型还处于 Alpha 阶段,参数比较少,只有 30 亿和 70 亿个参数,之后还会推出有 150 亿到 650 亿参数的模型。作为一个类 ChatGPT 模型,StableLM 模型可以生成文本和代码,并为一系列下游应用程序提供动力,能为小而高效的模型通过适当的培训提供高性能。

然而,与 ChatGPT、Bard 等模型相比,StableLM 最大的“优势”莫过于可供每一个人下载并部署在本地,就连笔记本也可以跑起来。

正如 Stability AI 在报道中坦言的:“语言模型将成为我们数字经济的支柱,我们希望每个人都在他们的设计中拥有发言权。”

StableLM 目前已在 GitHub 开源,其高性能低消耗等特点快速吸引了一大波AI爱好者的关注,不到一天时间,星标已接近 6000 Stars。

55958db747e5497d519806f5a159eda1.png

(图源:GitHub 截图)

dd1f9120154d08d67f5136b23a8f5bac.png

写文案、编代码,还支持商业化

值得一提的是,StableLM 的发布主要得益于 Stability AI 在 EleutherAI (一个非营利性研究中心)开源早期语言模型方面的经验,其语言模型包括 GPT-J 、 GPT-NeoX 和 Pythia套件,它们基于 The Pile 开源数据集训练。

StableLM是基于一个新的实验数据集训练出来的,该数据集基于The Pile构建,但规模是原来的3倍,包含1.5万亿个标记内容。尽管其参数只有30到70亿(相比之下,GPT-3有1750亿个参数),但这个数据集的丰富性使得StableLM在对话和编码任务中表现出惊人的高性能。

Stability AI 还表示,作为概念验证,他们还使用了斯坦福大学 Alpaca程序对模型进行了微调,使用了五个最近的对话代理数据集的组合:斯坦福大学的Alpaca、Nomic-AI的gpt4all、RyokoAI 的ShareGPT52K 数据集、Databricks 实验室的 Dolly 和 Anthropic 的 HH,并把这些模型发布为 StableLM-Tuned-Alpha。

目前,在官方博客中, Stability AI 也展示了 70 亿参数微调模型在“文本对话、创作内容、编写代码”几个方面的示例:

  • 在对话方面,当提问“你会对即将高中毕业的朋友说些什么”,StableLM 回答说:“你们应该为自己的成就、工作、交友等方面感到骄傲,并对自己的未来抱以期望。”

  • 面对“写一封邮件”的任务,StableLM 也是可以依照信件的格式,清晰的罗列出相关内容。

250eed9be8e1faef40cafe84d4b468cf.png

(图源: Stability AI 官方博客截图)

  • 甚至,StableLM 还可以完成一首 rap 的歌词:

    63890e45dfa5858e27f9b3faaaf0eef7.png

(图源: Stability AI 官方博客截图)

  • 在面对“用 C 语言编写可以计算机生命意义”的问题上,StableLM 在“解答未果”后,还用幽默的口吻调侃道:“生命的实际意义会有更复杂的成分,例如社会、哲学等。”

2d076d0604b12ba93f17fcc71b7698c3.png

(图源: Stability AI 官方博客截图)

不仅如此,StableLM模型还允许商业化,但开发人员需要遵守CCBY-SA-4.0许可条款之下,自由地检查、使用和调整 StableLM 基础模型。

05f2f1db84919bbeda895fb7bab3442a.png

“大方开源”遭来非议

伴随着 StableLM 在 GitHub 上的开源,国内外网友也展开了热议,而万万没想到的是,许多网友在试用后,竟开始疯狂抨击 StableLM 的效果:

  • “我试图用它生成的所有东西,但最后我都没有采纳。”;

  • “StableLM 的‘开源’是唯一的优势了吧”;

  • “它的回答结果真的平平无奇,不是我想要的”;

  • “中文水平可以说是‘绝望’,可以把人逼疯”。

但是,也有网友帮忙解释道:

  • “毕竟 Alpha 版本的参数量目前较小”;

  • “我还是相信在不久的将来, StableLM 会进步的”;

  • “能大方开源,已经让我欣慰了”。

此外, StableLM 模型“开源”的安全性等问题也备受大家关注。

众所周知,去年在 Stable Diffusion 发布后,Stability AI 遭到了很多艺术家的投诉和起诉。因此,很多人对 StableLM 表示怀疑:“ 不知道是否还会引发诉讼”、“害怕又发生剽窃问题”……

与此同时,不少人担心有人会利用开源来撰写钓鱼链接的文案和协同软件攻击等。

对此, Stability AI 官方表示:“我们开源我们的模型,以提高透明度并促进信任。研究人员可以'深入了解'来验证性能,研究可解释性技术,识别潜在风险并帮助制定保障措施” 。 

参考链接:

https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models

https://techcrunch.com/2023/04/19/stability-ai-releases-chatgpt-like-language-models/?guccounter=1

https://news.ycombinator.com/item?id=35629127

https://github.com/Stability-AI/StableLM

9cfe0d774fa62f3c4adc10eeea87db48.gif

☞孟晚舟:华为期待通过软件开源来实现产业生态繁荣;马斯克暗示或起诉 OpenAI;Node.js 20 发布|极客头条
☞马斯克发怒,称要起诉微软:他们使用 Twitter 数据进行非法训练!
☞聚焦金融科技、汽车出行,2023 CSDN行业技术峰会(CITS)深圳站重磅开幕

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13343.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT 学术优化 (ChatGPT Academic)搭建过程(含ChatGLM cuda INT4量化环境和newbing cookie)

文章目录 1、GPT Academic2、chatGPT3、chatGLM4、newbing 1、GPT Academic 项目地址:地址 安装部分 git clone https://github.com/binary-husky/chatgpt_academic.git cd chatgpt_academicconda create -n gptac_venv python3.11 conda activate gptac_venv pyt…

OpenAI GPT3.5/GPT3 + Flask 制作自己的交互网页教程 | 附源码 和 Github链接

1. OpenAI GPT API 1.1 GPT 3.5 API (更新) 真正的 ChatGPT API, gpt-3.5-turbo,终于来了!不同于之前的 GPT3 text-davinci-003 的 api 版本。 GPT 3.5 版本生成的回答将十分的智能。 下图是现在OpenAI提供的模型。…

ChatGLM实战 - 文本信息抽取

1. ChatGLM介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存&…

【ChatGLM】本地版ChatGPT ?6G显存即可轻松使用 !ChatGLM-6B 清华开源模型本地部署教程

目录 感谢B站秋葉aaaki大佬 前言 部署资源 部署流程 实机演示 ChatGML微调(人格炼成)(个人感觉蛮有趣的地方) 分享有趣の微调人格 实机演示(潘金莲人格) 感谢B站秋葉aaaki大佬 秋葉aaaki的个人空间…

清华版Chatgpt:chatglm-6B教程——如何从训练中确定最合适的学习率

我们在使用chatglm-6B的时候,总会遇到一个问题。即学习率如何确定。我们首先先看chatglm的两个训练用sh文件的学习率是如何确定的。 一、如何第一时间确定学习率 我们可以看到在chatglm给的标准中,对于聊天的训练所默认的学习率是要小于训练广告词的&…

来自清华的ChatGPT?GLM-130B详解

原文:来自清华的ChatGPT?GLM-130B详解 - 知乎 本文会分析一下来自清华的ChatGPT,这篇论文的价值很大,为什么这么将?因为他开源了所有代码,包括模型,baseline。确实是一个不错的里程碑。 GLM-1…

一种平价的chatgpt实现方案,基于清华的 ChatGLM-6B + LoRA 进行finetune.(aigc大模型风口,校招找工作必备)

** 清华大学的chatglm-6b开源模型对话能力虽然能基本满足对话需求,但是针对专业领域和垂直领域回答显得智商捉急,这个时候就需要进行微调来提升效果,但是但是同学们显卡的显存更捉急,这时候一种新的微调方式诞生了,现在…

chatgpt相关关键字

听了一堂chatgpt的课程,真假参半,但积累了一些关键词。不知道这些关键字会在什么时候起到作用,先记录下来作为灵感积累 1 自然进化的过程,是人选择工具,也是工具选择人 2 Copliot-自动编程,感觉适用于独立新…

你会接受3.5万,但很讨厌的工作吗?网友评论亮了

大家好,我是快乐打工人小饴 周四周四,无所事事 不如来“八卦”一些轻松的话题 看看程序员们近期都在关注什么吧 你心目中Top3的公司有哪些? 网友神回复:强盛集团! 对于职场人来说,选择一家适合自己的公…

“我的人生可以分成两部分:有电脑之前和有电脑之后。”

最近,ChatGPT的出现让AI成为当下乃至未来的强大风口 而这个传奇的缔造者——山姆奥特曼(Sam Altman) 也在一夜之间成为全球最火爆的“顶流”。 “我的人生可以分成两部分:有电脑之前和有电脑之后。” 从8岁起,他就迷…

解放生产力,社媒运营人还能这样玩转ChatGPT?

相信大家这段时间都被ChatGPT刷屏了吧,东哥我也不例外!基本上一打开社媒平台都是在讨论ChatGPT,那社媒运营人应该如何使用ChatGPT呢?东哥今天就跟大家唠唠。 利用ChatGPT写广告标语、广告文案 运营人常常为广告标语、广告文案等想到头秃&…

中创AI|政治、工作、娱乐,ChatGPT正逐步影响我们的社会生产生活!

“作为政策官员,我们所做的一切,无论是编写会议记录还是批准预算文件,只是为了调动资源来解决一个常见问题。一旦我们从这个角度看待自己,ChatGPT就会成为推动者,而不是破坏者。” ——新加坡政府官员 ChatGPT可被广…

AI,正在疯狂污染中文互联网

污染中文互联网,AI成了“罪魁祸首”之一。 事情是这样的。 最近大家不是都热衷于向AI咨询嘛,有位网友就问了Bing这么一个问题: 象鼻山是否有缆车? Bing也是有问必答,给出了看似挺靠谱的答案: 在给出肯定的答…

基于Android的二维码识别系统的研究 与实现

XXXX 本科生毕业设计(论文) 学院(系): XX 专 业: XX 学 生: XX 指导教师: XX XX 完成日期 年 月 XXX本科生毕业设计(论文) 基于Android的二维码识别系统的研究 与实现 Research and Implementation of QRco…

开源布道师适兕访谈录

「 没有人会理解一个中年男人为什么会在四十岁这个压力最大的年纪,放弃稳定的技术主管生活,去坚持做“开源布道”这件看起来没有名,也没有利,甚至前路漫漫的事情。」 李建盛,1982年生,在临近35岁危机做出了…

LitCTF 2023 WriteUp(部分)

Index 前言题目Web我Flag呢? Pwn只需要nc一下~口算题卡题目分析EXP: 狠狠的溢出涅~题目分析EXP: ezlogin题目分析EXP: Reverse世界上最棒的程序员 ez_XOREXP: CryptoHex?Hex!(初级)梦想是红色的原来你也玩原神 Misc签到!(初级)Wha…

云计算、大数据、人工智能、物联网、虚拟现实技术、区块链技术(新一代信息技术)学习这一篇够了!

目录 云计算 一、云计算的基本概念 二、云计算的分类 (一) IaaS (二) SaaS (三) PaaS 三、云环境的分类、云计算的四种部署模式 (一)公有云 (二)私有云 (三)社区云 (四)混合云 四、云计算的特点 (一)虚拟化技术 (二)动态可扩展 (三)按需部署 (四)灵活性高 (五…

ChatGPT3.5使用体验

MySQL 中的索引 前言 上篇文章聊完了 MySQL 中的锁,这里接着来看下 MySQL 中的索引。 一般当我们数据库中的某些查询比较慢的时候,正常情况下,一顿分析下来,大多数我们会考虑对这个查询加个索引,那么索引是如何工作…

使用腾讯云直播开发直播功能

前言: 最近公司开发app直播功能,我是后端,使用java开发,经过考虑选择使用腾讯的云直播功能,主要是考虑到腾讯在这方面可以说是很有实力的了。然后就是选择产品的问题,腾讯提供了几种直播的解决方案&#x…

破案了,c知道就是套壳chatgpt

不过也是好事儿,国内不用魔法也可以用gpt了,比一些公司硬要自己开发二流产品强多了