国内“谁”能实现chatgpt,以及对MOSS、ChatYuan算法侧简评

★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>>

1.ChatGPT简介【核心技术、技术局限】

ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序 ,于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文 等任务。

1.1 核心竞争力

ChatGPT受到关注的重要原因是引入新技术RLHF (Reinforcement Learning with Human Feedback,即基于人类反馈的强化学习)。RLHF 解决了生成模型的一个核心问题,即如何让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。ChatGPT是AIGC(AI- Generated Content,人工智能生成内容)技术进展的成果。**该模型能够促进利用人工智能进行内容创作、提升内容生产效率与丰富度。 **

1.2 技术局限性

ChatGPT 的使用上还有局限性,模型仍有优化空间。ChatGPT模型的能力上限是由奖励模型决定,该模型需要巨量的语料来拟合真实世界,对标注员的工作量以及综合素质要求较高。ChatGPT可能会出现创造不存在的知识,或者主观猜测提问者的意图等问题,模型的优化将是一个持续的过程。若AI技术迭代不及预期,NLP模型优化受限,则相关产业发展进度会受到影响。此外,ChatGPT盈利模式尚处于探索阶段,后续商业化落地进展有待观察。

2.国内外ChatGPT发展情况

2.1 国内外ChatGPT技术布局

在这里插入图片描述
在这里插入图片描述
上述图为引用图片,如有侵权请联系。

2.2 目前已知产品

  • 文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品,将于2023年3月完成内测,面向公众开放

  • Bard是谷歌在一个大型语言模型基础上,推出的聊天机器人

  • MOSS是复旦大学自然语言处理实验室发布的对话式大型语言模型。

2023年2月20日,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,MOSS已由邱锡鹏教授团队发布,邀公众参与内测。2月21日,该平台发布公告,感谢大家的关注,同时也指出,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走

  • ChatYuan:元语智能团队

首个中文版 ChatGPT——ChatYuan 即在人工智能社区引发了广泛的讨论。如今 ChatYuan 又迎来了升级版本,支持中英双语交互、多次编辑、上下文关联交互、模拟情景设定等多种新功能。

国产自研功能对话大模型元语 ChatYuan 于 2022 年 12 月发布测试版本后,引起社会各界人士的广泛讨论,并且收到了用户的大量反馈和宝贵建议。元语智能团队已于近日对元语 ChatYuan 进行了模型效果优化和版本功能升级,现已开放内测。

3.简评ChatGPT技术路线以及目前公测产品

对于ChatGPT实现首先从要素上介绍

3.1 ChatGPT技术实现要素

简单认为以下三点比较重要:

  1. 充足的数据集(已标注)
  2. 具备大模型能力(公司、实验室)
  3. 丰富的算力机器
  4. 算法技术能力

首先针对数据集问题:
先天优势的是百度、字节跳动等公司;其次才是各大公司研究室。细化一下就是百度、字节跳动有高质量数据集(信息量足,结构化等优势)简化标注数据获取环节,有利于模型训练得到高质量模型。

其次具备大模型能力(公司、实验室)
在NLP领域AI大模型能力也是有所共见,开创新纪元。所以拥有自己的大模型是至关重要的(千亿参数量)

再者丰富的算力机器
模型训练依赖算力,没有充足AI加速卡,时不待我啊。

最后也就是具备先进的算法技术能力
这个是至关重要的,1.针对数据集其他公司可以通过爬虫方式拿到部分原生数据再加工,也算解决数据集问题吧。2.针对大模型因为目前业界开源了很多NLP各个领域的大模型任何一个人都可以获取某个领域的多任务预训练大模型。3.算力嘛,花钱可以解决,只要你足够富有。但是回归到先进的算法技术能力这里就是要出差距了,做一个“ChatGPT”外壳产品难度不大,但是要做一个真正ChatGPT难度很大。

3.2 ChatGPT技术宏观实现路径

下面从宏观实现路径进行简单讲解

3.2.1.堆砌式(封闭)模型:级别一

框架大致如下:

  • ChatGPT(智能问答)
    • 任务分类大模型分类(把问题分到到对应模型去处理)
      • 信息抽取大模型
      • 推荐系统大模型
      • 生成代码大模型
      • 智能问答大模型(单轮多轮对话)
      • 等等

主要以语义搜索推荐系统技术下给到你索引答案,只是包装了一个前端展示(对话形式)

3.2.2.堆砌式(开放)模型:级别二

  • ChatGPT(智能问答)
    • 任务分类大模型分类(把问题分到到对应模型去处理)
      • 信息抽取大模型
      • 推荐系统大模型
      • 生成代码大模型
      • 开放式智能问答大模型(单轮多轮对话)
      • 等等

引用:Datafun图片
在这里插入图片描述

开放域对话技术属于人机对话的一种。除了开放域对话,人机对话还包括面向任务的对话和问答对话。
面向任务的对话类似于订票、查天气等,这也是大家用得比较多的一种。

  • 问答就是有明确的需求,用户直接询问系统找答案。
  • 开放域对话与前面两者不同,前两者用户要么有明确的需求、要么有明确的场景。但开放域对话是在一个很开放的场景中进行拟人的对话,可以进行任意的对话。同时,要求对话系统有人设、有人格和情感。

可以简单理解为AI模型更智能,算法技术更厉害了。

3.2.3.基于RLHF的AIGC的堆砌式模型:级别三

简介:
RLHF (Reinforcement Learning with Human Feedback,即基于人类反馈的强化学习) RLHF 解决了生成模型的一个核心问题,即如何让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。
**AIGC(AI- Generated Content,人工智能生成内容)**技术进展的成果。该模型能够促进利用人工智能进行内容创作、提升内容生产效率与丰富度。

  • ChatGPT(智能问答)
    • 任务分类大模型分类(把问题分到到对应模型去处理)
    • RLHF多智能体强化学习
      • 信息抽取大模型
      • 推荐系统大模型
      • 生成代码大模型
      • 开放式智能问答大模型(单轮多轮对话)
      • 等等

讲一下级别三和级别二的区别:RLHF多智能体强化学习
级别二的各个大模型之前是独立的,级别三通过强化学习算法把各个模型耦合起来,同时模型的产出和人类的常识、认知、需求、价值观的模型。控制产出好坏也就是奖励模型决定,答案满意给出正向反馈,反之给出负分。这个设计难度也很大。

总结一下就是技术上升级了,模型更加智能输出结果更佳贴近用户。具体用户侧感受就是你可以“调教chatgpt”,产生个性化定制。当然这种和搜索推荐系统给到的个性化也是不一样的。

3.2.4.基于RLHF的AIGC的多任务完美模型模型:终极形态

  • ChatGPT(智能问答)
    • 基于RLHF强化学习的多任务完美模型模型

简单来说就是所有任务一个模型都能解决,下游任务兼容性完美! 期待一手!

3.2.5 小结

从上面四个级别可以看出,难度一次上升。个人认为openAI的chatgpt应该是第三种方案,因为终极形态相比级别三来说,难度难以想象(一个模型完成所有任务,只能说太强了)。换一个角度,我们作为用户从产品侧看是很难感知出两者区别,从目前的业界开源模型情况来看 方案三更加靠谱,落地也会更快,但技术难度还是很大的!

下面通过分析一下国内目前公测的MOSS和ChatYuan

4.对MOSS、ChatYuan给出简评

4.1 ChatYuan

它具备的功能:

  • 1.【支持多次编辑】
    第一次输入后,可以进一步提出要求,修正生成内容,快速更新所需内容。
  • 2.【支持上下文关联交互】
    支持多轮次交互,提升上下文关联理解能力,更加自然的人机交互模式。
  • 3.【模拟情景设定】
    支持模拟情景设定,如模拟对话、模拟小说背景、模拟人物性格。
  • 4.【基础代码 / 表格生成】
    初步实现生成代码功能,代码结构相对完整,部分代码逻辑持续优化中,表格生成能力初步实现。
  • 5.【支持中英文交互】
    支持中英切换交互,如输入中文可以回复英文内容
  • 6.【基础生成任务效果提升】
    内容生成效果显著提升,写公文、写故事、写论文提纲、写特定主题含关键词的诗歌等,效果较之前有比较明显的提升。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
官方开源:https://github.com/clue-ai/ChatYuan
码源:https://colab.research.google.com/drive/1lEyFhEfoc-5Z5xqpEKkZt_iMaojH1MP_?usp=sharing#scrollTo=EPcJ68xtskZC

在这个notebook中我们将使用transformers库结合GPU训练ChatYuan模型,使用的是pCLUE多任务提示学习数据集。

首先从这个开源项目中,使用的数据集是pCLUE: Large-scale Prompt-based Dataset for Multi-task and Zero-shot Learning in Chinese

pCLUE:基于提示的大规模预训练数据集,用于多任务学习和零样本学习

数据集情况:

1.单分类tnews 
2.单分类iflytek 
3.自然语言推理ocnli 
4.语义匹配afqmc 
5.指代消解-cluewsc2020 
6.关键词识别-csl 
7.阅读理解-自由式c3 
8.阅读理解-抽取式cmrc2018 
9.阅读理解-成语填空chid 数据量: 120万训练数据,73个Prompt
1. 训练集 train.json: 1,200,705
2. 验证集 dev.json: 100,000
3. 公开测试集 test_public.json: 129,556
4. 测试集 test.json: 250,461具体数据,见:./datasets
input:模型的输入
target:模型的输出
type:任务类型,阅读理解(mrc),分类(classify),生成(generate),自然语言推理(nli)
评价标准:阅读理解(em),分类(acc),生成(em),自然语言推理(acc)
answer_choices:选项(只有分类、推理类任务有)

预测任务输出情况

6300 input_string: 3号型蒸汽机车是全台铁路商务总局购入的饱合式蒸汽机车,其特征是披覆在车体上的水柜,如同马鞍般。台湾清治时期的全台铁路商务总局向英国(Hawthorn Leslie and Company),订购马鞍型水柜式机车。1889年与1893年各制造3部,总共6部。1895年甲午战争清朝战败后日本成立临时台湾铁道队来代管台湾铁路,最初将3号型全配北部线。1899年台湾总督府交通局铁道部成立后于1904年将2部机车转配彰化段。进入大正时代后又集合北部、在基隆段1部、台北段5部。1918年为了宜兰线的工程和营运而将2部机车海运至宜兰段、1920年全数转配宜兰段。随著机车逐渐老化与过时,至1926年3号机车报废。1927年在台北段2部宜兰段3部,1929年全部停止运用,1931年报废。今已无一部保存。3号-5号无另取名。
参考上述上下文,3号型蒸汽机车什么时候全部被停用?
答案: ;predict: 1929年
6400 input_string: 看购影豆原影豆是看购电影集团旗下的一个集在线购票、电影资讯、互动社区及影迷福利等服务于一体的一站式电影平台。我们致力于打造好玩的电影APP,让更多人享受电影带来的乐趣。影片资讯抢鲜看电影导读、电影解析、热映电影精彩预告片,为您提供更多精彩的电影资讯。影迷圈看有意思的内容影迷圈为您提供影迷精选内容、影迷动态,看看他们都在看什么会员享特权积分兑好礼升级会员,享受专属特权,购票更优惠。每天做任务,积分好礼随心换支付便捷看购卡购票更简单红包账户、看购卡余额、第三方支付,用户可随心组合购买影票。持有看购卡用户可直接绑卡购买,也可以使用多种支付形式组合购买影票。联系我们看购电影客服热线每天90021004006776501看购影豆热线工作日830173001057228847看购影豆APP新版开通了自助客服功能,欢迎点击我的在线客服体验小秘书服务。官方微信订阅号影豆生活官方微信服务号看购电影更新内容更新日志1.修改部分Bug
这个是关于哪方面的App应用程序的描述?
选项:银行,社区,电商,支付,经营,卡牌,借贷,驾校,理财,职考,新闻,旅游,交通,魔幻,医疗,影像,动作,工具,体育,小说,运动,相机,工具,快递,教育,股票,菜谱,行车,仙侠,亲子,购物,射击,漫画,小学,同城,成人,求职,电子,艺术,赚钱,约会,经营,兼职,视频,音乐,英语,棋牌,摄影,养生,办公,政务,视频,论坛,彩票,直播,其他,休闲,策略,通讯,买车,违章,地图,民航,电台,语言,搞笑,婚恋,超市,养车,杂志,在线,家政,影视,装修,资讯,社交,餐饮,美颜,挂号,飞行,预定,票务,笔记,买房,外卖,母婴,打车,情侣,日程,租车,博客,百科,绘画,铁路,生活,租房,酒店,保险,问答,收款,竞技,唱歌,技术,减肥,工作,团购,记账,女性,公务,二手,美妆,汽车,行程,免费,教辅,两性,出国,婚庆,民宿。
答案: ;predict: 电影资讯
6500 input_string: 你会把这个新闻推荐给关注哪方面的人:故事,文化,娱乐,体育,财经,房产,汽车,教育,科技,军事,旅游,国际,股票,农业,游戏?疫情下我国高校应届毕业生创业现状调查1500 input_string: 来到云南红河,有中国最美的山岭雕刻,还有小巴黎之称的碧色寨哪个类别最好的描述了这篇新闻?
选项:故事,文化,娱乐,体育,财经,房产,汽车,教育,科技,军事,旅游,国际,股票,农业,游戏
答案: ;predict: 旅游

从训练数据集以及处理的下游任务可以看出这是在做一个多任务学习的自然语言模型,关于生成式模型以及生成式多轮智能对话大模型基本不太沾边,我觉得是我在第三节里讲的级别一

这里也就是展现了算法技术的瓶颈,当然也不排除只是对方没开源。但从目前获取信息来看,肯定没有用到强化学习算法技术,距离真正AI还有差距。

当然第三节提到的四种方案,从用户侧来看相对比较难感受到的,毕竟国内语义搜索智能推荐等算法很发达,通过前端包装好。用户还是很难发现的,最多会觉得 “这个AI有点不太聪明呀”

4.2 MOSS

网上看了很多测评,暴露问题和chatyuan一样,就不在赘述了。

5.未来应用和期待

5.1 未来应用

结合ChatGPT的底层技术逻辑,有媒体曾列出了中短期内ChatGPT的潜在产业化方向:归纳性的文字类工作、代码开发相关工作、图像生成领域、智能客服类工作

5.2 期待

个人比较期待百度的文言一心以及字节跳动,在通用领域优势比较大,同时技术也比较前沿,百度飞桨在开源方面做的也比较好,值得期待。希望实现的是级别三的方案。

6.文心一言预告,3月16日见!

官方预告
Official Announcement

百度计划于3月16日14时在北京总部召开新闻发布会,主题围绕文心一言。

百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。

Baidu will hold a press conference on ERNIE Bot at the company’s headquarters in Beijing at 2pm March 16th, Beijing Time.

Robin Li, Co-Founder, Chairman and Chief Executive Officer and Haifeng Wang, Chief Technology Officer, will attend the press conference.


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/2069.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT推广指南,手把手教学

近期很多朋友对推广ChatGPT网站非常感兴趣,今天我就统一大家进行回复。其实非常简单,只要您会操作智能手机和电脑就可以。 网站登录流程我就不给大家赘述了,直接进入主题,全程干货仔细看 1.个人中心。点击右上角——“头像”——…

OpenAI(chatgpt)提示Account deactivated怎么办?

最近几天,有不少朋友在登陆自己的OpenAI(chatgpt)的帐号时,出现了下面的提示: Account deactivated.Please contact us through our help center at OpenAI Help Center if you nee assistance.(erroraccount_deactivated) 经过仔细分析&…

ChatGPT+低代码,将干掉40%的程序员

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 关于程序员失业有个段子:拖拽建站出来的时候,他们人说程序员会失业;低代码出来了,他们说程序员会失业;Copilot出来了,他们说程序…

国内使用Claude教程,简洁版

下面开始教程,首先你需要准备一个海外邮箱账户,gmail、苹果邮箱、outlook、hotmail都行,国内的收不到验证码不行。 1.下载slack,salck是海外版的企业沟通软件,类似于国内的企业微信和钉钉、飞书。 也可以网页直接打开…

如何评价一个新技术——以 ChatGPT 为例

开源社KAIYUANSHE 近期微信公众号订阅功能做调整啦! 没有被星标的账号在信息流里可能不显示大图了! 快星标⭐我们,就可以及时看到发布的文章啦! STEP01 点击右上角标志 STEP02 点击【设为星标】 缘起 2015 年的时候,我…

对ChatGPT的二十点看法

TJUNLP 作者 | 熊德意 编辑 | 黄宇霏 【导读】二十点看法分为五大部分:总体看法、ChatGPT技术发展、国内同类技术、ChatGPT背后大模型技术的争议、未来趋势。 一、总体看法 1. 从人工智能发展角度看,这是认知智能发展的一个重要里程碑,其意义…

对于chatGPT的评价-ChatGPT的内容生成

chatGPT的优缺点 ChatGPT是一种基于深度学习技术的自然语言处理算法,其相比传统的自然语言处理算法具有很多优势。下面是ChatGPT的优点和缺点: 优点: 可适应多种任务:ChatGPT是一个通用的自然语言处理算法,可以适应多…

chatgpt源码部署教程

chatgpt是一个基于GPT-3模型的聊天机器人项目,它能够与用户进行自然语言交互,并提供各种实用的功能。然而,对于许多开发者来说,将chatgpt源码部署到自己的服务器上并不是一件容易的事情。在本篇文章中,我们将为大家提供…

建立自己的ChatGPT:LLama私有化部署及测试

大语言模型(LLM)现在非常流行,可惜ChatGPT等都不开源。大家没法搭建一个自己的环境来感受以下。幸好Meta开源了LLama,这是LLama的介绍: https://ai.facebook.com/blog/large-language-model-llama-meta-ai/ 具体技术…

保姆级别 Vercel 部署 ChatGPT

最近ChatGPT都火出圈了,你还在用别人的服务吗? 你还在用别人的域名吗?你还在为网络感到烦恼吗?今天,这篇文章带你部署自己的ChatGPT 老规矩看看效果图 准备工作 这里用 ChatGPT项目 进行部署,Vercel 进行…

windows下免费本地部署类ChatGpt的国产ChatGLM-6B

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 Chat…

ChatGPT API调用+服务器部署【附Git地址】

文章目录 一、关键代码二、使用步骤1.获取代码2.服务器部署 总结 运行对话效果图 一、关键代码 public class Main {public static final String URL "https://api.openai.com/v1/chat/completions";// 你的 API KEYpublic static final String APT_KEY "sk…

部署ChatGPT(在VPS或免费容器上),无需科学上网!

部署ChatGPT(在VPS或免费容器上),无需科学上网! 文章目录 部署ChatGPT(在VPS或免费容器上),无需科学上网!前提方案一(VPS)方案二(免费容器) 前提 已经注册了openAI ,或者…

chatGPT:12.12 之后更新的 chatGPT 的本地部署和接口调用,解决 response 403 (无法连接openai服务器)问题

文章目录 问题源代码改动Session token 的获取cf_clearance 的获取user-agent 的获取将 config.json.sample 内容修改并移动位置附注:环境配置python > 3.7特别提示playwright & cf_clearancerevChatGPT 版本httpxOpenAIAuth删除 import 中的错误 后记 问题 …

【LangChain】如何本地部署基于chatGPT的实时文档和表格数据的助手,在自己的数据上构建chatGPT?

【LangChain】如何本地部署基于chatGPT的实时文档和表格数据的助手,在自己的数据上构建chatGPT 1 相关技术 (1)LangChain 是一个用于自然语言处理的 Python 库,它的目标是尝试简化自然语言处理任务,提高处理效率和准…

ChatGPT一键私有部署,全网可用,让访问、问答不再受限,且安全稳定!

前言 ChatGPT由于在访问上有一些限制,使用并不便利。目前国内可以直接访问的大部分是调用API返回结果,我们去使用时总会有次数限制,而且它们可能随便崩掉。 其实,目前我们访问过的大部分国内的网页包括UI,其实是套用了…

快速部署个人-ChatGPT Next Web

前提:要有梯子、谷歌账号。 目录 一、源码地址: 二、演示地址: 三、获取API密钥 四、 部署 五、重新部署 六、无梯子访问 一、源码地址: GitHub - Yidadaa/ChatGPT-Next-Web: One-Click to deploy well-designed ChatGP…

docker部署chat-web,实现自己的ChatGPT

本篇文章的前提是请确认已获得openai 的API-KEYS,即以sk-开头的keys;是否在服务器上安装了docker以及docker-compose docker以及docker-compose安装请参考我的博文:CENTOS8.0安装DOCKER&DOCKER-COMPOSE_wd520521的博客-CSDN博客 一、&a…

本周热门chatGPT之AutoGPT-AgentGPT,可以实现完全自主实现任务,附部署使用教程

AutoGPT 是一个实验性的开源应用程序,它由GPT-4驱动,但有别于ChatGPT的是,​ 这与ChatGPT的底层语言模型一致。 ​AutoGPT 的定位是将LLM的"思想"串联起来,自主地实现你设定的任何目标。 简单的说,你只用提出…

ChatGLM 本地部署搭建及测试运行

这篇简要说下清华开源项目 ChatGLM 本地部署的详细教程。清华开源项目 ChatGLM-6B 已发布开源版本,这一项目可以直接部署在本地计算机上做测试,无需联网即可体验与 AI 聊天的乐趣。 项目地址:GitHub - THUDM/ChatGLM-6B: ChatGLM-6B&#xf…