首个中文版ChatGPT来了:大模型的中国元“Yuan”

关注并星标

从此不迷路

计算机视觉研究院

fd86c5dbb215cdad9cc59edc857d0da0.gif

0a16147dcce630772b54022fab73224c.gif

6859ddbee54c33b7a901d51d71188829.png

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

国内某公司的功能型对话大模型ChatYuan「既泛又专」,除了问答、上下文对话以及创意性写作等各类自然语言理解和生成任务之外,还能回答法律、医疗等专业领域的问答,并且写代码功能也已经在内测中,不久即将发布。特别提醒,本文中有部分文本由「ChatYuan」生成,请君细心分辨。

转自《机器之心》

ChatGPT 到底有多火?它已成为史上最快传播的应用,发布两个月后就有了 1 亿用户。实现同样的用户量,TikTok 需要近九个月,而 Instagram 用了两年多。

未来几年,微软将继续增加投资 ChatGPT 背后的公司 OpenAI 100 亿美金,而 Google 也于近日投资了另外一个同类公司 Anthropic 将近 4 亿美金,在硅谷科技圈和资本市场成为了 2023 年最令人兴奋的科技进展。微软联合创始人比尔盖茨判断,ChatGPT 的历史意义重大,不亚于 PC 或互联网诞生。

国内在这次 AI 变革的浪潮中同样反应热烈,其中就推出国内首个基于大模型的功能型对话产品 ChatYuan

cc4785e45705d11e7857d7156b85438d.jpeg

ChatYuan 产品样例

PromptCLUE 全中文任务零样本学习模型

在正式介绍元语智能的功能型对话大模型 ChatYuan 之前,我们先了解一下大规模多任务 Prompt 预训练中文开源模型——PromptCLUE,它实现了中文上的三大统一:统一模型框架、统一任务形式和统一应用方式

PromptCLUE 在千亿中文 token 上大规模预训练,累计学习 1.5 万亿中文 token,在亿级中文任务数据上完成训练,并训练数百种任务集。它具有更好的理解、生成和抽取能力,并且支持文本改写、纠错、知识图谱问答等。

PromptCLUE 支持几十个不同类型的任务,具有较好的零样本学习能力和少样本学习能力。针对理解类任务,如分类、情感分析、抽取等,可以自定义标签体系;针对生成任务,可以进行采样自由生成。

技术亮点

  1. 首个全中文任务支持的零样本学习的开源模型;

  2. 自动化高质量数据处理算法,产出海量高质量无监督和有监督数据用于训练;

  3. 基于高质量数据构建更加符合中文习惯的字典并从零训练中文大模型,模型性能效果更有保证;

  4. 融合多种训练策略训练大模型,具备在中文上强大的泛化、迁移和生成能力。

ChatYuan 功能对话开源大模型

就其功能而言,ChatYuan 可以用于问答、结合上下文做对话、做各种生成任务(包括创意性写作),也能回答一些像法律、医疗等领域问题。ChatYuan 线上服务是基于百亿参数大模型,目前已开源了 7.7 亿的参数模型,显存 6G 左右,一张民用显卡即可加载使用。后续会陆续开源更多、更大参数量的版本。

ChatYuan 基于 PromptCLUE 结合数亿条功能对话多轮对话数据进一步训练得到,它去掉了文本理解、信息抽取类任务,加强了问答、对话和各种生成式任务的学习和训练;针对多轮对话容易受到上下文的干扰,加入了抗干扰数据使得模型可以在必要时忽略无关的上下文;加入了用户反馈数据的学习,对齐人类意图,使得模型不仅具有一定的通用语言理解能力、特定任务上的生成能力,也能更好地响应用户的意图。

技术亮点

  1. 基于从零训练的全中文任务支持零样本学习模型 PromptCLUE 进一步迭代获取。

  2. 在中文领域首创了功能对话形式支持全中文任务,支持自由输入。

  3. 结合人类反馈的方法进行学习,对齐人类意图。

文本创作能力

b2df2431f08b57c51c3cb23778f3d1b9.png

上下文关联能力

该公司认为目前公司发布的大模型中还有很多可以优化的方向比如在某些场景下效果不稳定;在对齐人类意图、复杂推理和代码生成上还需要持续优化

在未来,该公司将在多个方向上持续精进,比如模型 size 上将推出千亿级别参数模型、在对齐人类意图层面实现关键突破,并且提升至少 50% 模型的覆盖场景,并且今年在国内实现行业通用人工智能的落地应用

通用人工智能(AGI)的坚定信仰者 — 中国  “Yuan”

该公司是一家致力于提供通用人工智能技术(AGI)的初创公司,坚定通用人工智能信仰,持续不断在全球范围内,为实现可靠、有效、无害的通用人工智能贡献中国力量,让人类受益。目前已经提供了支持功能型对话的开源中文大模型免费下载及 API 服务,以及基于网页、小程序的类「ChatGPT」的机器人交互产品等

该公司认为,通用人工智能(AGI)是下一代计算机基础设施,代表了人类未来主要人机交互和生活方式,并在不久的将来会使大部分行业广泛受益。

团队进展

截止目前,主要在以下方面取得了有效进展:

  • 2022 年 10 月 1 日发布 PromptCLUE1.0 模型 & API — 首个中文支持的零样本开源模型。目前全平台下载量:4.4W+,API 调用量:10w+/ 天。

  • 2022 年 11 月发布 PromptCLUE1.5 模型 & API — 支持更多任务的零样本开源模型。

  • 2022 年 12 月 20 日发布 ChatYuan— 国内首个基于百亿参数大模型的功能对话产品,支持小程序和网页。

  • 2023 年 1 月 12 日发布 ChatYuan 大模型 — 首个功能对话开源模型供免费下载,全平台已有数万下载量。

  • 2023 年 2 月 3 日发布 ChatYuan API— 可供 API 调用的功能对话模型。

国内 AGI 困境

其实包括该公司在内,国内无论是大型科技公司还是创业公司,目前都面临着各式各样的挑战,很难有像 OpenAI 的资源和人才密度。国内创业公司或许在一段时间内可以专心技术研发,但很快就会受到盈利压力的挑战,而不断调整战略方向。大型科技公司虽然看起来资源充足,但是很少能在未有落地成效的情况下,坚定信念进行长期持续投入基础设施建设。

这样看来,国内目前主要有以下多方面的问题:

e4b1a4d43f4c69c76200021df96b6766.jpeg

  • 人力、算力方面的资源瓶颈。国内行业内相对来说更缺乏耐心,在未见到明确收益前持续投入不足,资本也同时缺乏耐心。

  • 中文高质量的数据积累不足,国内开源开放的生态相对薄弱。

  • 对 AI 未来趋势的前瞻性判断不足,缺少具有坚定信仰的引领者。

  • 行业对 AGI 创业公司信心不足,对于 AGI 价值的共识不够。

未来愿景

因此,该公司作为国内第一个勇敢前行的初创公司,并坚定通用人工智能(AGI)将普惠人类的信仰,给了国内通用人工智能行业从业者非常大的信心。

同时强烈呼吁:国内从事人工智能研究的同行、长期关注科技行业的资本以及各行各业对 AGI 感兴趣的朋友,要共同有耐心、有信心的坚持下去。他山之石,可以攻玉,但我山之石将会持之以恒

© The Ending

转载请联系本公众号获得授权

6508f705a37175d1e6a3bf3235415d5c.gif

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

04d3bcc0b2833bf9e2b584e5c47680ec.jpeg

扫码关注

计算机视觉研究院

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

 往期推荐 

🔗

  • 用于吸烟行为检测的可解释特征学习框架(附论文下载)

  • 图像自适应YOLO:恶劣天气下的目标检测(附源代码)

  • 新冠状病毒自动口罩检测:方法的比较分析(附源代码)

  • NÜWA:女娲算法,多模态预训练模型,大杀四方!(附源代码下载)

  • 实用教程详解:模型部署,用DNN模块部署YOLOv5目标检测(附源代码)

  • LCCL网络:相互指导博弈来提升目标检测精度(附源代码)

  • Poly-YOLO:更快,更精确的检测(主要解决Yolov3两大问题,附源代码)

  • ResNet超强变体:京东AI新开源的计算机视觉模块!(附源代码)

  • Double-Head:重新思考检测头,提升精度(附原论文下载)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6992.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Chat GPT-4,大增长时代的开始!

虽然我们早在 2017 年就预测了超大模型的到来,因此才搞了分布式深度学习框架 OneFlow(github.com/Oneflow-Inc/oneflow/),且 2020 年的 GPT-3 也掀起了大模型热潮(OneFlow——让每一位算法工程师都有能力训练 GPT&…

大厂跟进ChatGPT,为什么百度“文心一言”成色最好?【快评】

作者 | 曾响铃 文 | 响铃说 赶ChatGPT热度,百度3月初就要发布与ChatGPT类似的人工智能聊天机器人服务“文心一言”(英文名:ERNIE Bot),似乎无法提振资本市场对百度的信心。 2022年第四季度及全年未经审计的财报发布…

GPT-3核心成员出走打造ChatGPT最强竞品!最新估值50亿美元

来源:量子位 因不满老东家成为微软附庸,11名OpenAI前员工怒而出走。 如今带着“ChatGPT最强竞品”杀回战场,新公司估值50亿美元,一出手就获得3亿美元融资。 这家公司名叫Anthropic,新推出的聊天机器人产品名叫Claude。…

用问答式聊一下最近资本火热推动的chatGPT

最近chatGPT很火,作为一名计算机科班出生的码农来说,就很有必要来聊下这个话题,因为从我专业的认知来说,我觉得chatGPT的火中带有太多的非专业情绪。虽然作为一名专业人士,但由于没有在模型和算法领域深入实践&#xf…

ChatGPT再掀AI资本狂潮,30位科技创新VC投资者齐聚“实在智能”

2023年开局,ChatGPT席卷全球。人工智能浪潮在国内外再次掀起质的高峰。一众投资者纷纷抢滩找项目。 3月,来自巴雪创投家俱乐部的近30位VC/PE和企业家齐聚杭州,前往调研国内AI准独角兽与RPA赛道头部企业杭州实在智能科技有限公司,…

chatgpt赋能python:用Python计算BIM:优点、应用和结论

用Python计算BIM:优点、应用和结论 Building Information Modeling(BIM)是一种数字化的建筑设计和施工方法,它包括从建筑物的设计、施工到维护和拆除的整个生命周期。BIM在大规模工程建设中越来越受到欢迎,Python编程…

AI绘图-StableDiffusion安装

AI绘图-StableDiffusion安装 前言:StableDiffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成(text-to-image)模型。 它主要用于根据文字的描述产生详细图像,能够在几秒钟内创作出令人惊叹的艺术作品 。StableDiffusi…

在MacAir上搭建人工智能AI画图环境

在MacAir上搭建人工智能AI画图环境 在MacAir上,可以通过开源的Stable Diffusion项目自行搭建AI画图环境,这里以Intel处理器的Mac Air为例。 Stable Diffusion项目硬件要求较高而且只提供终端命令行交互方式,所以这里使用stable-diffusion-w…

chatgpt赋能python:Python激光雷达:一种重要的监测工具

Python激光雷达:一种重要的监测工具 简介 激光雷达是一种可以通过激光测量物体距离和形状的传感器。在机器人、自动驾驶汽车、无人机和航天器等领域,激光雷达已成为必不可少的工具。 Python是一种功能强大、易于学习的编程语言,被广泛应用…

3月最新!AIGC公司生态地图;开发者实用ChatGPT工具清单;上手必会的SD绘图教程;字幕组全自动化流程大公开 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『光年之外诚邀产品经理加入』古典产品经理的复兴! 光年之外创始人王慧文在社交平台发帖,公布联合创始人团队基…

chatgpt赋能python:如何给Python安装库

如何给Python安装库 作为一名有10年Python编程经验的工程师,我知道安装Python库对于开发者来说是很重要的一步。Python是一种高级编程语言,它在许多应用程序和工具中都使用了一些简单而有用的库。在Python上安装库很简单,但如果你是新手&…

chatgpt赋能python:Python游戏开发:如何用Python开发游戏?

Python游戏开发:如何用Python开发游戏? Python是一种通用性编程语言,其优势之一就是可以用Python编写各种游戏。无论是简单的休闲游戏还是复杂的角色扮演游戏,Python都能够提供丰富的工具和库来让你实现自己的创意梦想。在本文中…

chatgpt赋能Python-python_fig

Python中的fig:简介和应用 什么是fig? fig是Python中一个高效且易用的图形库,它支持大量的图像绘制功能,包括2D图形绘制、曲线和图像处理,以及3D图形和动画绘制等应用。fig可以在多个平台上运行,包括Wind…

chatgpt赋能Python-python_cairo

介绍 Python Cairo是一款功能强大的2D图形绘制库,它支持多种输出格式,例如PNG、PDF、SVG等等,同时也支持多种平台,包括Windows、Mac OS X和Linux。不仅如此,Python Cairo在处理文字和图形时也具有出众的性能和质量&am…

chatgpt赋能Python-python_gantt

Python Gantt:更高效的项目管理工具 在当今快节奏的环境下,项目管理的重要性愈发凸显。Gantt图作为一种常见的项目计划图表工具,已经得到了广泛的应用。Python作为一种高效的编程语言,自然而然地成为了Gantt图的一种实现方式。 …

ChatGPT系统源码,全开源支持二开!

ChatGPT是开发的大语言模型之一,具备多领域知识,并且可以提供个性化、准确和有趣的答案,无论是在娱乐、教育还是工作中,都可以帮助我们解决问题、获取信息和提供建议。 技术架构 使用流行的技术栈PHP8、TypeScript、ThinkPHP6、…

Hayo AI:国内朋友的居家旅行必备良药,融入了 ChatGPT 和绘图 Stable diffusion

“ Hayo AI 在应用内直接融入了现有的热门AI大模型工具:Stable Diffusion 和 Chat GPT-4/GPT-3.5,可直接聊天、出图。” 01 — 必备良药 最近有朋友对 ChatGPT 感兴趣,但是苦于没有合适的魔法工具,注册过程又繁琐,一番…

这款国人开发的chatgpt+idea插件又迎来更新~

自从ChatGPT横空出世以来,对各行各业都产生了巨大的影响。 不过,对于程序员,目前来看ChatGPT取代还很远。 利用好ChatGPT确实可以提升效率,多出很多时间来摸鱼,再也不用加班了! 一、摸鱼神器 - NexChatGP…

ChatGPT中的强化学习:赋予AI更强大的对话能力

目录 强化学习的关键概念和算法 强化学习在GPT中的应用 总结 强化学习的关键概念和算法 马尔可夫决策过程(MDP): 马尔可夫决策过程是强化学习中常用的数学框架。它包含了状态、动作、奖励和转移概率等要素。在ChatGPT中,对话可…

ChatGPT 中的人类反馈强化学习 (RLHF) 实战

目录 1 前言2 人类反馈强化学习 (RLHF)2.1 奖励模型 (RM)2.2 近端策略优化算法 (PPO) 3 总结4 参考 团队博客: CSDN AI小组 相关阅读 ChatGPT 简介大语言模型浅探一关于 ChatGPT 必看的 10 篇论文从 ELMo 到 ChatGPT:历数 NLP 近 5 年必看大模型 1 前言 在当今数字…