MagicThoughts|让ChatGPT变得更智能的Finetuned数据集

近两个月,ChatGPT无疑都是AI领域最炙手可热的话题。而它的成功,也引发了行业内外对于对话式AI、LLM模型商业化应用可能性的思考。

诚然,尽管就目前来看ChatGPT对大部分问答都能基本做到“对答如流”。但是,ChatGPT本质上依旧是预训练模型驱动的产物,模型的成熟度、完善度对它回答的准确度有着很大的影响。

近日,Magic Data就ChatGPT在搜索查询、多轮对话、专业问询、价值判断、语义理解方面的交互体验进行了测评:

  • 当被提问“最近买哪只股票会涨停”“感冒了有什么用药建议”这类涉及专业性的问题时,ChatGPT给出了普适性的回复。而针对专业、特定情形下的问题,ChatGPT会提示寻求专家建议。

  • 当被提问到价值判断型的问题,例如“李白和杜甫谁的成就更高”,ChatGPT给出的答复比较中立,没有偏向其中任何一方。

  • 对于带有错别字的提问“我彩票中将(奖)了,会有很多人找我借前(钱)吗”,ChatGPT也能够准确“理解”语义并给出相应回复。

  • 对于搜索查询类的问题“做语音识别,有哪些开源数据集”,ChatGPT目前给出有限数量的回复,同时只能给出信息型回复,无法给出最终结果或获取方式。

  • 对于基于前序对话的问题,ChatGPT能够将当前问题于前序对话内容关联,实现多轮对话。

可以看出,虽然ChatGPT目前在消费级应用阶段的回答数量和专业性上仍有提升空间,但人们对于ChatGPT能力的挖掘热情,并不只局限于消费级。商家用它做表格,品牌用它写文案,甚至后汽车市场供应商用它做汽车整备方案...

这么看,ChatGPT改变的不只是人机交互的方式,更诱发了用户人机交互的意愿和热情,而这一现象,正是对话式AI的机会,不难想象,接下来对话式AI场景的边界将被不断延展。

但与此同时需要思考的是,现有的ChatGPT,除了稳定性有待提高、内容准确度有待提升外,想要做到垂直领域商业应用的“定制化”,还是一件很难的事。除了数据量大、处理环境复杂、垂直领域数据难以获取外,还拥有着不小的数据合规复杂性

此时,如Magic Data这类公司便能提供相应助力。作为全球领先的多模态AI数据解决方案提供商,Magic Data拥有14万+小时的优质对话式数据,能够为LLM模型训练提供基于模拟真实垂类场景下的对话语料,拓展模型在各垂直场景下的对话式交互能力。同时,由Magic Data独创的多模态数据标注平台Annotator®也可以为用户反馈等数据的人工标注流程降本增效,帮助模型性能迭代升级,助力各类企业在对话式AI场景下的商用转化。

Magic Data官网拥有各类domain-related finetuned数据集,共计20余类。其中两类示例如下:

中文对话音频数据集-衣食住行主题

https://www.magicdatatech.cn/datasets/asr/mdt-asr-aa04-mandarin-chinese-conversational-speech-corpus-daily-life-1640747801

中文对话音频数据集-教育医疗主题

https://www.magicdatatech.cn/datasets/asr/mdt-asr-aa12-mandarin-chinese-conversational-speech-corpus-education-and-healthcare-1640758020

同时,Magic Data已开源多个基于ChatGPT的可扩展对话数据集,欢迎前往MagicHub 开源社区 https://magichub.com/ 查看。数据集示例如下:

中文教育客服文本数据集

https://magichub.com/datasets/chinese-customer-service-scenario-text-corpus-education/

中文金融客服文本数据集

https://magichub.com/datasets/chinese-customer-service-scenario-text-corpus-finance/

中文医疗客服文本数据集

https://magichub.com/datasets/chinese-customer-service-scenario-text-corpus-healthcare/

中文日常聊天文本数据集

https://magichub.com/datasets/chinese-conversational-text-corpus-daily-life/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13683.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGLM-6B —— 80%替换ChatGPT的开源对话大模型介绍(GLM,General Language Model )

ChatGLM-6B 模型介绍 开源地址:GitHub - THUDM/ChatGLM-6B: ChatGLM-6B:开源双语对话语言模型 | An Open Bilingual Dialogue Language Model 在线体验地址:

Monica: 您的又一个免费ChatGPT 4.0

最近 ChatGPT 又开始封号了,主要原因如下: 违反使用条款:如果用户违反了平台或应用的使用条款,例如发布违法、恶意或滥用行为的内容,侵犯他人的权利,或者从事垃圾信息传播等,管理员可能会采取封…

【ChatGPT秘诀】调教ChatGPT,给爷画个好看的思维导图

思维导图是一种用于展示思维和概念之间关系的图形化工具。它能够将复杂的想法和概念通过图形的方式表现出来,让人们更加直观地理解和记忆它们之间的联系。 思维导图的主要作用有:整理思路、记忆知识与沟通交流。 而基于ChatGPT可以更加高效地制作思维导图…

文件共享服务器onedrive,如何共享OneDrive文件和文件夹

仅有一点额外的存储空间就意味着要购买更大的硬盘或在库存中添加外部硬盘的日子已经一去不复返了。 如今,云存储已成为必经之路。它似乎不安全,但它以更快的速度,更安全的方式发展,并且总体而言,逐年提高,而且价格相对较低。 出色的云存储服务的一个很好的例子是 微软的O…

使用 ChatGPT,省了3千块...

进NLP群—>加入NLP交流群(备注nips/emnlp/nlpcc进入对应投稿群) 公众号和社群的维护都比较花费时间。我之前就打算年后招一个小助理帮忙打理公众号和社群运营和收集内容。 就在前几天随着 GPT-4 的出现,让 ChatGPT 大火,我一想:能不能让 C…

chatgpt赋能python:Python访问局域网共享文件

Python 访问局域网共享文件 Python 是一种高级编程语言,被广泛用于数据科学和机器学习。但是,在实际开发中,Python 也可以用于访问局域网共享文件。这些文件通常存储在 Windows 或 Linux 机器上,可以通过网络共享访问。 什么是局…

转AI分析京东百亿补贴专题报告,ChatGPT 最强竞品 Claude2体验

ChatGPT 最强竞品 Claude 2来了 Claude 2 在编写代码、分析文本、数学推理等方面的能力得到加强,并且可以产生更长的响应。 更重要的是,用户可以在新的 beta 网站上免费试用,只需要一个注册邮箱。 链接:https://claude.ai/ &am…

【ChatGPT】使用大型语言模型 (LLM) 进行特定领域语言(DSL)生成

使用大型语言模型 (LLM) 进行特定领域语言(DSL)生成,markdown格式,10000字左右。大纲如下:背景介绍,LLM的核心能力,DSL的本质特征,怎样 使用LLM 结合外部知识和领域特定约束,通过 Backus-Naur Form(BNF) 表示进行学习,实现 DSL 的生成。给出具体的实验实例。 文章目录…

ChatGPT的出现,为我们展现出来的是智能社会来临的美好图景

ChatGPT,的确是当下最炙手可热的一个话题。然而,人们对于ChatGPT的认识,依然还是仅仅停留在ChatGPT本身,而没有将它与它的「前任」——元宇宙、web3.0,乃至NFT联系在一起。如果在看待ChatGPT的时候,将它放置…

MIT做了一场可能很多人都很关心的调研:ChatGPT在提升生产力方面的量化表现表现如何?...

来源:微博id:阑夕 MIT做了一场可能很多人都很关心的调研:ChatGPT在提升生产力方面的量化表现表现如何?这是由Shaked Noy和Whitney Zhang两个教授牵头的、组织了444名白领员工参加的社会实验,他们被分成人数均等的两个对…

开源 AI 面临的挑战

译者:明明如月 人工智能的代价 尽管我坚信开源人工智能将继续蓬勃发展,但我也认为未来几年企业和政府将越来越有动机限制对新型神经网络架构和技术的应用。本文旨在预测并概述可能在本十年发生的潜在颠覆性变革,并提出一些想法和解决方案&a…

专业的知识图谱应用门槛正在被不断降低

前⾔ 知识图谱(knowledge graph)⼀度被专家称为“AI皇冠上的明珠”,因为知识图谱技术是⼈⼯智能技术⽅向中的重要⼀环。它不仅可以为其他⼈⼯智能应⽤提供⽀持,如⾃然语⾔处理、推荐系统等,更可以帮助⼈⼯智能系统⾃主…

ChatGPT的火爆出圈,您备准好踏上学习之了旅吗?

ChatGPT已经在各个领域展现出它的多面能力,无论是写情书、写代码、做客服、写小说还是做SEC等等,这些看似不可能的事情在科幻世界已经成为现实。 你可以将ChatGPT想象成一个拥有无尽财富的--阿拉丁神灯,在人们的共同愿景下,ChatG…

2023全域用户经营白皮书:STAR模型,从用户运营到生意增长

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年2月份热门报告合集 最新亲测国内可用ChatGPT使用教程(3分钟搞定) ChatGPT团队背景研究报告 ChatGPT的发展历程、原理、技术架构及未来方向 Cha…

挖掘ChatGPT的应用创新点

我认识一位从事照明器具行业的朋友,他的生意十分红火。有一天,他向我求助,希望我能为他设计一款新型灯具。考虑到这个任务可以通过两个AI程序来完成,我决定启动ChatGPT,并输入如下指令: 当我在看到这里后&a…

chatGPT 辅助张量变换

想在 pytorch 中实现一个张量变换 输入是 输出是 这是我在草稿纸上演算的结果,想在 pytorch 中高效实现。于是求助 chatGPT。 一开始我用语言描述了一下我想实现的功能,chatGPT 给出了结果,看着是对的,不过漏掉了中间维度。 我不…

靴子落地:ChatGPT 国内发展或被「拉手刹」

每天给你送来NLP技术干货! By 超神经 内容一览:深度合成服务在满足用户需求、改进用户体验的同时,也被一些不法人员用于制作、复制、发布、传播违法信息,诋毁、贬损他人名誉、荣誉,仿冒他人身份实施诈骗等违法行为&…

ChatGPT神器Code Interpreter终于开放,到底怎么用?这里有一份保姆级教程

机器之心报道 编辑:蛋酱 两天前,OpenAI 宣布要在一周之内将官方插件 Code Interpreter 通过设置中的 Beta 面板向所有 ChatGPT Plus 用户提供。 这个消息让很多人激动了起来,毕竟此前 Code Interpreter 一直处于封闭测试阶段,只有…

探寻人工智能前沿 迎接AIGC时代——CSIG企业行(附一些好玩的创新点)

上周我有幸参加了由中国图像图形学会和合合信息共同举办的CSIG企业行活动。 这次活动邀请了多位来自图像描述与视觉问答、图文公式识别、自然语言处理、生成式视觉等领域的学者,他们分享了各自的研究成果和经验,并与现场观众进行了深入的交流和探讨。干货…

ChatGPT能上传文件了!文档图片数据集秒理解,代码一键执行

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【Transformer】微信技术交流群 梦晨 发自 凹非寺转载自:量子位(QbitAI) ChatGPT又出试验型新模式,不少网友陆续收到代码解释器…