《ChatGPT开发应用指南》,Datawhale开源了!

 Datawhale发布 

开源教程:HuggingLLM,Datawhale团队

随着ChatGPT的爆火,我们相信未来会有越来越多的大模型及类似OpenAI提供的服务出现,AI 正在逐渐平民化,将来每个人都可以利用大模型轻松地做出自己的AI产品。

HuggingLLM是一个面向非算法、有一定编程基础、对AI和ChatGPT(或类似模型)感兴趣的,基于ChatGPT API开发相关应用的开源项目。当然部分内容不需要任何编程经验也可以学习,算法工程师也可能从中受益。项目主要包括ChatGPT基础科普、ChatGPT实现各种NLP常见任务(相似匹配、句词分类、编辑生成、推理等大类)、ChatGPT局限和商业应用等内容。

项目名为 HuggingLLM,因为我们相信正在经历一个伟大的时代,我们相信这是一个值得每个人全身心拥抱的时代,我们更加相信这个世界必将会因此而变得更加美好。

开源地址:

https://github.com/datawhalechina/hugging-llm

开源初心

从去年年底ChatGPT的发布以来,作为NLP(Natural Language Processing)一线从业人员已经感受到了巨大压力,我甚至觉得NLP工程师这个职位以后一定会消亡,至今这个观点依然不变。当时在见识了ChatGPT的各种逆天能力后,很自然地就会瞬间想到以后开发人员只要借助ChatGPT,完全可以做到现在大部分NLP工程师在做的事,比如文本分类、实体抽取、推理等。甚至随着LLM(Large Language Model)能力的不断提升,可能做的比NLP工程是都要好。既然这是迟早会发生的事,干脆我们就再点把火,做一个教程告诉开发人员或有一些编程能力的人去利用LLM做一些NLP任务或服务,让变革来的更猛烈些。当时发起此项目时,颇有一种悲壮感。

NLP工程师未来不一定存在(就像没有公司有Office工程师一样),但如果每个企业,尤其是中小企业都能自由地使用LLM的能力创造AI服务或应用,这不正是自己这些年的理想吗?我曾在几家小公司呆过,深刻知晓和理解小企业对AI的「情」,那种想用但又无力的矛盾。他们大多非常珍惜AI人才,但又不能大量投入。类似ChatGPT这样的LLM让他们异常兴奋。我们就是想要架起这么一座桥梁,让没有任何算法背景的开发人员能够尽量无缝、顺滑地对接起算法工作。

项目发起时,Datawhale内部马上就有小伙伴响应,我们一起讨论这个教程,大家一致觉得可以做。一方面是确实很有意义,另一方面也是市面上的教程太多了,确实有不少精品教程,但更多的是在割韭菜,割的让人有点看不下去。我依然记得玉琳同学义愤填膺,说我们要做一个开源教程,3块钱的。我们听了后大为赞同。

Datawhale的开源学习是3块:1块学习,1块分享,1块成长。

不过,我们的教程设计主要是偏API开发,基础应用那块由其他成员负责。API这块据我们当时所知,国内应该没有类似教程。其实,除了上面说的那些,我在立项时还有个想法,那就是——授人以渔。自从ChatGPT出来后,底层的技术变化不大,但上层的应用却是天翻地覆。我承认自己脑子没那么灵活,市场意识也很一般,在我看来好像很多事情可以做,但好像又没什么真正特别亮眼的。实际证明还是自己狭隘了,既然如此,那我们把方法传播给更多人,也算是对这个行业的一点贡献吧。行业蒸蒸日上,作为其中的从业人员,能得到的肯定比失去的更多,即便是这个职业未来岌岌可危。

项目就这么立起来了,当时的立项理由:

ChatGPT改变了NLP行业,甚至正在改变整个产业。我们想借这个项目将ChatGPT介绍给更多的人,尤其是对此感兴趣、想利用相关技术做一些新产品或应用的学习者,尤其是非本专业人员。希望新的技术突破能够更多地改善我们所处的世界。

教程的结构从一开始定下来基本没有调整,只有章节内部内容有一些微调,但整体最终呈现出来的就是当时设计时构思的。我们相信教程是忠于理由的,我们期望教程能为改善世界贡献一分力量。

教程内容

教程一共有七章内容,分别如下:

25f3360e981e9dbb417c86e4c4e29c10.png

学习思路

在实际学习时,上面的内容会重新组合为以下两个部分:

  • 第一部分:基础科普+局限不足+商业应用。作为「基础」的阅读材料,可以先行了解,带着这些内容学习有助于更好地构思自己的应用。

  • 第二部分:根据内容规模和难度,重新排列为:相似匹配、文本推理、生成编辑和句词分类。

当然,学习者也可以根据自己的兴趣,选择任意章节进行学习。本教程有两个基本的理念:

  • 各章节相对独立,彼此没有直接明显的前后依赖关系。这体现在内容上,也体现在设计上。学习者可以灵活选取自己感兴趣的章节学习。

  • 以「任务」为核心。我们始终强调「任务」多于「工具」,ChatGPT是目前最好的工具,但未来一定会有其他LLM出现。但只要我们理解了要做的事情,理解了系统设计,工具就能为我所用。

此外,教程还有比较详细的示例代码,大部分的代码都可以直接用于生产环境。我们也着重强调构建实际应用需要注意的细节。写代码容易,写好代码很不容易;做Demo简单,提供一个稳定可靠的服务很不简单。

所以,学习本教程要有一定编程基础或实际项目(不一定是算法)经历,它不是零基础教程(虽然有部分内容零基础也可以学习)。除此之外,你还应该能够调用OpenAI的API,并有一定的时间保证。具体可以阅读学习指南。

文章最后

洛克菲勒说过:“真正重要的不在于有多少知识,而在于如何使用现有的知识。知识只是潜在的力量,只有将其付诸应用,而且是建设性的应用,才会显示出它的威力”。由于教程围绕着任务展开,很多设计思路和细节其实可以应用在多个领域。我们再次强调,期望学习者能够多多实践,多多应用。

最后,由于创作团队精力有限,教程难免有些疏漏甚至错误,我们期望学习者在学习的同时,也能积极给我们建议,或者直接对项目进行贡献,让我们共同打磨教程,为后面的学习者提供更好的内容。

除此之外,针对本教程还有一些其他补充说明,大家可以阅读学习说明。我们期望所有学习者都能够学有所得,期待大家能做出举世瞩目的产品和应用。

参与教程学习:AIGC 组队学习来了!

ebcd38a0e59b04c7720953c71af142d7.png
一起“分享点赞就是一种支持↓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12453.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

三分钟读懂核聚变

12月5日,美国能源部宣布,在加州劳伦斯利弗莫尔国家实验室(LLNL)所设立的国家点火装置(NIF)中,首次实现了可控核聚变的“净能量增益”,一石激起千层浪,引起了全球科学界、媒体和大众的广泛关注。到底什么是核聚变?“净能量增益”意味着什么?人类真的从此进入了“无限…

人工智能轨道交通行业周刊-第32期(2023.1.30-2.5)

本期关键词:智能装车系统、南昌地铁巡检机器人、中国铁道学会科学技术奖、AIGC报告、智慧城市 1 整理涉及公众号名单 1.1 行业类 RT轨道交通中关村轨道交通产业服务平台人民铁道世界轨道交通资讯网铁路信号技术交流北京铁路轨道交通网上榜铁路视点ITS World轨道交…

本周大新闻|索尼PS VR2立项近7年;传腾讯将引进Quest 2

本周大新闻,AR方面,传立讯精密开发苹果初代AR头显,第二代低成本版将交给富士康;iOS 16.4代码曝光新的“计算设备”;EM3推出AR眼镜Stellar Pro;努比亚将在MWC2023推首款AR眼镜。 VR方面,传闻腾讯…

ChatGPT作弊成风引担忧,OpenAI:正在自研审核工具

来源:机器之心 本文约2200字,建议阅读5分钟 本文介绍了OpenAl正在自研审核工具的情况。 「对学生有负面影响」,这么大责任 OpenAI 可担不起。 语言生成模型来了,学校的作业会不会从此变得形同虚设?近日,纽约…

钉钉卷向智能化,飞书、企微能跟上么?

文|光锥智能,作者|郝鑫,编辑|刘雨琦 协同办公走到第十个年头,商业化的发条越拧越紧。 无论是钉钉、飞书还是以企业微信为代表的“腾讯办公三件套”,都在试图突破这一阶段的商业化瓶颈。 前不久…

飞书自定义机器人集成ChatGPT,含java源码开源

效果图 ChatGPT的apiKey申请略过,自己百度 第一步,你需要有公网IP 第二步,申请飞书应用,飞书开放平台,选择创建应用 appId和密钥保存一下,后面用 选择机器人,选择启用 配置请求地址,这个地址必须是公网地址,可以mock一个接口,或者将返回参数先去掉,配置请求地址要求…

假如你想环游世界旅行,没有合适的方案和路线怎么办? 来ONLYOFFICE中的chatGPT寻找答案

不知道你是否也在生活中为各种琐事而感到焦虑,是不是也想来一场说走就走的旅行,去看看山川湖泊江流大海,如果你也和我有一样的想法,ONLYOFFICE中,让chatGPT帮助你策划一场环游世界的旅行吧 ONLYOFFICE ONLYOFFICE是一…

叮叮猫 NKOJ P3722 (树状数组+容斥原理)

问题描述 【问题描述】 叮叮猫,学名蜻蜓,无脊椎动物。一般体型较大,翅膀长而窄,膜质,有清 晰的网状翅脉。 有个叮叮猫飞到了nodgd房间里,nodgd赶紧用高速照相机连拍了?张清晰 的照片&#xff0c…

单片机如何关掉蜂鸣器_【开源】蜂鸣器怎样实现类似高级冰箱上很清脆“叮叮”声......

作者:阿莫amigenius,排版整理:晓宇 微信公众号:芯片之家(ID:chiphome-dy) 阿莫上有位兄弟发帖问蜂鸣器如何产生清脆的“叮叮”的声音,帖子不小心🔥了。 很快就盖了100多层楼,大家普遍…

PHP对接钉钉群机器人

目录 一、关于钉钉机器人二、接入机器人2.1 选择一个钉钉群2.2 群设置中找到智能群助手2.3 添加机器人2.4 选择机器人类型2.5 配置机器人选项2.6 保留webhook 三、使用注意事项四、代码中接入4.1 在命令行中 使用 curl 快速进行测试4.2 PHP代码中接入 五、参考 一、关于钉钉机器…

【2022省选模拟】叮叮车——卡特兰数、数位DP

此题不提供链接 题目描述 题解 首先看这个 f ( i ) f(i) f(i),其实就是个卡特兰数: f ( i ) ( 2 i i ) i 1 f(i)\frac{{2i\choose i}}{i1} f(i)i1(i2i​)​,这是很经典的结论了。你也可以从DP入手推一下,因为最优方案必定是选…

java推送叮叮消息,叮叮叮!请及时签收入门学习Java导航路线

原标题:叮叮叮!请及时签收入门学习Java导航路线 引言 想必有很多像我一样刚学习Java会有很迷茫的人吧,今天给小伙伴们整理了一些资料,有需要的小伙伴们可以私信我,顺便推荐一个免费学习的Qqun,里面有很多免…

Html 叮叮书院

<!DOCTYPE html> <html><head><meta charset"UTF-8"><title>主页</title><style type"text/css">#menu{}#menu li{list-style-type: none;display: inline-block;width: 90px;height: 30px;line-height: 30px;p…

训练ChatGPT-漏洞1

果然&#xff0c;问这个机器人没法理解的情感关系的这个问题&#xff0c;真是谁都扛不住。

ChatGPT是智障,Scanner输入数据时,提示信息滞后输出

import java.util.Scanner;public class Test {public static void main(String[] args) {Scanner sc new Scanner(System.in);while(sc.hasNext()){System.out.println("请输入需要累加的个数");int n sc.nextInt();sc.nextLine(); // 清除输入缓冲区中的剩余内容…

全网最全ChatGpt指令,玩转ChatGpt来这里就够了!!!

全网最全ChatGpt指令&#xff0c;玩转ChatGpt来这里就够了&#xff01;&#xff01;&#xff01; 包含20多种行业场景&#xff0c;加入星球&#xff0c;与各行各业大佬共同探讨研究

打不过就加入!ChatGPT 指令学习指南:为开发者提供灵活而强大的工具

最近AI大火&#xff0c;智能化&#xff0c;集成化的出现&#xff0c;对于各行各业的冲击可谓是相当的大。看基础的文案AI可以代劳&#xff0c;简单的文章AI可以代劳&#xff0c;重复的代码AI可以代劳&#xff0c;风格迥异的绘画AI可以代劳&#xff0c;除此种种&#xff0c;用法…

三条好用的ChatGPT指令

刷视频刷到的一些好用的chatGPT指令&#xff0c;记录一下。 第一条指令适用于刚开始某个课题的时候&#xff0c;让chatGPT从一个犀利的读者角度根据你的科研问题给你提供一些反馈 Act as a critical reader. Could you provide some constructive feedback on my research que…

ChatGPT常用指令大全,带你学习ChatGPT

ChatGPT是一种自然语言处理技术&#xff0c;可以模拟人类对话并回答问题。在使用ChatGPT时&#xff0c;您需要了解一些常用的指令和命令&#xff0c;以便更好地控制ChatGPT的行为和输出。以下是常用的ChatGPT指令大全。 手机端示意图&#xff0c;名片交流探讨更多指令与学习 s…