担心被ChatGPT取代?LMFlow让你打不过就加入!

d7550b4ec85fb0a3448e31c6a7137aad.gif

b941c786cdea95bca5ff1d6d0a345300.png

作为一名金融领域的 NLP 从业者,自从 ChatGPT 出来以后,整个人都是处于担心下岗的状态。未来我还能做什么?整个自然语言处理行业会不会消失?

我也想在业务中利用 ChatGPT 的优势,然而整个 ChatGPT 是黑盒的,模型规模巨大,没办法根据业务需求进行定制化的微调,所以很难集成到我现在的工作流程中。而且相关业务数据也不能直接上传到 ChatGPT。

一周之前在朋友圈看到大家转发的港科大开源大模型微调代码库 LMFlow,抱着试试看的想法去体验了一下,发现效果还不错。使用这个工具快一周了,也基于这套代码做了不少的业务场景的开发,慢慢找回了自己未来的定位。总体用起来比较得心应手的,需要修改的代码量较少。今天决定写一篇文章记录一下使用体验。

8a600cb0f8aee2448416b374e48cef16.png

模型能力初体验

我简单阅读了一下官方 github 的介绍,上面提到 LMFlow 不是一个单一模型,而是支持很多模型的微调框架。在使用项目进行开发之前,我先去体验了一下作者提供的模型。这个项目提供了几种模型体验方案:线上的 web demo、托管在 Google Colab 上的 notebook、和本地可以运行的脚本。我首先体验了一下官方的 web demo (lmflow.com):

edecfb37dc35bbf419071370b948c5fc.png

6520d89eff05855a7ac9c930cd05bc02.jpeg

整体看起来效果还是很不错的,在一些基础的对话能力上可以满足需求。而且具有一定的专业领域知识。对于金融领域的简单概念比如股票、基本面都是手到擒来。 

值得一提的是,在写这篇文章的时候看到 LMFlow 的官方 web demo 恰好刚做了一次大的版本更新。之前笨笨的模型现在一下子聪明了许多,尤其是中文能力得到了显著地改善。估计作者最近又进行了更多的模型改进和迭代。

c76141e0d765a8b0e6ebc912057538d0.png

快速个性化微调

尝试过现有模型后,接着就是根据数据做个性化微调。作为一个资深的 Colab 用户,我毫不犹豫地拿出了 Colab Pro+ 珍藏版 A100 (没错,Colab Pro+ 是有 A100 的)。看之前的推送说一张 3090 只需要 5 个小时,于是我就自己试了一些金融客服的小数据集进行微调,数据量比官方的略小一些。在 A100 的加持下,只用了一个小时就跑完了训练流程。下面是一些测试的结果。

c3942cd48974628b862beb1a4b9c90e3.png

d4f88a75b501b9955642407faaad6faa.png

训练过程中基本没有碰到困难,整个过程中主要的额外工作就是将手头的训练语料转换为官方指定的数据格式和调节脚本的参数。

9f5e6f21907e53804e603e9ea05af3d6.png

作为一个专业对数据进行处理和清洗的 NLP 算法工程师(雾),我当然手到擒来,很快就处理好喂到了训练流程里,最后脚本就会在指定目录下生成一个训好的模型。我使用的是./scripts/run_finetune_with_lora.sh 这个脚本,它只会存储压缩后的模型差异,这样最终保存下来的权重规模只有几 MB,很小也很容易存储。

32fb9f70ab68bec5ad782e8f76b4e2c2.png

易用可部署

模型训好了之后就是部署上线和进行推理。我使用的脚本会将生成的模型差异存储在 output_models/finetune_with_lora 文件夹下,运行:

./scripts/run_chatbot.sh {llama-model-path} finetune_with_lora

就可以跑起来一个测试用的聊天机器人。这里 {llama-model-path} 是 Meta 有条件提供的初始模型,需要填一个表单申请(https://forms.gle/jk851eBVbX1m5TAv5)。Meta 审批通过后就能下载拿到官方 llama 模型。需要注意的是,这个模型对商用是有限制的。不过因为 LMFlow 支持很多其他模型,很容易找到平价替代。

这个机器人也有 CPU 的推理版本,可以在没有 GPU 的机器上运行。

./scripts/run_chatbot_cpu.sh {llama-model-path} output_models/finetune_with_lora

不过会比 GPU 的版本慢将近 10 倍,一般可以正常推理的模型需要经过额外的量化 8-bit/4-bit 处理。

我在这个基础上把用户界面做得更友好了一些,方便公司里的同事使用。

4a9f07ab43a4ac400fc5599836ad885f.png

缺点

现在主要的实验平台还是 linux 环境,对于大多数 windows 用户来说不是很友好。好在我和其他使用者交流的过程中发现,还是有不少其他用户通过 wsl 成功跑通了训练和推理。另外也可以通过 Google Colab 或者官方提供的 docker 绕开这个问题。过了配环境这一关后,后续的使用体验还是很不错的。

de8a5e98b490e8afe98d5f1af3b48d50.png

结语

ChatGPT 的出现给人们带来了惊喜,也带来了颠覆。许多人开始担心自己会被所谓的科技“淘汰”,自己也许会失去工作。在这样的背景下,LMFlow 的出现给大家带来了新的可能性。与其害怕变化,不如拥抱变化,主动在 ChatGPT 的大背景下重新找到自己的定位。

在我使用 LMFlow 后,我能够很轻松地生成出自己想要的结果,省去了很多繁琐的操作,大大提高了我的效率,提升了我个人在公司的核心竞争力。

f8f068688b8a4ac7400dafcbf883e966.jpeg

更多阅读

e01c4ef2e33088a046413fc4d819fa1f.png

a0e926f8a96f4609dccfb315929605b0.png

ac369cddb63ad50ab52e94e07526ae37.png

cf6a72205c12f8ddf66ce8a4c7490c8b.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

a703602a14de87b21dee3078c748fa8d.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

bded24feb17ba9c796d8be9d3d42680a.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/36914.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

测试工程师会被ChatGPT取代吗?没有那么简单

2022年底,ChatGPT横空出世,如今已火爆全球。ChatGPT不仅在科技圈引发了地震,更是引起了全社会的广泛关注,也让很多行业的从业者产生了担忧。 ChatGPT会取代教师吗?ChatGPT会让媒体工作者失业吗?ChatGPT会改…

领导说培养我,怎么看出来他是真培养,还是PUA我?

当你的领导说要培养你的时候,如何分辨他的真实意图? 一位网友问: 领导说培养我,怎么看出来他是真培养,还是PUA? 来看看这位网友的支招: 如果领导做到以下几点,那就是真的培养你。 1.…

遇到一个满嘴骚话的HR。。。

昨天看到一个非常扯蛋离大谱刷新三观的事情,有些小伙伴可能也看过了,看完之后确实感觉有够扯的。 有程序员因为能力很强,公司非常满意,结果派了一位 HR 与其谈薪资。但是这家公司给的薪资并不能让人满意,于是这位程序…

研究生被导师嫌弃是种怎样的体验?写的太真实了...

点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 本文来源:羊村传播(ID:yangcunmedia) Q & A:研究生被导师嫌弃是种怎样的体验? 当你和你导对话时,感觉被导嫌弃了会是怎样…

学生的致谢笑死!导师:致谢别矫情,没屁在那硬编!

本文来源:鲍海飞科学网博客及网络 最近看到一则毕业论文致谢的截图,差点把我笑傻~ 全文如下: 在论文付梓之际,我要万分感谢我的指导老师——**老师。她严谨细致、一丝不苟的作风将会是我往后工作、学习中的榜样;她天使…

这回导师们颤抖了,这个网站能匿名评价其“人品”,已有大量“不良”导师被爆...

点击上方“AI遇见机器学习”,选择“星标”公众号 重磅干货,第一时间送达 来自:研究生v 研究生导师如此良莠不齐, 如何得知导师的好坏? 今天推荐给大家这个网站, 导师评价网: https://www.mysupe…

考研生对导师“嚣张发言”引热议:希望您今年招个女同学,不然我换导师

转自 | 募格学术 参考资料 | 知乎、科学网博客、微博、抖音等 最近正值考研时节,不少考生都开始了联系导师的“求学之路”。 在抖音上,有这么一则考研生对导师说的“嚣张发言”引起大家热议。不少网友都表示:这么嚣张的考生实属少见 。 据截图…

一句代码搞定 Android 底部弹框

BottomDialog BottomDialog 一个自定义的从底部弹出的dialog&#xff0c;仿照微博的分享弹框 效果图 导入 compile top.zibin:BottomDialog:1.0.1使用 BottomDialog 只需要一句代码即可轻松显示底部弹框 创建Menu <?xml version"1.0" encoding"utf-8&…

Luban压缩源码学习

1.Android图片显示遇到的问题 在Android应用中加载图片&#xff0c;是一个需要消耗内存的一个动作。也是Android开发者在项目优化中比较头疼的一个问题。 先了解下加载图片如何消耗内存的 图片质量1px所占空间&#xff08;1byte8位&#xff09;1024*1024图片大小ALPHA_8只有…

Luban(鲁班)--图片压缩使用以及源码解析

###1.Android图片显示遇到的问题 在Android应用中加载图片&#xff0c;是一个需要消耗内存的一个动作。也是Android开发者在项目优化中比较头疼的一个问题。 先了解下加载图片如何消耗内存的 图片质量1px所占空间&#xff08;1byte8位&#xff09;1024*1024图片大小ALPHA_8只…

uni-App聊天功能的源码

前言 泡泡IM uniapp版聊天源码是一套完整的基于uniapp开发的聊天软件源码&#xff0c;可编译成微信小程序、安卓 IOS APP聊天软件、H5网页聊天室。uniapp聊天源码未加密&#xff0c;无外部依赖&#xff0c;可私有化部署&#xff0c;可二次开发。文档全面&#xff0c;接口丰富&…

一款极简聊天应用,比较完整,略好看

HasChat 基于vue3socket.io的聊天应用 无偿开源&#xff01;你们的Star是我的动力&#xff01;介绍 自我做的客服聊天以来&#xff0c;让我做一套聊天应用的呼声越来越多&#xff0c;加上那套客服聊天由于没有组件化、UI设计等问题&#xff0c;也让我一直心有遗憾做的不够完美…

鹏孚隆冲刺创业板上市:计划募资约7亿元,部分收入来自海外

12月27日&#xff0c;北京易诚互动网络技术股份有限公司&#xff08;下称“易诚互动”&#xff09;在深圳证券交易所更新招股书&#xff0c;准备在创业板上市。本次冲刺上市&#xff0c;易诚互动计划募资3.13亿元&#xff0c;将用于用于数字银行应用平台升级项目、大数据智能风…

融资破局 |中英美三国多层次资本市场和STO融资的比较及借鉴

一、引言 全球金融定价权、全球金融游戏规则&#xff0c;谁来定&#xff1f;谁是跟随者呢&#xff1f; 美国资本市场经历了200多年的发展&#xff0c;形成了当今世界上最完善、最发达的多层次资本市场体系。美国证券市场主要包括主板市场、创业板市场、场外交易市场和区域性产…

GBA Capital旗下运营公司中融环球完成1亿估值天使轮融资,由广东和合领投

近日&#xff0c;Web3.0资本平台GBA Capital宣布完成旗下运营公司中融环球估值1亿人民币的天使轮融资。中融环球主要方向为Web3.0、AI领域项目孵化及产业服务&#xff0c;致力于以教育培训、项目孵化等方式实现商业与新技术创新融合&#xff0c;实现头部品牌、企业Web3.0转型&a…

大牛书单 | 消息队列方向的好书

消息队列也通常称为消息中间件&#xff0c;提到消息队列&#xff0c;大部分互联网人或多或少都听过该名词。对于后端工程师而言&#xff0c;更是日常开发中必备的一项技能。消息队列主要解决应用耦合、异步消息、流量削锋等问题&#xff0c;具有高性能、高可用、可伸缩和最终一…

C#学习推荐书单

仅供学习参考&#xff0c;请于24小时内删除。如有版权问题请联系我。 我是从只懂C语言只看这本书入门C#, 可以参考: 《叩响C#之门》 有需要可以留言哦. 链接直达: 123云盘 如果有需要&#xff0c;可以指定某本书&#xff08;只限一本&#xff09;&#xff0c;留下邮箱&…

年度推荐书单:为你精选23本商业书

在知乎上有一个问题&#xff1a;“你在哪一刻&#xff0c;感受到了知识改变命运&#xff1f;” 巴菲特曾说&#xff0c;如果自己19岁那年没有看《聪明的投资者》这本书&#xff0c;那么整个人生轨迹会截然不同。 马云也说&#xff1a;“我第一次高考失败后做临工&#xff0c;在…

算法竞赛推荐书单

前言 入坑算法竞赛已经一年半了&#xff0c;在这期间也读了不少关于算法竞赛的书&#xff0c;这些书对我的帮助还是蛮大的。平时看题解多是个人零散的题解&#xff0c;很难以系统的去学习&#xff0c;认认真真的挑选1-2本书来阅读&#xff0c;无论是从思维能力还是文字表达能力…

IC技术圈推荐书单

《IC芯片设计中的静态时序分析实践》 作者&#xff1a;J. Bhasker, Rakesh Chadha 本书深度介绍了芯片设计中用静态时序分析进行时序验证的基本知识和应用方法&#xff0c;涉及了包括互连线模型、时序计算和串扰等在内的影响纳米级电路设计的时序的重要问题&#xff0c;并详细解…