关于语言模型私有化部署的讨论 | AIGC实践

上周在与TC同行关于AIGC实践的线上交流中,大家普遍比较关心的一个实践切入点是:语言模型的私有化部署——简单来说,就是在企业内部,部署一个属于自己的“ChatGPT”,对于本行业/专业知识,以及企业独有的产品和技术信息有充分的了解,并且提供用户接口,通过自然语言交流,解答内外部用户的问题。

其实,在此前/此后的多次单点交流中,也有不同行业的朋友向我咨询相同问题。可见,任何人在体验过ChatGPT超强的语言能力后,都不难意识到,这种交互方式必将会成为未来非常重要的应用场景。

这段时间,我花了不少时间做调研;并且,由于我司主营AI计算设备及软件,也刚好具备相关技术背景,于是便近水楼台地与研发Lead和产品经理分别进行交流,看看是否有机会率先实施并落地一个内部应用。

在此梳理一下相关脉络,做一个简单的分享,希望可以给到有相同问题的朋友一点启发。

8d996e2a32a905c8bcfaf2af35286388.png

主题图Prompt:Privatization Deployment of Large Language Models. technological style. --ar 16:9

基本分析

语言模型私有化部署的应用场景,可谓显而易见。

典型场景包括:

  • 内部知识库:提供企业内部的知识共享平台。

  • 智能客服机器人:提供获取产品/技术信息的用户接口。

  • 专家咨询机器人:提供医疗、律师等专业领域的咨询服务。

应用范围非常广泛,几乎可以涵盖所有专业咨询行业,以及所有对外输出产品和服务的企业。应用价值就更不必说了:

  • 技术革新,全面推进AI化进程。所谓的“第四次工业革命”,具有划时代意义;

  • 降本增效。既然AI可以又快又好地完成任务,自然也就不需要付出人工成本。

实现部署的相关资源包括:

  • 硬件:LLM对算力有比较高的要求。

  • 模型:可采用免费的开源模型。

  • 语料库:包括但不限于行业/专业信息;以及企业的产品/技术信息。

  • 算法:需要比较专业的算法工程师参与进行模型训练/微调。

研发观点

从研发的角度来看,实现语言模型私有化部署,还是非常有希望的。

实现语言模型私有化部署的系统架构,主要包括:

  • LLM:语言模型;

  • KB:知识库;

  • 框架:将LLM和KB建立联系;

  • UI:用户界面。

677a2d839091c71adb4bbfc2b880c697.png

其中,LLM可采用2种方式实现:

  • 使用公共模型:通过调用API接口使用OpenAI GPT-3.5

  • 使用开源模型:使用开源模型ChatGLM,但开源不能商用。参考:
    https://github.com/imClumsyPanda/langchain-ChatGLM

部署逻辑分别为:

18480b083cd1f94f92675739e618a26f.png

使用公共模型部署逻辑

220d7d669b88651203043abbcff65d53.png

使用开源模型部署逻辑

KB的输入是语料库,然后经过一系列处理,成为可被LLM调取的知识。

语料库的准备比较简单,只需要保证:内容是以TXT或者Markdown等格式存储的纯文本信息(不包含样式)。

也就是说,如果采用xml类型的内容系统,应该可以比较容易做系统集成;如果采用Word类型的文档,需要转换成不包含样式的纯文本信息,并做必要的数据清洗,避免在转换后出现异常。

产品观点

产品经理的意见,与研发Lead有很大不同,会比较偏向于相对悲观的观点。在他看来:

现有ChatGPT和文心一言采用的语言模型,具有巨大数量的权重参数,并且在语料库上投入了巨大的开发成本——这绝对是开源模型和数据集,无法比拟的。

即便如此,ChatGPT与文心一言在回答问题时,表现出的实际效果,也不完全令人满意;何况是企业基于开源模型自行开发的应用。

第三,语料库的开发也会牵扯到比较大的投入成本,切不说是行业内的专业信息,即便是聚焦在企业产品和技术上的信息,也可能需要投入非常大的工作量。

所以,投入成本与实现效果决定了,可能不太值得去做这样的尝试。

未来,企业比较有希望实现落地的方式是,当文心一言或其他类似应用,最终达到了一个比较好的输出效果后,可能会对外输出toB业务支持,当然,是需要付费的。对于普通企业而言,这可能是相对比较经济的方式。

总结

以上内容基于本人有限的眼界和理解,仅供参考。如果你的企业找到了低成本、高收益的解决方案,实施并落地了应用,也非常期待听到你的分享。

相关文章:#AIGC实践

其他推荐:

实施:GitHub + MarkDown 文档系统的工作环境部署及工作流程说明 | 技术传播

6290c8c4f928f3a4798bfcff3c2b4087.jpeg

技术传播是一片蓝海 | 技术传播

访谈:TC无处不在,只是我们没有发觉 | 技术传播

这次他们说好要“讲真的” | 传播

在座都别吵了,你们还有我 | 技术传播

一本培养强迫症患者的说明书 | 技术传播

就像用心做好日本料理 | 技术传播

顽固的老头子与无聊的说明书 | 技术传播

转战新媒体 | 技术传播

评测:王者荣耀的用户帮助系统 | 技术传播

让爸爸妈妈也能享受到科技发展带来的便利 | 技术传播

企业级信息管理系统初创方案构思 | 技术传播

 bd6df06476029b8951a90783f7942dd0.png

睿齐

技术传播从业者

品牌内容策划

自由摄影师

自由撰稿人

汪力迪

公众号:techcomm / htstory

微信号:bgrichi

邮箱:hash_0813@163.com

12bb80f9f2d4eeeaa0060b77a6434e2e.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6293.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VsCode的常用插件安装与插件介绍

VsCode的常用插件安装与插件介绍 0. 导读1. Chinese (Simplified) (简体中文)2. ChatGPT中文版 0. 导读 该插件安装使用的方式,皆为在扩展方式的安装; 如图所示,在联网的情况下搜索对应的插件 1. Chinese (Simplified) (简体中文) 插件介…

EI投稿经验和流程

最近需要投一篇,记录下来过程。 文章目录 参考知乎查了下基本要求去B站看看 写作工具来找一个样本看看参考chatGPT写作开始画重点!!!写作格式详细要求 投稿 参考 知乎查了下基本要求 1、EI稿件控制7页以上,3000单词字…

用 ChatGPT 9 个月“写”了 97 本书,他赚了 2000 美元!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) ChatGPT、GPT-4 等 AIGC 工具,引发的创业创富正在成为一股潮流: 就在两个月前,我们曾报道过,一位品牌设计师兼作家 Jackson Greathouse Fall 因突发奇想&…

chatgpt赋能python:Python怎么降低查重的SEO

Python怎么降低查重的SEO 在互联网上,一篇优质的文章可以吸引更多的用户和流量,提高网站的排名,从而获得更好的收益。然而,随着互联网规模的不断扩大,大量的内容在同一领域重复出现,这使得搜索引擎的优化变…

【ChatGPT实战】使用ChatGPT搞定SEO流量

在日常生活中,我们经常会使用搜索引擎来查找我们所需要的信息。在查找过程中大家有没有想过同样的信息,为什么有的网站总是能排在前面呢?这就涉及文章标题中的“SEO”。 如果你拥有自己的网站,你想要让自己的网站在搜索引擎中排名…

LabVIEW程序能用ChatGPT编写吗

LabVIEW程序能用ChatGPT编写吗 毫无疑问,这不是第一篇关于ChatGPT的文章。自几个月前于2022年11月首次发布以来,OpenAI的大规模语言模型大受欢迎。ChatGPT的可能应用似乎无穷无尽,公司和个人都在用无数答案来询问:“ChatGPT能帮助…

国内直接使用的ChatGTP

ChatGTP都能做一些什么事: 回答问题:我可以通过自然语言处理技术来回答用户的问题,提供有用的信息和解决方案。 聊天互动:我可以和用户聊天互动,倾听对话和提供支持。 搜索:我可以搜索互联网和已知的数据…

最新ChatGPT网页版源码无需KEY/打开就能用

简介: 买了些key放着也是放着,所以干脆集成到源码里面了,不需要大家输入key密钥就可以用,上传到宝塔搭建即可! 云盘地址: http://zijieyunpan.cn/m2duvYSjvrC 阅览:

Chatgpt取代客服?取代客服的其实另有其人

近来,一款聊天机器人ChatGPT刷爆全网,这也让不少人发出疑问:人工智能真的能大规模取代人类吗?其实,人工智能在很多行业比如电商、金融、医疗教育和制造业等领域已经有许多尝试和应用,最常见的就是大家在生活…

如何用 ChatGPT 构建你的专属知识问答机器人

缘起 从去年底开始 ChatGPT 火爆出圈,大家都在思考如何利用 ChatGPT 的能力来构建自己的应用,我也在想,如果有一个机器人可以学习一下开源项目文档中的信息,那是否就可以作为一个开源项目的问答机器人了呢? 这个想法一…

得ChatGPT者,得智能客服天下?

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 在现代社会,高效、专业的客服服务已成为企业、组织机构竞争力的关键要素。智能客服系统应运而生,智能客服系统对客服的赋能作用和价值主要表现在提高效率、降低成本、优化用户体验、深度挖掘用户需求…

用winform开发ChatGPT对话应用

用winform开发ChatGPT对话应用 最近ChatGPT非常火热,本着有热闹就凑的心理,我也上手玩了一把。不玩不知道,玩了吓一跳,这家伙的火,是自己把自己点燃的。不客气的说,OpenAI给人类重新创造了一个神&#xff…

怎么使用ChatGPT解决嵌入式开发的难题

嵌入式开发的痛点 当我们在上手一个新的嵌入式平台,会不可避免地遇到一些问题。我们该如何解决这些问题?以及在解决之后如何形成技术能力沉淀在自己的知识库里?这可能是广大嵌入式开发者共同的诉求。 以我为例,以往我遇到一些知识…

ChatGPT桌面应用程序

众所周知,ChatGPT大火,但大家不免会在访问网站的时候出现各种各样的问题,(网络连接超时,使用频率限制,需要搭建梯子等问题)所以,我制作了一个基于Python的利用ChatGPT官方内测API的桌…

应用程序错误,如何解决?急

1.在网上搜索了很多消息,例如下图修复。 2.对c库卸载重新安装,更新, 3.原win10系统,更新到win11系统。 4.使用sfc /SCANNOW命令运训, 以上这些均未解决该问题,还是会出现“应用程序无法正常启动(0xc0000…

New Bing怼人、说谎、PUA,ChatGPT已经开始胡言乱语了

最近,来自大洋彼岸那头的ChatGPT科技浪潮席卷而来,微软将chatGPT整合搜索引擎Bing开启内测后,数百万用户蜂拥而至,都想试试这个「百事通」。 赶鸭子上架,“翻车”了? 但短短上线十几天,嵌入了…

《花雕学AI》不用花钱,也能和ChatGPT聊天!快来看看这五个免费客户端吧

引言 你有没有想过和一个智能的聊天机器人对话?一个可以陪你聊天、讲故事、写代码、模仿名人、生成歌词等等的聊天机器人?如果你有这样的想法,那么你一定要了解ChatGPT。ChatGPT是一个由OpenAI开发的人工智能聊天机器人程序,它使用…

ColossalChat:使用完整的 RLHF Pipeline复现ChatGPT 的开源解决方案

ChatGPT、GPT-4等大型AI模型和应用在全球范围内风靡一时,成为技术产业革命和AGI(Artificial General Intelligence)发展的基础。 不仅科技巨头竞相发布新品,许多来自学术界和产业界的人工智能专家也加入了相关的创业浪潮。 生成式…

ChatGPT进化的秘密

本文作者,符尧 yao.fued.ac.uk,爱丁堡大学 (University of Edinburgh) 博士生,本科毕业于北京大学,与彭昊,Tushar Khot 在艾伦人工智能研究院 (Allen Institute for AI) 共同完成英文原稿,与剑桥大学郭志江…