开源数字人Fay

原文:别再因AI焦虑,这波年轻人已经用“中国版ChatGPT”创业成功了|数字人|AI|创业_新浪新闻

开源:GitHub - TheRamU/Fay: Fay是一个完整的开源项目,包含Fay控制器及数字人模型,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、语音助理、远程语音助理、数字人互动、数字人面试官及心理测评、贾维斯、Her。 开源项目,非产品试用!!!

gitee:fay: 这是一个数字人项目,包含python内核及ue数字人模型,可以用于做数字助理及自动直播,又或者作为你的应用入口也很帅

导读:ChatGPT腾空出世以来,每天都有扑面而来的新进展、新突破。

  这恍如隔世的几个月里,它如龙卷风一般卷向了每个人。

  国内外大厂纷纷跟进研发,以ChatGPT为代表、AI大模型为基座的AIGC技术很快将遍地开花。普通开发者能借助这场风浪做些什么?

  这个问题就像一堵墙,若不破墙,将阻碍我们寻找风口,进而顺势而起。

  通用人工智能时代已开启,我们心怀好奇,甚至略带焦虑去拥抱技术。

  若要做新时代的开创者,我们还要把自己的智慧注入其中,智慧的体现往往就在于创新。

01

  给居委会搞个“数字人”,

  一场基于AI大模型的“名利双收”

  在思考我们该用AIGC技术做些什么的问题时,已经有这么一群先行者用中国版类ChatGP“源大模型”开创了适合中国大模型的商业模式探索。

  近年来,无论技术风向如何变化,依然有一概念屹立不倒,那就是“数字人”。

  数字人是多种前沿科技的集大成者,作为AIGC具象化的一种展现形式,也是WEB3.0和元宇宙的超级入口。

  更重要的是,它是人类对未来想象中的独立个体,人人都可以拥有数字人,它可以出现在任何角落。

  数字人也会成为千行百业塑造竞争优势的新生产力,实现虚实融合,拥有巨大商业价值。

  然而“颜值经济”并非当下数字人商业化的主流,如今随着计算机视觉等技术的发展,AI“捏脸”应用随处可见,“捏”出符合自身审美的数字人已不是难题。

  美貌的皮囊易得,有趣的灵魂难寻,数字人的有趣灵魂价值一在实用,二在交互。

  基于源大模型,一群开发者带着“有趣的灵魂”瞄准了传统社区智慧化转型的商业蓝海。

  如今社会层面,街道建设愈发被重视,基层社区工作者也在防疫工作中担当了重要角色,同时面临了更大的工作量。为了给基层社区工作者持续减负增能,临汾路街道推出了街道首个政务基层社工领域AI对话机器人“临小助”。

  与最近大火的ChatGPT有三点类似之处,一是“临小助”使用的也是Transformer模型与NLP处理技术(源大模型),二是都能架构在成熟度推广度很高的微信平台,三是都提供24小时在线服务。

  街道不少社区工作者戏称“临小助”是自己24小时在线的“数字助理”。

  随叫随“到”,记忆力还非常好——临小助”收录了民政、人社、房管等15个部门198项面向居民的服务类政策,工作人员通过微信输入问题或者关键词,马上就能得到“正确答案”。

  也就说,198个政策资料,最终变成了统一的“一屏通”。通过AI对话机器人“最强大脑”储存的198个受理事项,为实现居民个人政务办事服务“就近办”提供了能力支撑,帮助居委会用更短时间、以更高质量承担起事务中心延伸办的新任务。

  基于强大的源大模型,“临小助”的能力不仅限于问答,更在于情景生成式“对话”。

  “临小助”可以随时随地为基层社区工作者提供沉浸式、针对性的一对一群众工作能力培训,换句话说:提前演练,社恐福音。

  目前已经开设了加装电梯、业委会换届等8堂社区治理高频情景对话课程,社区工作者通过手机载体与“临小助”进行互动对话形式,提高接待群众服务群众的经验。

  而对街道来说,要达到相同的培训覆盖率与效果,传统线下模式可能需要数月时间,而运用AI对话机器人只要短短十分钟,反复练习、多场景练习因此成为常态,培训效率大幅提升。

  这项“数字人”产品也已经进行商业化探索,已在上海市静安区临汾路街道、嘉定区安亭镇落地。

  这也只是开始,智慧社区商业前景非常广泛:按民政部网站数据,截至2020年底,中国共有38741个街道(镇、乡)级政府。按15%的渗透率计算,基础服务部分市场规模每年就十亿级市场,最寻常的地方可谓遍地黄金。

02

  “一键构建专属你的数字人”:

  开源生态的力量,降低开发门槛

  拥有广阔的落地场景AI大模型+数字人的模式确实能实现高质量创业。

  但“捏人”的门槛,会将一些技术基础薄弱的创新者拒之门外吗?

  开发者社区的开发者打造了“一键构建专属你的数字人”的数字人生成平台—— Fay。

  这个平台包含Python内核及UE数字人模型,开发人员可以利用该项目简单地构建各种类型的数字人或数字助理,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、语音助理、远程语音助理、数字人互动、数字人面试官及心理测评、贾维斯、Her。

  该项目各模块之间耦合度非常低,包括声音来源、语音识别、情绪分析、NLP处理、情绪语音合成、语音输出和表情动作输出等模块。

  Fay控制器核心逻辑

  每个模块都可以轻松地更换。这套架构相当于给只能文字聊天的ChatGPT装上好看的皮囊,并更像真人般能够实时对话,使ChatGPT更像人。

  源大模型如同ChatGPT,在整个数字人流程中充当大模型的大脑和灵魂,能输出智能实施的对话。

  这套系统最大的价值在于,为数字助理(语音助理)这一类型产品提供了一个新的架构思路,全流程一键式打通从打造“好看的皮囊”到“有趣的灵魂”,同时可以实时语音交互的数字人。

  而且Fay并不仅限于智能音箱等特定的语音终端,Fay只需要运行在个人的PC或者移动设备上,就可以时刻与“ta”通讯。

  目前,Fay已经实现完整开源,助力更多有意愿打造自身数字人的人们。

  例如,实现数字人互动,可以根据Fay控制器进行一系列设置:麦克风输入源开启、展板播放关闭、填写性格Q&A,合成数字人;若是应用在更大平台,例如抖音虚拟主播,可以启动bin/Release_2.85/2.85.exe , 根据Fay控制器进行一系列设置(抖音输入源开启、展板播放关闭),结合抖音伴侣,生成数字人。

  GitHub链接:

  https://github.com/TheRamU/Fay

  数字人的未来远远超出仅作为人类的替代,当通用人工智能充分发展,数字人或被当做虚拟世界独立个体,,甚至把它作为生活中的主体当成独立的人格。

  而Fay之所以能“造福”大家,其开源要追溯到“源大模型”的开源。

03

  搞钱新范式,

  开源大模型生态与商业化的互利互助

  源1.0大模型发布时便问鼎全球最大规模的中文AI模型,其参数规模高达2457亿,训练采用的中文数据集达5000GB,相比GPT-3模型1750亿参数量和570GB。

  “源”开源开放构建了大模型应用开发新生态,包括高质量中文数据集、开源模型训练代码、推理代码和应用代码等,可以帮助开发者节省各类研发开支。

  如此,开发者无需关心底层技术,设置无需配置编程环境,就可以直接将应用构建于AI大模型的能力之上,在降低开发门槛的同时,让开发人员能够将更多的精力聚焦核心业务逻辑。

  目前”源”已全面开源开放,开放模型API、开源高质量中文数据集、模型训练代码、推理代码、应用代码、面向AI芯片的模型移植开发代码,开放平台已服务超4000名行业开发者,覆盖互联网、金融、教科研和自动驾驶等行业领域,大大降低了不同行业不同任务的AI应用开发门槛。

  正是因为这种算法基础设施的开源,使得这些开发者以极少的团队成员便能开发出成熟商业化的产品,并成功创业。

  开源之间的互利与反哺,往往能催生创新的生生不息,创新更是能转换成商业价值。

  源开发者社区开发者郭泽斌开发的“一键式构建专属数字人”的开源架构,也已被深圳某公司应用到平板中充当自个人助力,产生商业价值。一些主打情感陪伴的儿童玩具公司也从这套架构中挖掘出巨大商业价值,在儿童玩具中搭载这套开源架构,目前已投入生产,即将上线售卖。

  这些开发者用“数字人”开拓了以大模型开源生态为基础的全新商业模式,当然这是一个缩影。

  大模型开源,给开发者带去创业和商业机遇。就像安卓生态,未来大模型开源生态也将遍地开花,创新项目也会如同安卓生态里的各类APP般不断涌出,孵化更多商业价值应用,加速AI产业变革。

  广阔天地,大有作为。

  4.26大模型开发者沙龙👇一键预约

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/26884.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UE基础使用

一:打包。 二:显示FPS。 三:坐标系。 四:第三人称模式。 四:筛选物体。 五:物体对其到地面。 六:UE加载窗口默认布局。 七:关闭磁力吸附。关闭后可以自由移动。 八:属性变…

ChatGPT原生态程序开发

ChatGPT是基于OpenAI技术训练的语言模型,其原生态程序开发需要深入了解自然语言处理(NLP)和机器学习(ML)等相关领域知识,并具备丰富的编程经验。除此之外,还需要掌握Python等编程语言、TensorFlow等深度学习框架,以及各种NLP工具和…

基于React和Html5的宠物领养平台网站设计与实现

目 录 一、绪论 4 (一)选题背景简介 4 (二)目的和意义 4 二 技术简介 5 (一) HTML5技术简介 5 (二)ES6简介 5 (三)React 5 (四)Koa2 5…

实战:利用pytorch搭建VGG-16实现从数据获取到模型训练的猫狗分类网络

起 在学习了卷积神经网络的理论基础和阅读了VGG的论文之后,对卷积有了大致的了解,但这都只是停留在理论上,动手实践更为重要,于是便开始了0基础学习pytorch、图像处理,搭建模型。 pytorch学习视频 https://www.bilibili.com/vide…

基于pytorch实现猫狗分类系统

本文参加新星计划人工智能(Pytorch)赛道:https://bbs.csdn.net/topics/613989052 写在前言:本文是一个保姆级的分类教程,旨在让零基础的同学掌握实现一个分类系统的基本要素、通用模板和模块实现。在项目代码中做了非常详细的注释&#xff0c…

从零开始编写一个宠物识别系统(爬虫、模型训练和调优、模型部署、Web服务)

心血来潮,想从零开始编写一个相对完整的深度学习小项目。想到就做,那么首先要考虑的问题是,写什么? 思量再三,我决定写一个宠物识别系统,即给定一张图片,判断图片上的宠物是什么。宠物种类暂定…

python:tflearn训练的猫狗识别模型及其使用

需要下载:pip install tflearn 一些理论知识在前一篇文章中:可以一起阅读学习 https://blog.csdn.net/m0_64596200/article/details/126918240?spm1001.2014.3001.5501 已经处理好的.npy文件: https://download.csdn.net/download/m0_645962…

基于Pytorch实现猫狗分类

文章目录 一、环境配置二、数据集的准备三、猫狗分类的实例四、实现分类预测测试五、参考资料 一、环境配置 安装Anaconda 具体安装过程,请自行百度配置Pytorchpip install -i https://pypi.tuna.tsinghua.edu.cn/simple torch pip install -i https://pypi.tuna.t…

猫狗训练单张图片的测试

猫狗训练的训练模型的建立,模型在整个预测集上的预测效果的测试的程序代码网上或一些书籍上都可查阅,但是对单张或某些图片的分类测试程序不多,这里通过参考博客:https://blog.csdn.net/baidu_35113561/article/details/79371716 …

宠物鼻纹识别及面部识别进一步在城市养犬登记场景落地

最近安阳狗咬人事件造成了极其恶劣的社会影响,大型禁养犬类伤人成为城市治安管理不容忽视的隐患,正威胁人们的生命安全,养犬热潮也给城市管理带来了不小的挑战,粗放式的养犬管理不再适应时代的需求,城市养犬管理改革已…

借助互联网,“宝贝它”欲打造线上宠物交易与服务平台

作为人类忠实的朋友,宠物一直伴随着很多家庭的成长。而随着人们生活节奏的不断加快,电子商务正成为越来越多传统垂直领域的解决方案,宠物交易与服务同样也不例外。上海创业公司宝贝它希望借助互联网,打造线上宠物交易及服务平台。…

小动物领养网站/宠物救助网站

摘 要 本论文对小动物领养网站的开发过程进行了较为详细的论述,采用B/S架构、ssm 框架和 java 开发的 Web 框架,eclipse开发工具。 小动物领养网站,主要的模块包括管理员;首页、个人中心、用户管理、动物展示管理、动物分类管理…

语音合成工具Coqui TTS安装及体验

先介绍两种免费的语音合成工具 balabolka 官网 http://balabolka.site/balabolka.htm 是一种基于微软Speech API (SAPI)的免费语音合成工具,只是简单的发音合成,效果比较生硬 Coqui TTS 官网 https://coqui.ai/ 是基于深度学习的语音合成软件&#x…

音视频进阶教程|如何实现游戏中的实时语音

1 游戏实时语音功能简介 1.1 游戏实时语音概念解释 范围:收听者接收音频的范围。方位:指收听者在游戏世界坐标中的位置和朝向,详情可参考 5.5 初始化设置 中的“步骤 1”。收听者:房间内接收音频的用户发声者:房间内…

通过实时语音驱动人像模拟真人说话

元宇宙的火热让人们对未来虚拟世界的形态充满了幻想,此前我们为大家揭秘了声网自研的 3D 空间音频技术如何在虚拟世界中完美模拟现实听觉体验,增加玩家沉浸感。今天我们暂时离开元宇宙,回到现实世界,来聊聊声网自研的 Agora Lipsy…

聊天语音APP开发|聊天语音软件开发-实时音视频技术

聊天语音软件的开发应该是一个以视频和语音直播为核心的社交系统。对于用户来说,更好的视频和语音直播功能可以增强用户的接受感,让用户持续使用。为了方便视频和语音直播的采用体验,减少直播的延时,聊天语音软件的开发将采用实时…

拿到offer提出离职,公司拖30天才放人,但下家公司等不了30天,怎么办?

拿到offer想跳槽,向公司提出了离职,但公司要拖30天才放人,新公司又等不了30天,offer可能就没有了,这就是一位网友面临的两难局面,这种情况有没有什么解决的好办法呢? 有人安慰楼主,下…

怎么说离职原因新的公司比较能接受?

怎么说离职原因新的公司比较能接受? 我来提供一些格式化的应对方法; 1.实际原因:原单位工资太少。离职原因:我认为我自己已经具备了一定的积累,希望可以迈向一个新的台阶。 2.实际原因:跟同事出不来。离…

我提了离职,公司给我涨薪了,还能待下去吗?

金三银四到了,相信不少同学又开始在物色新的公司。 不少同学反映,在提出离职后,公司给自己加了薪,虽然不多。 那“在职员工,提出辞职被挽留,应该留下吗?” 为什么想要离职? 这个问…

是的,我离职了

终于可以敞开说这件事情了,年后的这一个月,我彻底停更了,并不是偷懒了,而是我要找工作。大家也都知道18年的寒冬,很多大厂开始裁员,所以我要更加认真的学习,毕竟跟大厂出来的相比,自…