融合GPT大模型产品,WakeData新一轮产品升级

近期,WakeData惟客数据(以下简称 “ WakeData ” )完成了新一轮的产品能力升级。就 ToB 企服公司如何融合GPT 大模型,WakeData 给出了自己的答案。
在2022年11月的产品发布会上,已传递出WakeData的“三个坚定”:始终坚定技术投入,全面夯实核心产品的科技能力和自研率;始终坚定国产化适配能力,支持国产芯片、操作系统、数据库、中间件、国密算法等,并在同领域实现对国外厂商的国产化替代;始终坚定拥抱生态,与伙伴共创共赢。
WakeData继续新一轮的产品能力升级,凭借过去5年的技术积累,以及在地产、零售、汽车等行业和垂直领域的实践,与战略伙伴联合研发具有私有化部署能力的行业大模型WakeMind,将在 AIGC 时代帮助更多企业自我革命、提升效能,持续解放生产力。
在这里插入图片描述

1、WakeMind模型的三大平台层
模型层:母舰平台将以具有私有化部署和行业定制能力的WakeMind作为核心引擎,已接入了ChatGPT等大模型,同时支持接入如文心一言、通义千问等多个大模型能力
平台层:WakeMind基于Prompt提示工程、Plugin、LangChain等方式,实现与接入大模型的高效对话能力。在零样本学习的基础上,通过Prompt和Plugin管理,让模型能够更好的理解上下文信息;通过投喂行业语料,让模型快速学习行业知识,并具有行业和垂直领域的思考推理能力。
应用层:WakeMind母舰平台提供底层能力,通过一架又一架的舰载机去赋能产品应用和行业场景,提升企业内部生产力。
举个例子,母舰平台如何赋能惟数云。企业在借助惟数云平台建设和使用数据资产的过程中,往往需要投入大量专业的数据开发工程师,参与到业务需求分析和数据开发工作中,而大量繁琐的开发任务会导致整个数据价值实现周期被拉长。基于WakeMind赋能,只需要通过文本交互,惟数云就可以自动生成对应的数据查询语句,并一键执行查询,能够大幅度提高数据查询、分析、开发的效率,全面降低数据使用的技术门槛,以实现数据人人可用的目标。
在这里插入图片描述

2、WakeMind模型的三大特征
1)参数量更适合行业化和垂直领域场景。AI生成的内容要达到人类水平,往往需要以“预训练+微调”的大模型为基础;WakeData联合业界领先的千亿参数多模态预训练大模型厂商,通过知识蒸馏和动态量化,压缩出100亿参数量的WakeMind模型;在聚焦的行业和垂直领域,基于P-Tuning V2可以将需要微调的参数减少到原来的千分之一,大幅度降低微调所需要的计算量。
2)具备行业化和垂直领域能力的文本创造和代码生成。
3)支持私有化部署和行业化定制。行业或垂直领域的头部企业,更希望具备私有化部署和行业化定制大模型的能力。而如何在小样本学习和低算力消耗的情况下进行有效的预训练,已成为行业化定制模型的技术门槛。WakeData行业数据和垂直领域数据的积累,将使行业大模型具有行业Know-How,并形成独特的竞争优势。
同时,WakeMind采用Transformer架构,以self-instruct方式生成数万的指令遵循样本数据,使用SFT(Supervised Fine-Tuning)、RLHF等技术实现意图对齐,通过INT8量化后,可大幅降低推理成本,使模型具有私有化部署的可行性

3、大模型与行业化预训练大模型
自OpneAI发布ChatGPT以来,给世界带来了巨大冲击。其背后的大型语言模型 (Large Language Model,LLM) ,以及RLHF (Reinforcement Learning from Human Feedback) 即以强化学习方式依据人类反馈优化的语言模型,得到了广泛关注。
WakeData创业初期,在NLP、CV、语音等领域就发布了11个AI模型,其中NLP语义分析大模型的应用场景最为丰富。例如在低频高客单价的地产置业、汽车、品牌零售等行业领域,SCRM是最有效的潜在客户和存量客户经营方式之一。WakeData通过行业语料的积累和特定的预训练,使AI对行业产生深刻理解,能够在对话过程中24小时快速响应客户问题,并且能够基于会话信息,自动抽取客户标签,提升客户画像的分辨率。
在这里插入图片描述

在WakeData,AI大模型能力已经覆盖到从底层客户数据资产构建,中层客户经营旅程和经营规则,再到上层的多接触点营销链路;具备能够为整个数字化客户经营的垂直领域‘降本、提效、赋能’的能力。例如在CDP客户数据平台领域,以前运营人员需要繁琐的规则设计才能圈选到合适的目标客群,现在则通过简单的语言描述和对话,AI即可以辅助找到对应的目标客群,大幅降低平台的使用学习成本,跨越式的提升使用效率和交互体验。
在这里插入图片描述

在MA营销自动化领域,WakeData的产品已经接入了微信生态、抖音、小红书等触点,并且支持自动化构建营销旅程,提供丰富的旅程模版库,可以实现“实时的、一对一的、个性化的”用户触达。这其中有一个重要的环节是个性化营销素材的生成,包括文本、图片、图文混排等,AI大模型可以大幅提升这个部分的效率和质量,同时降低成本。
在Loyalty大会员领域,当大会员系统横跨不同行业、不同业态的时候,会员规则和会员资产拉通就会存在挑战,WakeData的AI大模型基于大量行业经验和语料训练形成的Prompt引擎,通过简单会话,描述不同业态会员的特性和业务诉求,就可以自动生成不同会员规则的映射逻辑和组合方案。
大模型在行业和垂直领域的实践已证明其价值。

4、WakeMind商业路径的三个阶段
1)2018-2021年,自有模型应用和商业化探索期。基于WakeData的惟数云、惟客云、昆仑平台三条基础产品线,将自研的NLP大模型在地产、新零售、汽车等行业,以及数字营销等垂直领域进行全面的探索和实践。
2)2022-2023年,WakeMind发布和母舰平台建设期。WakeData联合战略伙伴加速行业大模型WakeMind的研发,并通过母舰平台,使WakeMind具备行业化和垂直领域的定制化能力,具备私有化部署能力,具备通用大模型的接入和管理能力,实现对自有模型不能覆盖场景的有利补充。
3)2023年及以后,全面进入WakeMind模型应用期。 WakeMind基于母舰平台的能力,全面接入到惟客云、惟数云、昆仑平台等产品线,通过行业知识积累、行业场景优化、行业提示工程训练,进一步提升模型的行业化能力,并将在地产、新零售、汽车等行业发起更大规模的商用。与此同时,WakeData自身也基于WakeMind母舰平台的能力,开始实现自我生产力的革命。

5、WakeData如何用AI解放生产力
WakeData公司的使命定义为「唤醒数据」 ,并已在大数据平台领域布局多年。作为一家TOB企服公司,就「如何运用大模型」WakeData看到了巨大的机遇,并将大模型的运用覆盖到了两个方面:一方面是将大模型接入产品,另一方面则帮助企业内部的设计师、程序员等人群使用大模型进行产品开发和客户项目交付。
大模型的接入运用有两个基本要素,有更适用的场景和具备大数据AI能力,WakeData主要的两款产品“惟客云”与“惟数云”则为大模型的接入提供了便利。惟客云能够更方便的基于行业数字化应用将大模型工具无缝接入,客户无需关心应用背后的复杂配置和技术优化;惟数云则能够基于行业帮助场景应用优化提示工程和垂直模型。而这也是WakeData一直坚持平台+应用的产品方案优势。
与此同时,WakeData将大模型接入产品又分为了两类,一类是基于产品和行业业务流接入,这类接入的重点在于优化体验和行业知识,帮助客户快速、便捷和有效的运用;第二类是基于产品结和开源大模型深度优化垂直场景,这类产品更符合大客户对抗风险和数据安全上的诉求,同时基于行业的理解对模型可以不断优化,可以保持这类客户在垂直行业的持续竞争力。
“企业在数字化转型和数字化客户经营当中要融合好大模型,大数据和场景是两个关键要素。”WakeData创始人兼CEO李柯辰表示。
在通常情况下,大模型都需要大量的数据进行有效训练,因此具备行业化的数据平台能力变得至关重要。近日国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,其中特别强调了训练和预训练数据来源的合法合规,以及数据的真实性、准确性、客观性、多样性。大模型的价值应用场景,更是大模型发展和商业化的重要因素;所谓场景就是指我们训练的模型的用途,是否能在合法合规的前提下,为业务创造核心价值。
李柯辰认为,场景是运用大模型的环境,大数据和AI技术基础是能力;拥有行业场景和行业数据的企业在获得大模型能力时会更快、更有效、更敏捷。
WakeData的两条核心产品线,正是对这两大要素的累积;惟数云作为新一代数据平台,具有强大的大数据End-to-End的数据处理能力,惟客云作为新一代数字化客户经营平台,其中包含了CDP、MA、SCRM、Loyalty等套件,拥有海量的业务应用场景,并且通过垂直行业深耕战略,拥有更强的行业Know-How,拥有更多有价值的训练样本数据。在2022年惟数云就发布5.0版本,其数据集成、数据计算、数据分析和治理、数据可视化、数据资产化的能力均具有行业领先的优势。而这些数据侧的优势,也成为大模型时代行业化人工智能应用的竞争壁垒。
“在WakeData内部已经初步形成推进生产力解放的工作氛围,WakeMind能力在产品设计、开发测试、营销运营等领域,都已经展开使用,初步运用已实现人效达到20%的提升。在加快产品研发的同时,也提升了客户项目交付的效率,还为客户的数字化项目落地节省了时间成本。。”WakeDataCTO钱勇说到。
昆仑平台由基础云、开发云、集成云三部分组成,是WakeData产品研发和实施交付过程中非常重要的云原生技术底座。昆仑平台开发云通过WakeMind赋能,工程师已经在探索“基于产品文档,辅助生成对应的架构设计、数据模型设计,再辅助生成代码、检测代码的正确性”等方面的应用。例如在推进领域驱动设计的过程中,WakeMind可以辅助学习DDD、辅助工程师进行领域建模;在数据建模的过程中,可以通过自然语言交互进行数据模型的创建、修改、自动补充完善,快速生产SQL语句;在产品研发过程中,通过输入产品文档,提取和生成产品术语表,并进行详细的解释说明等。
在这里插入图片描述

对普通的工程师来说,在生成规则类代码、自动生成单元测试、代码审查和优化等领域,已经可以大幅提高开发效率了。
WakeMind提供全员可用的文案生成助手。
在这里插入图片描述

市场部门通过AI的 Text to Video快速构建的营销增长矩阵。
在这里插入图片描述

AIGC赋能行业和垂直领域是必然趋势,也是WakeData自创业以来的核心发展路径。对于类ChatGPT的技术和服务,WakeData一直保持开放和拥抱的态度,并且积极投身其中,在聚焦行业化经营的战略基础上,紧紧把握其价值化和商业化的路径。惟客数据的 WakeMind 行业大模型,将在 AIGC 时代帮助更多企业自我革命、提升效能,持续解放生产力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33603.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

借助chatGPT强大的源码理解能力,来快速学习elasticsearch 7.11.1整体源码结构(用chatGPT学源码太香了)

ES阅读学习源码的难处 es的源码非常之多。能够查阅的资料非常少。如果是我们一行一行的去扒着源码看,在我看来至少需要2年的时间,并且至少要耗费四分之一的头发。源码读起来很枯燥,特别是在我们一头雾水的时候。很容易产生放弃的念头。很少有…

大语言模型中的涌现现象是不是伪科学?

深度学习在理论上的孱弱一直被诟病,但科学史上存在大量先有应用再有理论的事例,而其中不能解释的重大实验现象往往预示着理论创新的契机。我们首先从现象出发,来看下LLM中最神秘的emergent ability,如图 上图中x、y轴分别表示模型…

自制开源的 Midjourney、Stable Diffusion “咒语”作图工具

本篇文章聊聊如何通过 Docker 和八十行左右的 Python 代码,实现一款类似 Midjourney 官方图片解析功能 Describe 的 Prompt 工具。 让你在玩 Midjourney、Stable Diffusion 这类模型时,不再为生成 Prompt 描述挠头。 写在前面 本文将提供两个版本的工…

【区块链技术社区】区块链微信群

磨链mochain社区-区块链技术讨论交流不定期进行线上的技术交流学习,技术分享。线下技术交流,成员主要在北京、上海、浙江、广东等地。欢迎:区块链技术大咖、区块链爱好者、区块链技术爱好者、想了解区块链技术的小白不欢迎:广告党…

区块链笔记:典型应用:数据资产、交易系统、即时通信、链上游戏、追踪溯源等

数据资产 1 ) 详解 这是区块链的一个比较核心的应用,对于软件系统或者说对于互联网系统来讲,对数据的处理、分析、计算,这些功能是属于比较基本的软件功能对于区块链来讲它的核心的功能是在于创新式的提供了一个原先各种软件都没…

靠谱的区块链应用到底是啥?通证啊!——第二次中关村-CSDN区块链开发技术沙龙【含PPT下载】

针对“通证”话题的多篇分析文章预热,本期沙龙在开始前就被区块链网友广泛关注。此次沙龙的参会者经过层层的严格筛选,才得以与众位大咖面对面沟通。 12月15日下午,中关村区块链产业联盟、CSDN、枫玉科技联合举办的区块链系列沙龙。来自中关村…

云图说丨不同区块链之间如何跨链交互?

本文分享自华为云社区《【云图说】第237期 不同区块链之间如何跨链交互?》,作者: 阅识风云。 可信跨链服务是基于一系列制定的可信区块链标准跨链协议,保证跨链交易全栈可追溯、可扩展性及可靠性等,助力不同区块链可…

知乎高赞 | 区块链是什么? (一)

首先不要把区块链想的过于高深,他是一个分布在全球各地、能够协同运转的数据库存储系统,区别于传统数据库运作——读写权限掌握在一个公司或者一个集权手上(中心化的特征),区块链认为,任何有能力架设服务器…

XuperChain 百度区块链简易学习帖

百度XuperChain基于Ubuntu系统从零开始到部署简单合约 环境配置go语言安装git安装客户端安装 启动私链基本操作命令1. 创建普通用户2. 创建合约账号3. 查询余额4. 转账5. 查询交易信息6. 查询block信息 网络部署(选择性阅读)1. 创建网络部署环境2. 配置种…

建议收藏,轻松搞懂区块链

未来已来,只是不均衡地分布在当下 大家好,我是菜农,欢迎来到我的频道。 本文共 5844字,预计阅读 30 分钟 区块链是近些年来最热门的前沿技术,被认为是未来十几年对金融、物联网、医疗等诸多领域产生最大影响的"…

都说区块链可信,到底信了个啥?

‍‍ 题图摄于北京二环路 【前言】不时有朋友向我询问某某区块链项目怎么样。我通常只给他们讲一点:要考察项目中区块链的信任体系。不管项目方说得怎样天马行空,看懂其中的信任机制,就基本可判断其项目的价值。 最近热门词汇层出不穷&#x…

如果你还不懂区块链那就out了(二)--区块链的演化及应用场景

前面我们介绍了很多区块链的知识,可能大家会有以下几个疑问: 1、区块链用于溯源,如果供应链上的参与方自己造假,在中途将实物替换掉,区块链宣称的不可更改不就无效了吗? 答:造假会有相应的惩罚措…

总搞不懂区块链各共识机制的优缺点?来听听这位十多年经验技术老兵的吐血分享吧!

2018区块链技术及应用峰会 (BTA)中国 倒计时5天 2018,想要follow最火的区块链技术?你还差一场严谨纯粹的技术交流会——2018区块链技术及应用峰会(BTA)中国将于2018年3月30-31日登陆北京喜来登长城饭店。追求专业性?你要的这里全都有&#xf…

区块、链和共识

区块、链和共识 💡 区块链的基础数据结构 准备 Hash Hash也称散列、哈希。基本原理就是把任意长度的输入,通过Hash算法变成固定长度的输出(更多解释见知乎) 特点是:相同的输入一定得到相同的输出,不同的输…

都2021年了,还不知道什么是区块链就out了 | 从区块链数据结构到应用

序言 在现阶段及后10年都是发展主流的数字化经济的催动下,区块链技术越来越火爆。那么比特币的区块数据结构是如何构成的,区块链有什么特性,我们用区块链能用来做什么?我们一起来探讨下。 区块链诞生背景 2008年11月1日&#xff0…

基于区块链的内容社交平台,他们凭什么说比知乎更吸引人?

本堂茜 渡鸦区块链专栏记者 张杰拥有10多年的软件开发经验和创业经验,自称是“互联网老兵,区块链新秀”。随着互联网的发展,渐渐的他们不再满足于做线下的软件外包项目,更想在互联网方面做。 他们在互联网方面做了很多SAAS服务。例…

在清华讲区块链,高晓松竟这样解读共识与Token

本文仅代表作者观点 作者 | 李画 编辑 | 秦晋 高晓松2019年的第一期《晓说》,在母校清华大学做了以一场没有"诗和远方"全是苟且的演讲:《5G与区块链:文创产业的重要赛道》。他认为,5G与区块链是文创/内容产业在未来最重…

朋友聚会上,当你被cue聊聊区块链时.....

来源 | 白话区块链 责编 | 晋兆雨 头图 | 付费下载于视觉中国 转眼间,又到了一年一度的同学聚会。这次班长牵头,把班上绝多数同学都叫了过来,甚至还请了班主任王老师到场,摆了好几大桌。 一时间觥筹交错,各个都喝得满…

家用2kw风力电机满负荷的发电量有多少

家用风力发电机2kw的一天的满负荷发电量是48度电,3级风发电5级风满负荷发电,电机是永磁发电机,足功率发电,纯铜线圈缠绕,叶片是增强玻璃钢材质的

PyTorch搭建LSTM实现时间序列预测(负荷预测)

目录 I. 前言II. 数据处理III. LSTM模型IV. 训练V. 测试VI. 源码及数据 I. 前言 在上一篇文章深入理解PyTorch中LSTM的输入和输出(从input输入到Linear输出)中,我详细地解释了如何利用PyTorch来搭建一个LSTM模型,本篇文章的主要目…