能聊天、会学习,远不是GPT的终局

自然语言处理(NLP)技术的发展和运用,使得计算机性能增长速度一举跃过摩尔定律瓶颈,将AI拱入属于它的高光时代。而象征技术融合的ChatGPT一夜爆红,仿佛给整个商业社会带来了一次“技术革命”。

微软、谷歌、百度、华为、阿里...全球范围内的科技巨头,争先恐后真金白银地押注,掀起了一场以资本和技术为基础的生态竞速。

无疑,GPT模型在这场革命中扮演了一个举足轻重的角色。从GPT-3到GPT-3.5,再到现在的GPT-4,我们已经见证了这个模型能力的惊人飞跃。

然而,这是否意味着我们已经看到了GPT的终局?接下来,本文将从垂直、个人、离线三个维度,对GPT的发展趋势、未来前景进行一些基于客观现实的大胆猜想。


垂直GPT百花齐放

3月的最后一天,彭博新闻社发布了专门为金融领域打造的大型语言模型(LLM)——BloombergGPT,引发金融圈“地震”。

基于LLM的生成式人工智能,已经在许多领域展示了令人兴奋的新应用场景。但是,金融领域的复杂性和独特的术语,意味着其需要特定的语言模型。作为全球最大的财经资讯公司,彭博社在这方面恰好拥有巨大优势。

在过去40年里,彭博收集了海量的金融市场数据,拥有广泛的金融数据档案,涵盖一系列的主题。使用该公司数据终端的客户遍布全球,包括交易员、投行、美联储、美国其他官方机构以及全球各大央行等。

这些特有数据,使得BloombergGPT比ChatGPT拥有更专业的训练语料。据彭博社发布的报告中可以看出,研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,构建了一个3630亿个标签的数据集,并基于通用和金融业务的场景进行混合模型训练,以支持金融行业内各种各样的自然语言处理(NLP)任务。

除了金融领域,医疗、教育也均有更为垂直的GPT产品涌现。例如,IBM Watson Education推出了一款名为“Teacher Advisor with Watson”的教育GPT,可以为教师提供个性化的教学建议和支持;Kheiron Medical推出的“MIA”医疗GPT,可以为医生提供乳腺癌筛查和诊断支持。

相对于“广而泛”的ChatGPT,垂直GPT的发展优势十分明显。

首先就是成本上,垂直GPT针对特定领域或行业进行优化,只需利用该领域内的专业数据进行训练,避免了ChatGPT那样数据采集的高成本和高难度。

另外对比通用的GPT产品,垂直GPT的训练成本和应用成本更低。由于垂直GPT针对特定领域进行优化,训练数据更加专业化和精细化,可以通过更少的数据和更短的训练时间,获得更好的效果。

而垂直GPT在特定领域的应用效果更好,能够更准确地理解和处理领域内的语言数据,从而减少了后续的人工修正和调整成本。

更低的训练成本、更短的训练时间、更精细的训练内容,能够为企业提供更高效、准确、具有定制性的自然语言处理服务,优化企业的业务流程和数据分析能力,从而为企业带来更多的商业价值和竞争优势,这也使得垂直GPT在商业化上更加出色,资本市场和相关企业也更加看好这一方向。

值得一提的是,更垂直的GPT也意味着企业需要有更专业、更精准、更安全的数据语料,未来企业的竞争点也将围绕专业数据、清洗和标注数据的能力、用户隐私安全三点展开。

不可否认,随着各行各业对自然语言处理技术的需求不断增长,GPT模型被应用到更多的垂直领域中已被提上日程,未来将会看到更多专业的垂直GPT产品出现。


个人GPT并不遥远

因为与通用GPT的模型存在一定不同,垂直GPT的独特性、定制性在未来也可能促进个人GPT的出现。

个人GPT是指为个人用户提供个性化的自然语言处理服务的GPT模型。个人GPT可以学习用户的语言习惯、兴趣爱好、生活方式等信息,从而为用户提供更加个性化、贴近用户需求的自然语言处理服务。

这看起来非常不可思议,但并非无法实现。

从底层实现逻辑技术来看,GPT的核心是基于Transformer架构,结合预训练模式、多层结构、无监督学习和Fine-tuning微调等特点,通过对输入语料的学习得到进化。也就是说,如果能够在个人PC上实现这些步骤,那么就有构建GPT的可能。

目前市面上已经出现了大量开源大模型、公开语料包,基于这些模型可以快速进行语料训练,而其中的难点无非在于处理数据的能力、以及对训练好的模型进行评估和优化。简单来讲,如果PC上安装了足够优秀的GPU、CPU等核心处理器,完全能够实现个人GPT的训练。

当然,训练个人GPT模型所需的硬件配置取决于许多因素,例如模型的规模、数据集的大小、训练算法和优化器的选择等。

以下是ChatGPT给到的一些通用建议和参考:

CPU:训练大型的GPT模型需要强大的CPU计算能力,建议使用多核心的CPU处理器,例如Intel Xeon、AMD EPYC等型号的服务器级别CPU。

GPU:GPU是训练大型GPT模型必不可少的重要组件,建议使用高性能、内存大的GPU,例如NVIDIA Tesla V100、A100等型号,以提高模型训练速度和效率。

内存:训练大型GPT模型需要极高的内存消耗,建议使用大容量的内存,例如64GB以上的服务器内存。

存储:训练大型GPT模型需要大量的存储空间,建议使用高速、大容量的SSD或NVMe硬盘,以提高数据读写速度和效率。

网络:训练大型GPT模型需要大量的数据传输和通信,建议使用高速、稳定的网络连接,例如千兆以上的以太网或InfiniBand网络。

需要注意的是,训练个人GPT模型需要极高的计算资源和时间成本,建议使用云计算服务或租用高性能计算资源进行训练,以提高效率和降低成本。同时,还需要选择合适的训练算法、优化器和超参数等,以提高训练效果和准确性。

值得一提的是,前不久王健林独子王思聪再次对家中的“百万服务器”进行新一轮网络改造,有业内人士推测主要目的就是提高服务器算力,以训练个人GPT。

不过如果想要建立高质量的GPT模型,需要大量的高质量训练数据语料,但是除了公开语料包外,个人用户很难获得大规模的高质量训练数据,因此需要花费大量的时间和精力采集和处理数据,这也是个人在搭建GPT时的难点。

还需要注意的是,在个人PC上创建独立的GPT需要大量的计算资源和时间,并且需要具备一定的机器学习和自然语言处理技术知识。除此之外,还需要关注大模型的可扩展性,以及数据隐私和安全问题,确保训练数据和模型的高效性和保密性。

当然,对于普通用户来说,构建训练环境、调用开源大模型、寻找训练语料等等几乎每一步都是一个门槛。但在「科技新知」尝试后发现,除了不能帮助直接购买所需的硬件外,ChatGPT可以协助解决搭建过程中几乎80%的问题。

近期,OpenAI暂停ChatGPT Plus付费服务的消息传得火热,加上前几天部分地区普通账号大面积封号,虽然问题暂时得到解决或缓解,但ChatGPT计算资源供不应求的问题还是浮现出水面。

业内人士统一认为这是因为算力不足导致GPT-4的响应速度变慢,错误答案增加,微软作为ChatGPT的金主,曾大力投入资源提升其算力并承诺继续提升,但现在似乎还不太够。

这也更加突出个人GPT的必要性。另外从底层逻辑来看,个人GPT除了个性化定制、隐私安全性更高、使用更高效外,还有一个更值得关注的优势,就是离线使用。而在「科技新知」看来,离线GPT也是未来发展的一个主要方向。


离线GPT不无可能

GPT模型的训练和推理,需要大量的计算资源和存储空间,这使得云端环境成为了主流选择。但是,在一些特定场景下,如边缘计算、无网络环境等,离线GPT模型的需求也并不少。

更为实际的,比如采矿等特殊环境行业,离线GPT可以结合监控系统和数据分析技术,分析矿山环境、工人健康状况等信息,从而实现安全管理和风险预警,减少矿难和事故的发生,保障矿工的生命和财产安全。

通用GPT显然无法实现在有限的存储空间内,给到无限可能的答案。因此,「科技新知」认为“离线+专业”是GPT未来极可能实现的发展方向。

微软刚刚发布了一款代号“贾维斯”的人工智能虚拟助手,它是一个集成了大型语言模型(LLM)和专家模型的框架,用于处理任何模式或领域中的复杂任务。

简单来讲,贾维斯类似AI与AI之间的协作系统,可以通过大型语言模型组织模型之间的合作,来处理任何模式或领域的任务。通过大型语言模型的规划,可以有效地指定任务过程并解决更复杂的问题。

不妨设想一下,将矿业行业的GPT模型与贾维斯结合,再通过机器狗作为运行载体,由贾维斯作为中台,向机器狗传递GPT模型所提供的信息,可以实现一定程度上的自主作业。

具体而言,机器狗可以通过搭载各种传感器、控制器和执行器等设备,收集、处理和执行矿业作业所需要的各种数据和指令。

贾维斯作为中台,可以实时监控机器狗的运行状态、矿产资源的勘探和开采情况等信息,通过离线GPT模型分析和预测矿产资源的位置、规模和开采效率等指标,向机器狗传递智能化的勘探和开采指令,实现对机器狗的自主控制和作业。

客观来讲,这样的模式也可以复刻到高空机器人、医疗机器人等特殊领域中。

不过在这个过程中,也需要解决客观存在的技术难题。而其中最为关键的就是训练中的语料数据存储。

除了训练好的垂直GPT需要占用大量内存外,贾维斯系统也需要处理大量的语音和文本数据,包括语音识别、自然语言处理、知识图谱等任务,以实现语音输入、文本输出、任务执行等功能。如果全部在本地进行训练,则需要大量的计算资源和存储空间,以保证贾维斯系统的准确性和效率。

值得一提的是,贾维斯系统非常强大,但官方给出的电脑最低配置要求是:

NVIDIA GeForce RTX 3090 显卡一张

16GB 内存 最低配置

42GB以上内存 理想配置

也就是说,如果能够解决训练语料的存储问题,或者训练方法有简化突破后,离线GPT甚至离线“贾维斯”也不无可能。

最后,AI的快速发展已经让各行各业感受到了“工具在进步”,甚至一部分人已经喊出“The future has arrived”,但这仍只是个开始,更多的技术创新和应用场景将会不断涌现,好戏还会逐渐上演。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65819.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HuggingGPT 刚刚开放了demo!在线演示效果惊艳

编|桃子 源|新智元 浙大&微软推出的HuggingGPT爆火之后,刚刚开放了demo,急不可待的网友自己上手体验了一番。 最强组合HuggingFaceChatGPT「贾维斯」现在开放demo了。 前段时间,浙大&微软发布了一个大模型协作…

舍百万年薪搞“大事情”,稚晖君的机器人 neZHa 现世!

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 说起科技圈的 KOL 、“天才少年”,稚晖君必须有名字! 稚晖君,作为一名在 B 站已有 236 万粉丝的 UP 主,在 2020 年时,他加入“…

小红书开店好做吗,需要注意什么

小红书作为一个受年轻人欢迎的社交媒体平台,通过社交化的方式让用户在交流的同时发现新的产品和品牌。既然有这么大的市场自然也会存在很大的竞争,今天,就来和大家分享一下小红书开店好做吗,那如果想在小红书上开店需要注意些什么…

手把手教你部署AutoGPT,30分钟拥有自己的AI助手!

如果不想往下看了,那就直接 点我。 AutoGPT是由GPT-4驱动的开源应用程序,可以自主实现用户设定的任务目标;从AutoGPT开始,AI将可以自主地提出计划,然后执行计划;还具有互联网访问、长期和短期内存管理、用…

iOS使用讯飞语音-语音识别(最新版)

引言 去年在一家公司实习,接触了一点人工智能。既然接触人工智能,那么语音识别、语音合成、人脸识别等等都是必不可少的。 本来已经是离开iOS开发这条路了,还剩下毕业设计要做,所以这段时间最后一次回来接触iOS了。 以后&#…

iOS 10:用 Speech 框架创建語音輸入 App

原文:http://www.appcoda.com.tw/siri-speech-framework/ 在 2016 WWDC 大會上,蘋果推出了可以用於語音識別的 Speech Kit 框架。實際上,Siri 就是用 Speech Kit 框架來進行語音識別的。其實現在已經有一些語音識別框架了,但它們…

android 讯飞语音评测,非同凡响的语音输入法——讯飞Android输入法评测

Android平台上的输入法实在是多得数不过来了,除了谷歌官方的输入法,还有老牌的搜狗等输入法以及后来的百度输入法等同样也在移动平台上大放异彩,可以说,如果再有人去开发输入法,如果不做出点差异化,那么几乎…

ios手机输入字母重复问题

今天写项目遇到一个奇葩问题,测试告诉我说,ios输入字母都是双份的,安卓没有这个问题。 刚开始我是这样写的,使用的oninput原生事件,身份证号只允许输入数字和字母,可是测试测完就说ios输入字母总是双份的&a…

苹果11微信表格服务器地址怎么填,苹果实用技巧:iPhone11手机微信打字怎么换行...

我们购买了苹果产品之后,我们未必就一定全部都了解苹果产品当中的一些功能如何去使用,那么这个时候如果我们不知道使用这些功能,那么产品的价值也就大打折扣了,所以我们务必是要了解到这些功能的使用,那么今天小编就给…

iphone之使用讯飞语音sdk实现语音识别功能

1、首先下载讯飞sdk及文档&#xff1a;http://open.voicecloud.cn/ 2、学习里面的demo简单实现了一个小的语音识别功能 先做一个简单demo&#xff0c;看看识别效果。注&#xff1a;语音识别必须联网。 所有接口必需在联网状态下才能正常使用。 效果图: #import <UIKit/UIK…

使用nodeJS中的WebSocket实现简单的聊天功能

思路整理 webSocket是服务器向客户端发送信息的一种手段 这里是 更多关于 webSocket 的内容 如果想要了解更多关于 nodeJS 中的webSocket内容&#xff0c;点击这里 开始之前&#xff0c;我们需要新建两个客户端和一个服务端&#xff0c; 服务端负责保存与客户端的连接并且在双…

node.js连接mysql出现错误

node.js连接mysql出现错误&#xff1a; ER_NOT_SUPPORTED_AUTH_MODE: Client does not support authentication protocol requested by server; consider upgrading MySQL client 目前是因为版本较高&#xff0c;最新的加密方式node还不支持 解决办法&#xff1a; 1、登录m…

GeneGPT:用领域工具增强大型语言模型,以改善对生物医学信息的访问

文章目录 一、论文关键信息二、主要内容1. Motivations2. 解决方案关键3. 实验和结果 三、总结与讨论 &#x1f349; CSDN 叶庭云&#xff1a;https://yetingyun.blog.csdn.net/ 一、论文关键信息 论文标题&#xff1a;GeneGPT: Augmenting Large Language Models with Domain …

怎么禁止计算机共享磁盘,访问限制,分享如何禁止别人访问你电脑的本地磁盘...

随着科技的快速发展&#xff0c;现在的小学生都用上手机了&#xff0c;更是有不少小孩子都会在电脑上玩游戏了&#xff0c;小学生玩LOL可是不少见。在小孩子玩电脑时&#xff0c;除了害怕他沉迷游戏&#xff0c;无心向学&#xff0c;还有就是担心熊孩子乱删电脑文件。如果误删了…

hosts配置 kentrl 网络禁止 访问

hosts禁止联网的工具 127.0.0.1 activate.navicat.com 127.0.0.1 syntevo.com www.syntevo.com #smartgit 127.0.0.1 release.gitkraken.com api.gitkraken.com GitKraken – 超好用的 Git 可视化工具 - 免费版本 “version”: “6.5.1”, “url_deb”: “https://release.axo…

QQ/微信里被禁止访问的网页怎么处理 被屏蔽的域名如何正常访问

最近越来越多的网站被微信的检测系统封杀&#xff0c;有的是确实违规&#xff0c;有的则是被误报了。出现这样的问题&#xff0c;网站的流量瞬间就清零了&#xff0c;对站长来说是天塌一样的打击&#xff0c;那我们有没有办法能够有效的防止域名被微信封杀呢&#xff1f; 一、先…

禁止访问某文件

1.web.config文件配置&#xff1a; 在Web.config文件 <system.web> <httpHandlers>添加一个节点 <system.web><httpHandlers><!--禁止访问IPData目录下的文本文件--><add path"IPData/*.txt" verb"*" type"System.…

用户登录 默认 计算机 用户文件,guest登录系统默认禁止guest访问本地计算机(组图)...

Win10共享文件夹&#xff0c;创建(启用)用户和共享文件&#xff0c;修改特定用户访问权限 内容 一、以访客身份登录 默认情况下&#xff0c;系统禁止访客访问本地计算机。如果允许访客用户访问&#xff0c;则需要进行以下设置&#xff1a; 1.打开访客账户。 图1.1 打开Guest用户…

禁止外部网络访问公司内网

PC0所在网段模拟公司内网&#xff0c;Server0模拟外部网络。 要求内网可以访问外部网络&#xff0c;但是外网不能连接内网 Router1 配置如下&#xff1a; interface FastEthernet0/0 ip address 192.168.10.254 255.255.255.0 duplex auto speed auto ! interface Serial2/0…

微信内链接已禁止访问是什么情况?微信链接防封细节

有时候我们在微信上浏览一些网址的时候会出现这样的情况,比如提示已停止访问该网页,其实提示这个也是为了广大用户的安全着想,毕竟有很多不法网址存在的,但是也由于错杀等原因导致打不开,点击链接提示已禁止访问几种原因是什么呢?那么碰到这种情况我们应该怎么做呢? 一…