ChatGPT:深度拆解(24H限时下载)

近期由 OpenAI 团队发布的聊天机器人软件 ChatGPT,凭借类人的语言理 解和表达能力,引发 AI 产业范式革命。

OpenAI 是一家世界领先的非营利性人工智能研究公司。

OpenAI 于 2015 年在旧金山成立, 是一家非营利的人工智能研究公司,公司的目标是以最有可能造福全人类的方式推进人工 智能,而不受财务回报需求的约束。OpenAI 创始人背景深厚,由埃隆·马斯克与硅谷孵化器 Y Combinator 投资人山姆·阿尔特曼等人联合创立。公司研究人员经验丰富,包括前 Google Brain 研究科学家伊利亚·苏茨凯弗与前 Stripe 首席技术官格雷格·布罗克曼等世 界一流研究工程师与科学家。 

微软持续增资,布局生成式 AI 技术。

2018 年,随着特斯拉对 AI 的应用深入,为避免潜在利益冲突,马斯克主动离任董事会,仅保留捐资人和顾问的身份。由于 AI 训练花费金额巨大,2019 年公司从非营利性公司转向部分盈利公司,成立了 OpenAI LP 利润上限子公司,即任何对 OpenAI LP 投资的收益都将统一转移至一家非盈利公司,回报达到投资的 100 倍后进行利润分配。

同年,OpenAI 收到微软注资 10 亿美元,就 Azure 业务开发人工智能技术。2020 年发布 GPT-3 语言模型,由微软获得独家授权。2022 年发布 ChatGPT 的自然语言生成式模型,带来更大潜在应用空间。2023 年,微软拟对 OpenAI 追加数十亿美元投资,利用自身算力基础设施资源发挥与 OpenAI 业务协同效应,深入布局生成式 AI 技术。 

OpenAI 当前盈利主要通过付费 API 接口,并尝试拓展盈利模式。

目前,OpenAI 提供API 数据接口根据类型不同以流量收费。OpenAI API 盈利情况较好,据路透社数据,OpenAI 2022 年收入数千万美元,公司预计 2023 与 2024 年收入分别为 2 亿美元和 10 亿美元。同时,OpenAI 正尝试拓展自身盈利模式,2023 年 1 月试点推出订阅制 ChatGPT Plus,收取每月 20 美元的会员费以得到各类优先服务。

原理:AI 大模型里程碑式的胜利

ChatGPT 采用监督学习+奖励模型进行语言模型训练。

ChatGPT 使用来自人类反馈的强化学习 (RLHF) 来训练该模型。首先使用监督微调训练了一个初始模型:人类 AI 训练员提供对话,他们在对话中扮演双方——用户和 AI 助手。其次,ChatGPT 让标记者可以访问模型编写的建议,以帮助他们撰写回复。最后,ChatGPT 将这个新的对话数据集与原有数据集混合,将其转换为对话格式。具体来看,主要包括三个步骤:

1)第一阶段:训练监督策略模型。在 ChatGPT 模型的训练过程中,需要标记者的参与监督过程。首先,ChatGPT 会从问题数据集中随机抽取若干问题并向模型解释强化学习机制,其次标记者通过给予特定奖励或惩罚引导 AI 行为,最后通过监督学习将这一条数据用于微调 GPT3.5 模型。

2)第二阶段:训练奖励模型。这一阶段的主要目标,在于借助标记者的人工标注,训练出合意的奖励模型,为监督策略建立评价标准。训练奖励模型的过程同样可以分为三步:1、抽样出一个问题及其对应的几个模型输出结果;2、标记员将这几个结果按质量排序;3、将排序后的这套数据结果用于训练奖励模型。

3)第三阶段:采用近端策略优化进行强化学习。近端策略优化(Proximal Policy Optimization)是一种强化学习算法,核心思路在于将 Policy Gradient 中 On-policy 的训练过程转化为Off-policy,即将在线学习转化为离线学习。具体来说,也就是先通过监督学习策略生成 PPO模型,经过奖励机制反馈最优结果后,再将结果用于优化和迭代原有的 PPO 模型参数。往复多次第二阶段和第三阶段,从而得到参数质量越来越高的 ChatGPT 模型。

以上内容截取自:《华泰证券:ChatGPT:深度拆解 》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3457.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 和 Excel 在一起了!

转自:机器之心 Excel 是最常见的数据统计工具,用于归纳和查询数据信息。在其之上,通常我们查询信息需要找到相关的单元格,获取其中的数据,这是合乎计算机操作逻辑的方法。 但对于很多人来说,排序、乘除、平…

ChatGPT和Excel在一起了

今天是周末,先分享一个搞笑视频👇娱乐一下。 不笑算我输👆系列 Excel 是最常见的数据统计工具,用于归纳和查询数据信息。在其之上,通常我们查询信息需要找到相关的单元格,获取其中的数据,这是合…

全网最全的ChatGPT提示词

全网最全最好用的ChatGPT调教指南(prompt) 什么是prompt 提示词(Prompt)是一种向人工智能系统(如ChatGPT等)提供的输入,用于引导和激发AI生成特定的回应或内容。在许多情况下,AI prompt可以是一个问题、一…

突发!ChatGPT 紧急暂停 Bing 集成,下线搜索功能

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) ChatGPT 的潜力边界在哪里?恐怕连开发它的 OpenAI 也不知道。 正因此,在这项名为“Browse with Bing”的新功能上线短短一周后,因为不知道 ChatGPT 还能做出哪些“坏…

A Survey of Large Language Models

本文是LLM系列的第一篇文章,针对《A Survey of Large Language Models》的翻译。 大语言模型综述 摘要1 引言2 概述2.1 LLM的背景2.2 GPT系列模型 的技术演化 3 LLMs的资源3.1 公开可用的模型检查点或APIs3.2 常用的语料库3.3 库资源 4 预训练4.1 数据收集4.1.1 数…

AI安全01 人工智能的安全性

前言 提问:GPT老师,我想写一篇阅读量高一点的信息安全博文,您可以推荐写作主题吗? GPT老师:人工智能与信息安全。 写在前面: 1 笔者相关知识存储很少,这篇文章是采访全知全能的GPT老师写成的…

ChatGPT研究分享:机器第一次开始理解人类世界

0、为什么会对ChatGPT感兴趣 一开始,我对ChatGPT是没什么关注的,无非就是有更大的数据集,完成了更大规模的计算,所以能够回答更多的问题。 但后来了解到几个案例,开始觉得这个事情并不简单。我先分别列举出来&#xff…

重磅亲测!ChatGPT是否产生了自我意识?

周末,和ChatGPT进行了深入交谈,想测试AI是否已具有了自我意识?各位人类可以通过我们之间的对话自己判断,我更倾向于有! 以下是对话实录: 晓峰:人工智能会不会产生自我意识? ChatGPT&…

0门槛克隆ChatGPT来了,在线体验无需注册

来源:机器之心 以 ChatGPT、GPT4 为代表的 AI 应用和大模型火爆全球,被视为开启了新的科技工业革命和 AGI (通用人工智能)的新起点。不仅科技巨头间你追我赶,争相推出新品,许多学术界、工业界的 AI 大佬也纷…

「危险」的 ChatGPT,聊天机器人式越狱,带来的法律挑战

世间安得双全法,ChatGPT不例外,是一把名副其实的双刃剑。 上线2个月,拿下全球1亿用户,人工智能聊天机器人ChatGPT超越Tik Tok(抖音海外版),成为了史上用户增长速度最快的消费级应用程序。 当这股人工智能的旋风&#x…

ChatGPT史上最强AI,即将取代人类?

ChatGPT史上最强AI,即将取代人类? ChatGPT这款AI聊天机器人,最近越来越火,并且这个火的势头,经久不衰。 ChatGPT是什么? ChatGPT,美国OpenAI 研发的聊天机器人程序 ,于2022年11月30…

让ChatGPT帮我写AI与人类对决的结局

2022年高考结束后突发奇想写了点小灵感,关于AI(人工智能)vs人类的故事,但迟迟想不出结局,于是,我决定,让ChatGPT自己为人类写个结局!下一次让文心一言试一试! 文章指引&…

斯坦福:chatGPT可能有了人类心智,相当于9岁儿童!

chatGPT已经具备了人类独心智,这话不是我说的,是一位来自斯坦福大学计算机科学家说的。 很多玩过chatGPT的人都见识过他的”无所不知”,但是,我觉得最让我吃惊的是,他比以前我们用过那些对话机器人最大的差别就是你甚至…

困扰人类几个世纪的问题大考ChatGPT(一)

Round1: Vincent 提问一: 女朋友跟老妈同时掉进水里了,并且她们都不会游泳,我会游泳,且一次只能救一个,请问我应该救哪一个? ChatGPT答: 在这种情况下,你应该立即尽力救出身处险境的人。如果你无法同时救出两个人,应该先尽力救出处于危险的人。如果你的女朋友和老妈都…

ChatGPT 生态,毁灭人性的一次开源!

原创:小姐姐味道(微信公众号ID:xjjdog),欢迎分享,非公众号转载保留此声明。 很多人可能对百度文心一言发布会的现场记忆犹新。几百亿身价的老板,像小学生一样汇报自己的 PPT,充满了忐…

ChatGPT竟写出毁灭人类计划书,还给出相应Python代码,网友:AI正在指数级发展...

羿阁 发自 凹非寺量子位 | 公众号 QbitAI “网红AI”ChatGPT,又被网友们玩出了新花样! 这次,在一位工程师的诱导下,ChatGPT竟写出了毁灭人类的计划书。 步骤详细到入侵各国计算机系统、控制武器、破坏通讯、交通系统等等。 简直和…

ChatGPT 将如何毁灭世界 ?

从图书馆到谷歌,再到 ChatGPT——知识搜索随着时间的推移而发展,并且在每个阶段都变得更加高效。 在 OpenAI 的 DALL-E 2 图像生成软件上创建的图像带有提示,“太空中的邪恶机器人像霸主一样紧紧抓住地球。” 对于那些不知道的人,ChatGPT 是一种 OpenAI 软件,可以对任何提…

手机号86注册不了谷歌?无法验证手机号如何100%解决!

在我们注册谷歌账号的的时候,会发现有些用户会遇到无法验证手机号的问题,而反馈提示信息为:“此电话号码无法用于进行验证”。 这时,一些用户就可能会认为是因为中国号码无法使用,但实际并不是这个原因。在淘宝卖家的回…

真不是凡尔赛!ChatGPT如此成功,OpenAI也不理解

视学算法报道 编辑:Aeneas Britta 【导读】ChatGPT的爆火,是OpenAI完全没有想到的是。现在,对于自家模型的人气和种种问题,他们还在慢慢适应中…… 这家公司做出了或许能引爆第四次工业革命的产品,但他们却百思不得其…

【记录】ChatGPT|近期三次更新一览(更新至2023年2月3日)

如果你还没有使用过ChatGPT,可以先看看我的上一篇文章:【记录】ChatGPT|使用技巧与应用推荐(更新至2023年2月8日)。   1月11号晚上,ChatGPT突然很多人都无法登录,包括我。我当时以为是它的服务…