通用人工智能综述 从背景介绍到API调用

通用人工智能综述

  • 通用人工智能综述
    • 背景介绍
      • 模型演进
      • 之前的模型的问题
      • 学习三阶段
      • 数据组织和效果评估
    • 注册
    • API调用
    • 官方提供的模型
    • 官方功能汇总
    • Notion
    • 元语AI
    • 指令汇总

通用人工智能综述

背景介绍

ChatGPT是一个通用功能型助手。2022年12月5日,OpenAl首席执行言Sam Altman在社交媒体上发文称,ChatGPT推出五天,已突破100万用户。Al聊天机器人ChatGPT爆火出圈,已成为一个标志性事件。微软正洽谈100亿美元增持股份,并很快将其整合到微软云中。

请添加图片描述

上图中展示了两个例子,展现出了惊人的效果。
ChatGPT之所以这么受欢迎,—方面是由于其理解用户意图的能力和生成的效果比较好;另—方面,通过对话机器人的形式,使得人人都能使用。
下面将从模型演进、最初模型存在的问题、ChatGPT模型学习的三个阶段、训练 ChatGPT模型的数据组织和效果几个方面进行介绍。

模型演进

ChatGPT技术也经过了几代模型的演进,最初的 GPT模型是在2018年提出的,模型参数只有1.17亿; 2019年的时候GPT-2模型参数是15亿;到了2020年 GPT-3模型参数达到了1750亿;通过几代的模型更新迭代,到2022年出现了ChatGPT模型。
在这里插入图片描述

之前的模型的问题

在ChatGPT模型出来之前的模型存在什么样的问题呢?通过分析发现存在的一个比较显著的问题是对齐问题,虽然大模型的生成能力比较强,但是生成的答案有时候不符合用户意图。通过研究发现造成对齐问题出现的主要原因是语言模型训练的训练目标是预测下一个词,而不是按照用户意图来生成。为了解决对齐问题,在训练 ChatGPT模型过程中加入了基于人类反馈的强化学习( Reinforcement Learning from HumanFeedback,RLHF)过程。

学习三阶段

ChatGPT模型的训练过程是按照三步骤走的形式进行的。

  • 第—步是在GPT模型基础上使用真实用户的输入进行监督学习,在这个过程中数据来自真实用户,数据质量比较高也比较宝贵。
  • 第二步是训练一个奖励模型,对于一个query通过不同模型会产生不同的输出结果,标记者对所有模型的输出结果进行一个排序,用这些排序后的数据训练奖励模型。
  • 第三步是把模型生成的初步答案输入到奖励模型当中,奖励模型会对这个答案进行一个评价,如果生成的答案符合用户的意图就给一个正向的反馈,否则就给一个负向的反馈,从而把模型调教的越来越好,这就是引入强化学习的目的,使得生成的结果更符合人类的需要。训练ChatGPT模型过程中三步走的过程如下图。

在这里插入图片描述

数据组织和效果评估

在这里插入图片描述

在训练模型之前我们需要准备好所用的数据集,在这个过程中就会遇到数据冷启动的问题,可以通过以下三个方面来解决:

  • 搜集旧系统用户使用的数据集
  • 让标注人员根据之前真实用户输入的问题标注一些相似的prompt和输出
  • 数据标注人员从问答、写故事、生成等自己想的一些prompt。

训练ChatGPT模型的数据包含三部分数据集(77k真实数据)∶

  • 基于真实用户prompt的监督学习数据,用户prompt,模型response,数据量有13k。
  • 用于训练奖励模型的数据集,这部分数据对于—个prompt对应多个response的排序,数据星有33k。
  • 基于奖励模型使用强化学习技术进行模型训练的数据集,只需要用户prompt,数据量有31k,对质量要求较高。

完成ChatGPT模型训练后,对于模型的评价也是比较充分的,主要从以下几个方面来评价:

  • 模型生成的结果是否符合用户的意图
  • 生成的结果能不能满足用户提到的约束
  • 模型在客服领域能否有好的效果

注册

API调用

在这里插入图片描述

import openai
import osopenai.api_key = "sk-FsC9DyyuwbnqrxW7VoOhT3BlbkddffffbdOUrZJk85yWDIQ"
#代理
os.environ["http_proxy"] = "127.0.0.1:19580"
os.environ["https_proxy"] = "127.0.0.1:19580"Prompt_52CV = """
请写一段Python程序,实现从文件夹test读取所有png格式图像,
检测图片是否含有猫和狗,如有,请把该图片保存到文件夹train中。
注意:
1.请使用开源的目标检测算法,如需要安装软件,请说明使用pip的安装命令。
2.程序运行时,请打印每张图片处理的时间,程序运行的最后,需要统计有多少张图片检测到猫和狗,并统计运行总计用时。
3.需要考虑到文件读取和写入失败的异常判断,如果出现异常,需给出提示。
4.请以python代码的格式输出。
"""Answer = openai.ChatCompletion.create(model="gpt-3.5-turbo",temperature=0,max_tokens=3000,top_p=1,frequency_penalty=0,presence_penalty=0,messages=[{"role": "system", "content": "You are a useful assistant."},{"role": "user", "content": Prompt_52CV}]
)# print the completion
print(Answer)f = open('test-chatgpt-52cv.py','w',encoding='utf-8')
print(Answer["choices"][0]["message"]["content"].strip(" \n"),file=f)f.close()

官方提供的模型

MODELSDESCRIPTION
GPT-3.5一组改进 GPT-3 的模型,可以理解并生成自然语言或代码
DALL·E可以在给定自然语言提示的情况下生成和编辑图像的模型
Whisper可以将音频转换为文本的模型
Embeddings一组可以将文本转换为数字形式的模型
CodexLimited beta一组可以理解和生成代码的模型,包括将自然语言转换为代码
Moderation可以检测文本是否敏感或不安全的微调模型
GPT-3一组可以理解和生成自然语言的模型

官方功能汇总

https://platform.openai.com/examples

Notion

https://www.notion.so/
在这里插入图片描述

元语AI

https://www.cluebenchmarks.com/clueai.html
在这里插入图片描述

指令汇总

https://mp.weixin.qq.com/s?__biz=MzkxMzM3NzA1NA==&mid=2247484091&idx=1&sn=a6a720bdbc027186ee5bff0117db8735&chksm=c17fd0caf60859dc527b6332401d139d40ad55d3be51f2641c283fd8c5cfcf72acd3c0136f35&token=539485804&lang=zh_CN#rd

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65909.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聚观早报 | 腾势D9用户一半来自原BBA车主;Windows7将彻底退出

今日要闻:App Store创下超3200亿美元营收;腾势D9用户一半来自原BBA车主;微软洽谈100亿美元增持 OpenAI;Windows 7将彻底退出历史舞台;马斯克财富缩水破吉尼斯世界纪录 App Store创下超3200亿美元营收 1月11日消息&am…

Razorpay 印度第三方支付机构 Razorpay 支付,放款,还款实际操作

Razorpay 作为印度本土的一家支付公司,类似中国的支付宝 微信,本篇记录一下对接印度第三方支付公司进行放款,收款操作 先看下支付,上面的截图是整个付款流程 第一步就不说了,这个公司会开好,然后会拿到一个…

海外新兴热点 : Social Token 及该类代币汇总

创新项目分成两种,一种为既定命题提供解决方案,比如 L2,或者各种 AMM,依靠技术的发展轨迹就能对这类项目进行价值判断。另一种是为了提出命题的,比如比特币提出了我们是否需要去中心化货币,这类项目在早期还…

全球银行业巨头汇丰银行在印度推出基于代币化的应收账款系统

点击上方 “蓝色字” 可关注我们! 暴走时评: 根据6月18日的公告,全球主要银行集团汇丰银行已在印度企业客户的应收账款基础设施中落实了数字应收账款工具(HSBC DART),该工具基于澳大利亚的区块链金融科技公…

【如何通过外汇牌价了解外汇市场?​】

从中国人民银行的外汇价格来看,外汇市场的外汇价格是指外汇交易的中间价格,是外汇市场交易的计算基准。对于投资、金融管理或进出口贸易,必须实时了解外汇价格。在中国,汇率的中心价格每天由中国人民银行公布。 第一,外…

什么伦敦银交易软件支持多国语言

MT4在全世界都被广泛地使用,很多伦敦银投资者都对它十分熟悉,但并不是很多人知道MT4也支持众多的语言界面,不同地区的投资可以自行选择,如果大家下载MT4后发现默认的语言不是自己的使用习惯,可以按以下的方式进行切换&…

Nostro Account 本国银行在外国银行持有的外币账户

2019独角兽企业重金招聘Python工程师标准>>> DEFINITION OF NOSTRO ACCOUNT A bank account held in a foreign country by a domestic bank, denominated in the currency of that country. Nostro accounts are used to facilitate settlement of foreign exchang…

Coinbase将平台用户帐户链接到其钱包应用

点击上方 “蓝色字” 可关注我们! 暴走时评: 根据3月12日的公告,Coinbase最近推出了一项服务,将其平台上的用户帐户与其钱包应用程序相关联。 据该公司称,Coinbase Wallet与其网站Coinbase.com应用程序略有不同。对于后…

MT4如何使用软件开展自动交易详细步骤

要在MT4上进行自动交易,您需要使用专门设计的交易机器人程序或EA(Expert Advisor)。以下是使用MT4软件下载(www.cifco8.cn/mt4.html)开展自动交易的一般步骤: 编写或购买一个EA程序,并将其导入到MT4。 在MT4图表上选择…

通过在 BlockBank APP V2 版本持有 USDCoin 来赚取收益

BlockBank 为用户提供能够赚取稳定币 USD Coin (USDC) 利息收益的服务,利率高达美国全国传统储蓄账户平均水平的 60 倍。 最重要的是,用户的 USDC 由 BlockBank 担保,确保用户赚取收益。随着今年第三季度,BlockBank APP V2版本更新,用户将能够查看自己的实时投资组合并接…

报告:使用加密货币进行跨境汇款的人数越来越多

点击上方 “蓝色字” 可关注我们! 暴走时评: 区块链研究公司Clovr在其最新报告中表示,使用加密货币进行汇款的人数激增。大部分原因是因为使用Paypal等传统方法成本太高。世界银行数据显示,2017年有超过1480亿美元从美国汇往国外。…

MultiBank Group宣布在阿联酋和新加坡取得两项新牌照

全球首屈一指的金融衍生品机构MultiBank Group宣布,其子公司已获得阿联酋证券和商品管理局(“SCA”)和新加坡金融管理局(“MAS”)颁发的备受业界推崇的新牌照,巩固了该集团作为全球受监管最多经纪商的地位。 自成立以来,MultiBank Group一直…

中国四大银行正在大规模内测数字货币APP|可凭手机号完成转账

数字货币由央行牵头进行,各家银行此前数月正在就落地场景等进行测试。目前,部分大行内部员工已经开始使用,用于转账、缴费等场景。 “数字货币”在我国落地的脚步声越来越近。 数位国有大行人士表示,正在深圳等地大规模测试数字钱…

好汇阁外汇MT4-API多账户跟单交易管理系统介绍

1.软件简介 1.1 MT4 跨平台api多帐户云跟单管理系统 MT4 跨平台多帐户云跟单管理系统是国际先进的跨平台多账号本地跟单管理系统!支持全球所有的 MT4 交易软件的经纪商。不需要经纪商开放任何权限,不需要 API 接口,不需要 EA 插件&#xff…

利用百度情感分析进行微博评论数据分析及可视化(万字长文)

总览: *输入:*关键词 *输出:*分日期情感均值折线图,主题词云,分省市情感均值折线图 一、微博数据爬取 1.爬取指定关键词相关的微博 2.根据爬取到的微博信息爬取到相关的评论数据 这里主要借鉴了 https://github.com/…

神网站PaperWithoutCode:举报无法复现的论文,让一作社死??

文 | 小戏 几乎是可以肉眼可见的看到机器学习领域的论文几何级的增长,在铺天盖地的论文雪花纸片般涌来时,灌水、可复现性、工作真实的意义这些概念也伴随着 Paper 的洪水进入了人们的视野。谈及科研,我们总是站在以往研究的基础上&#xff0c…

微博评论数据爬取以及分析

#不许你没看过の系列!# 吹爆最近的国漫《哪吒之魔童降世》 从故事情节、角色设计到特效处理 都非常牛!!! #连海报都好好看啊# 上映首周票房已经达到14.1亿! 打破国漫票房记录! 豆瓣评分达到8.6分&…

【写博客常用】论文代写代发的骗局之我是如何查骗子的ip地址的

【写博客常用】论文代写代发的骗局之我是如何查骗子的ip地址的 说明说明说明!!!遇到了骗子制作一个小的端口调用程序放到服务器上上传文档引诱骗子上钩然后就没有理他了查看上传文档查询位置 说明说明说明!!&#xff0…

推荐一个查询研究者方向和影响力的网站| 也可以查询杂志是否有专刊开放

查询一个科学家,Ralph Bock发表的文章总数,总引用数,世界排名,国家排名,学科内 H-index (D-index) D-index (Discipline H-index) only includes papers and citation values for an examined d…

吴恩达:AI 在2022年创造了这些奇迹

作者 | 吴恩达 翻译 | 核子可乐 策划 | 刘燕 吴恩达在圣诞节当天发布了一年一度的年终盘点,他从纯技术的角度出发,回顾 AI 科技在 2022 年创造出的那些奇迹。在过去的一年,AI 技术取得了巨大进步,生成…