文心千帆为你而来

1. 前言

3月16号百度率先发布了国内第一个人工智能大语言模型—文心一言。文心一言的发布在业界引起了不小的震动。而文心一言的企业服务则由文心千帆大模型平台提供。文心千帆大模型平台是百度智能云打造出来的一站式大模型开发与应用平台,提供包括文心一言在内的文心大模型服务,支持大模型(含第三方)定制开发,生产专属大模型,提供覆盖全生命周期的大模型工具链。文心千帆大模型平台接入客户业务系统可以丰富多种应用场景,包括但不限于智能问答,内容创作,产品营销,代码编写,人员培训等等。下图详细展示了文心一言大模型和文心千帆大模型平台的的关系。

文心千帆大模型平台

让人欣喜的是,百度智能云已面向企业和个人客户开放文心千帆大模型平台公有版测试服务(官方申请地址:https://cloud.baidu.com/survey/qianfan.html);

文章目录

    • 1. 前言
    • 2. 试用文心千帆大模型平台
    • 3. 文心千帆大模型调优
      • 3.1. 准备数据集
      • 3.2. 创建调优任务
      • 3.3. 发布模型
      • 3.4. 再次体验效果
    • 4. 总结

2. 试用文心千帆大模型平台

  1. 申请文心千帆大模型体验

    官方申请地址:https://cloud.baidu.com/survey/qianfan.html

    在访问官方申请地址时,需要填写相关信息,如公司名称、联系人、联系电话等。提交申请后,百度智能云的工作人员将在三小时内审核申请信息。审核通过后,用户将获得文心千帆大模型平台公有版测试服务的使用权限。

    image-20230717192100019

    点击去使用,系统会默认选中ERNIE-Bot,ERNIE-Bot-turbo,BLOOMZ-7B以及Embedding-V1四个大模型。

    其中:

    1. ERNIE-Bot是百度自行研发的大语言模型,覆盖海量中文数据,具有更强的对话问答、内容创作生成等能力。
    2. ERNIE-Bot-turbo是百度自行研发的大语言模型,覆盖海量中文数据,具有更强的对话问答、内容创作生成等能力,响应速度更快。
    3. BLOOMZ-7B是业内知名的⼤语⾔模型,由HugggingFace研发并开源,能够以46种语⾔和13种编程语⾔输出⽂本。
    4. Embedding-V1是基于百度文心大模型技术的文本表示模型,将文本转化为用数值表示的向量形式,用于文本检索、信息推荐、知识挖掘等场景。

    点击下一步开通服务。

    image-20230717192245948

  2. 创建应用

    开通服务之后,首先,我们需要创建一个自己的应用,接着调用API服务。如下图我这边创建了一个名称为 test_qianfan的应用。应用类型选择为 游戏娱乐。

    image-20230717153446542

    文心千帆提供了三种服务方式,第一种是直接在线测试,第二种就是使用示例代码,第三种就是直接调用API接口

  3. 直接在线测试

    访问 https://ai.baidu.com/wenxinworkshop/app/ais/console/onlineTest 即可在线体验服务,在线体验不需要调用任何API接口即可使用。我们可以让文心千帆用Python写一个冒泡排序算法,如下图所示:

    image-20230717194857805

    这里参数配置中可以选择不同的大模型服务,也可以选择不同的应用。当然你也可以创建一个Prompt模板,以便后期快速使用。

  4. 使用示例代码

    如果你想接入API接口服务,但是编程功底又不是很扎实的话,那么可以试下百度智能云提供的示例代码中心 的功能。

    image-20230717194144837

    这里选中文心千帆大模型平台,这里按照接入步骤给出不同接口的接入示例,直接可见即可得。例如千帆大模型的接入步骤是首先是调试 鉴权认证机制---->获取AccessToken,接着就是根据不同的语言模型调试不同的接口。

  5. 调用API接口

文心千帆大模型平台提供了在开发文档中提供了详细的API调用指南。

  • 获取AccessToken

    import requests
    import jsondef main():url = "https://aip.baidubce.com/oauth/2.0/token?client_id=uvtkhfi4yU6Y81EwKo05gWlC&client_secret=CavUZ7yhXI0LoYfWLziUZ7rN5b5mfY0v&grant_type=client_credentials"payload = json.dumps("")headers = {'Content-Type': 'application/json','Accept': 'application/json'}response = requests.request("POST", url, headers=headers, data=payload)print(response.text)if __name__ == '__main__':main()
    
    
    
  • 调用ErnieBot-turbo模型

import requests
import jsonAPI_KEY = "uvtkhf****05gWlC"
SECRET_KEY = "CavUZ7****5mfY0v"def main():url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/eb-instant?access_token=" + get_access_token()payload = json.dumps({"messages": [{"role": "user","content": "作为一个专业的python老师,请检查下面的代码有哪些错误, 代码如下: \\n for in in range(n): \\n检查的错误如下:\n"},{"role": "assistant","content": "在Python中,使用`for`循环遍历一个列表或可迭代对象时,不需要使用`in`关键字,因为`for`循环已经包含了遍历的功能。\n\n所以,您的代码可以修改为:\n\n\n```python\nfor i in range(n):\n    # 在这里编写你的代码\n```\n另外,请注意`range`函数的参数,它应该是从0开始到n-1结束的整数,即`range(n-1)`。"}]})headers = {'Content-Type': 'application/json'}response = requests.request("POST", url, headers=headers, data=payload)print(response.text)def get_access_token():"""使用 AK,SK 生成鉴权签名(Access Token):return: access_token,或是None(如果错误)"""url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}return str(requests.post(url, params=params).json().get("access_token"))if __name__ == '__main__':main()

3. 文心千帆大模型调优

大模型调优实际上是Fine-Tuning的训练模式,开发者可以选择适合自己任务场景的训练模式并加以调参训练,从而实现理想的模型效果。大模型调优的入口如下:https://ai.baidu.com/wenxinworkshop/app/train/tuning/list

image-20230717192511100

我从事的是教育类的产品开发,我们产品中有很重要的一块功能就是在线编程功能,其主要是图形化编程和python编程。老师发布一个编程任务之后,学生们在平台上通过编程的方式来实现老师发布的编程任务。

在没有大模型辅助的情况下,学生提交的编程作业都需要老师人工检查批改。 老师一行行代码的检查存不存在语法错误,有没有运行时错误,存不存在不文明的语言,有没有实现编程目标,再根据检查的结果给出相应的评分。

在有了大模型之后,我们就可以借助大模型来辅助老师检查学生的编程作业。首先,就是开通大模型训练。这里我选择的是ERNIE-Bot-turbo大模型公有云训练服务-SFT-全量更新。全量更新可以在训练过程中对大模型的全部参数进行更新。

image-20230717200916015

大模型的调优步骤主要就三步:

  1. 准备数据集

    数据集是模型训练的根源,没有数据集或者说数据集过少都会影响模型训练的效果。文心千帆的数据集是以json文件的格式导入的。

  2. 创建调优任务

    创建调优任务,利用准备好的训练数据及平台提供的预训练大模型,训练自己的大模型。

  3. 发布模型

    完成调优后,可以发布训练后的模型,或继续在RLHF训练过程对模型继续训练。

3.1. 准备数据集

点击创建数据集,输入数据集名称,就进入了导入配置。在导入配置页面中,数据标注状态分为:无标注信息和有标注信息,两者的区别是无标注信息只有prompt,而有标注信息不仅有prompt还有response。

导入方式支持本地导入,BOS目录导入,导入格式是JSONL文件。文件内单条数据格式要求为[{"prompt" : "prompt内容","response": [["response内容"]]}]

image-20230717222729861

先下载数据样例,然后在按照数据样例造自己的数据集。这里我根据官方给出的数据样例造出来了我自己的数据集。这里需要注意的是数据集的条数最少要达到32条,不然模型无法启动训练。如下图所示:

image-20230717222454283

每一组的数据内容都类似于:

[{"prompt": "作为一个专业的python老师,请检查下面的代码有哪些错误, 代码如下:  \n print("张三"+1) \n检查的错误如下:", "response": [["第一行字符串拼接错误"]]}]

数据集文件导入成功之后,我们就可以在列表页发布此数据集。只有状态是已发布的数据集,才能被大模型所引用。

image-20230717211559711

image-20230717211933252

3.2. 创建调优任务

数据集准备好之后,我们就可以创建调优任务,让大模型运行数据集进行训练。这里我创建了一个代码检错的调优任务。

image-20230717201239521

在数据配置那一栏选择的数据集就是我们在前面发布的数据集。

image-20230717210816995

image-20230717212034260

调优任务配置好之后点击确认就进入了任务执行页面。

image-20230717212055122

这里我的调优任务一共执行了26分钟才运行完成。

image-20230717215536676

3.3. 发布模型

模型运行完成之后就可以点击 发布,对这个模型进行发布了。

image-20230717215718339

模型发布成功之后就就可以将此模型部署到百度公有云的环境中,部署的过程由于费用的问题在此没能体验。

image-20230717220437249

3.4. 再次体验效果

image-20230717224517551

image-20230717224531868

4. 总结

今天我花了一天的时间好好体验了一下文心千帆大模型平台,整个体验过程对我来说非常好。千帆大模型平台上手非常容易,操作界面对使用者友好。

让我感觉很棒的地方主要体现在如下几个方面。

  1. 完备详尽的开发文档:https://cloud.baidu.com/doc/WENXINWORKSHOP/index.html 基本上在使用中有任何困惑都可以在开发文档中找到答案。
  2. 操作界面友好:文心千帆的操作台划分为 数据服务,大模型训练,大模型管理,大模型服务这四大块,哪怕是没有接触过大模型的小白也能很快上手。
  3. 接入简单:接入文心千帆大模型平台是如此的简单,只需要简单的调两个接口就可以了。
  4. 功能全面:文心千帆提供了各种AI开发工具和整套开发环境,用户可以轻松使用和开发自己的大模型应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28836.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第二弹进阶吴恩达 ChatGPT Prompt 技巧

第一弹笔记在这里: 总结吴恩达 ChatGPT Prompt 免费课程 今天分享第二弹,进阶篇。 第一点,任务序列化。 通常看完一篇长文,脑子里往往充满无数疑问。急切想知道所有答案,必须列一个问题清单。对话式问法,对…

CVPR2023论文速递(2023.3.22)!已接入ChatGPT总结!共31篇!

整理:AI算法与图像处理 CVPR2023论文和代码整理:https://github.com/DWCTOD/CVPR2023-Papers-with-Code-Demo 欢迎关注公众号 AI算法与图像处理,获取更多干货: 大家好, 最近正在优化每周分享的CVPR论文, 目前考虑按照不同类别去分…

Python与ChatGPT

Python的用途非常广泛,很多应用场景都可以使用 python 来满足自己的需求,比如自己平常使用 Python 来做网络应用后端开发、做批量处理小工具、做测试软件等,而目前非常热门的 ChatGPT 也与 python 有很大的关系。 据了解,在ChatG…

IOS越狱---checkra1n windows系统越狱

本篇教程适用小白初次越狱,无高阶操作,大佬请止步,本篇教程可能没有任何能学习的地方,以下问题如有不清楚的地方欢迎加微信 vaintech讨论交流 首先介绍所需要的工具 一支U盘(2g以上)一台电脑要被越狱的手…

【iOS逆向】某App越狱检测

1.目标 此篇文本为入门文章,大家莫抱过多期望。此文章的目的是教大家如何从UI入手,去定位自己想要的东西。 2.操作环境 mac系统 frida-ios-dump:砸壳 已越狱iOS设备:脱壳及frida调试 IDA Pro:静态分析 3.流程 …

Chat-GPT 聚合平台 Poe:集成多个 AI 聊天机器人

Chat-GPT 聚合平台 Poe:集成多个 AI 聊天机器人 介绍 Poe 是知名问答社区 Quora 推出的 AI 平台——开放探索平台 (Platform for Open Exploration, Poe)。Poe 集成了多个基于大型语言模型的聊天机器人,包括 ChatGPT,以及 Sage、Claude、Dr…

越狱手机如何让APP绕过越狱检测

当你越狱之后,某些APP检测到你越狱后,一些功能就会被禁用,比如微信、支付宝的指纹支付,下面这款插件就会帮你绕过越狱检测,正常使用APP里面的所有功能。 文章目录 1. 环境2. Cydia简介3. 过程(Liberty为例)3.1. 添加添…

完美越狱来了,unc0ver 更新 7.0.0 版本,但是别着急冲

说起完美越狱, 仿佛是很久的事情了。 时隔多年,完美越狱终于来了。 Fugu14 完美越狱发布,unc0ver 7.0.0 版本发布。 完美越狱 先说说事情起因、经过、结果。 9月01日,开发者 Linus Henze 演示了 iOS 14.5.1 完美越狱的视频。…

iOS“远程越狱”间谍软件Pegasus技术分析

关注我的博客,访问更多内容! 背景:通过研究发现,用户点击短信内的链接后,攻击者就会利用3个0day漏洞,对用户手机“远程越狱”,然后安装间谍软件,随后就能对设备进行全面控制&#x…

20、Theos越狱调试Wallet

前面的总结中使用砸壳重签后的App进行调试,本篇在越狱环境下不重签App进行调试,但是还是需要砸壳获取Headers. 一、Cycript 1.1 在越狱环境中使用Cycript 在越狱环境上,安装Cycript插件.需要先安装adv-cmds插件,因为被Cycript插件所依赖、在Cydia中,安装Cycript 在设备中找到…

用上这几个开源管理系统做项目,领导看了直呼专业!

大家好,我是宝哥! SCUI Admin 中后台前端解决方案 SCUI 是一个中后台前端解决方案,基于 VUE3和 elementPlus 实现。使用最新的前端技术栈,提供各类实用的组件方便在业务开发时的调用,并且持续性的提供丰富的业务模板帮…

chatgpt赋能python:用Python自动答题,助你轻松应对各种考试

用Python自动答题,助你轻松应对各种考试 Python作为一门高效简洁的编程语言,被广泛运用于数据分析、Web开发等领域。同时,它也可以被用来进行自动化任务,例如自动化答题。这篇文章将介绍如何用Python自动答题,并提供一…

7分钟环游地球!ChatGPT开启时空传送门,输入地址一秒穿越

v 新智元 新智元 2023-05-20 21:27 发表于北京 新智元报道 编辑:桃子 拉燕 【新智元导读】7分钟环游世界,还是坐在家里的那种。 环游世界,或是很多人梦寐以求的人生。 无奈,身为打工人,又有多少人能真正得偿所愿。…

一文读懂什么是chatGPT

第一章:chatGPT是什么 ChatGPT是一种基于语言模型的对话生成系统。它是由OpenAI开发的,通过训练大规模的神经网络模型来实现。ChatGPT可以接收用户的输入,并生成与之相关的自然语言回复。它可以用于各种对话场景,如客户服务、虚拟…

今天,GPT-4登陆Office全家桶,打工人的生产方式被颠覆了

点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 作者丨机器之心 编辑丨3D视觉工坊 点击进入—>3D视觉工坊学习交流群 未来和 AI 一起工作是这样的。 「用人工智能重塑生产力」,微软老早就在 3 月 16 日活动主题上为我们打了预防针&#xff0c…

AI 工具合辑盘点(六)持续更新

AI 图像生成和编辑工具 不久前,艺术创作是特定群体的领域。 不再是这样了! 今天,在人工智能艺术生成器的帮助下,任何人都可以通过编写文本提示并让人工智能创建所需的图像来成为艺术家。 🎨🖌 文本到图像…

AIGC技术盛行之后引起的影响

前言 虽然人工智能一直都是近几年的热门技术和话题,但是今年技术圈被AI刷爆了,前有chatGPT,后有AIGC,可以说最近的技术圈很热闹。这里先抛开chatGPT不提,就说说AIGC,AIGC其实就是利用人工智能技术来生成内容…

微软元宇宙「大撤退」,VR/AR多个团队原地解散!全心押宝ChatGPT

2023年开年第一波大裁员,微软重创手下VR/AR团队。有了「新宠」ChatGPT,手中的「元宇宙」真的不香了。 元宇宙有多热,我们在2021年都见证过。 而经过2022年的洗礼,这一概念似乎已经完全冷却下来。烧掉360亿美元后,小扎…

【AI人工智能】AI绘画能取代设计师?

图来自:https://www.nytimes.com/2022/09/02/technology/ai-artificial-intelligence-artists.html 近期智能AI话题爆火,前有ChatGpt,现又出现了一个AI绘图工具Midjourney,号称没有美术基础的人也能快速上手制作出漂亮的图像。也有不少声音表示设计师都要失业了。AI绘图工…

Python开源项目周排行 2023年第10周

​原文地址:2023年第10周- Python学习网站导航 #2023年第10周2023年3月25日1ChatPaper使用 ChatGPT来总结论文。AI用一分钟总结论文,用户用一分钟阅读AI总结的论文。2川虎 ChatGPT为ChatGPT API提供了一个轻快好用的Web图形界面3transformersTransformer…