微软Azure OpenAI支持数据微调啦！可打造专属ChatGPT

微软Azure OpenAI支持数据微调啦！可打造专属ChatGPT

news/2024/11/15 20:37:53/文章来源:https://blog.csdn.net/weixin_57291105/article/details/133927734

10月17日，微软在官网宣布，现在可以在Azure OpenAI公共预览版中对GPT-3.5-Turbo、Babbage-002 和Davinci-002模型进行数据微调。

使得开发人员通过自己的数据集，便能打造独一无二的ChatGPT。例如，通过海量医疗数据进行微调，构建专注医疗领域的ChatGPT助手，可询问与医疗相关的病历、专业术语、治疗方案等内容。

目前，全球各行业积累了几年甚至几十年的巨量优质数据，如何高效利用、查询这些数据成为一大难题。

通过自有数据微调打造的AI助手可有效解决这一痛点，同时提升内容的准确性、安全性，是组织实现降本增效的利器。

详细微调教程：https://learn.microsoft.com/en-us/azure/ai-services/openai/tutorials/fine-tune?tabs=command-line

微软Azure服务：https://azure.microsoft.com/en-us/products/ai-services/openai-service/

在这里插入图片描述

什么是数据微调

大模型数据微调（Fine-tuning）是一种迁移学习方法，用于深度学习和机器学习。通常数据微调是基于一个预训练好的模型（例如，GPT-3.5-Turbo）作为基石，然后在特定的任务数据集（例如，法律、医疗、营销）上进行额外的训练，使模型能生成特定业务领域的内容。

例如，你想训练一个模型来回答法律相关的问题，首先在大量的通用文本数据上进行预训练，然后在医学问答数据集上进行微调。

简单来说，微调功能就是让ChatGPT，完全按照你的数据来生成内容。

在这里插入图片描述

需要注意的是，即便你有高质量的数据集，但选择的微调模型性能很差，生成的内容也不会很理想。

而微软提供基于OpenAI的GPT-3.5-Turbo，是一个经过全球数百万开发者验证的高性能成熟模型。

Azure OpenAI新功能

Babbage-002和Davinci-002是微软最新推出的GPT-3基础模型，可生成文本、代码等，没有接受过遵循指令的训练。但在微调、托管服务费用方面更便宜。

Babbage-002取代了已弃用的Ada和Babbage 模型， Davinci-002 则取代了Curie和 Davinci。

在这里插入图片描述

GPT-3.5-Turbo是OpenAI性能最成熟模型之一，支持多轮深度对话、创建微调数据集、训练和部署等一站式开发服务。

Azure OpenAI微调功能演示

上传数据：微软在Azure OpenAI内置了数据过滤功能，当检测到用户上传的数据集包含非法、歧视等有害信息时，会自动删除这些内容。以下是上传数据集代码示例。

在这里插入图片描述

预训练：使用指定模型、训练和验证数据，并设置相应的参数。开发者可将Azure OpenAI Studio用于简单的GUI，或者使用微软的REST API或OpenAI Python SDK。

在这里插入图片描述

开始启动微调功能。

在这里插入图片描述

完成微调后，将返回评估指标，例如，训练和验证损失等参数。
在这里插入图片描述

目前，微软提供数据微调托管服务，用户无需担心任何算力资源问题，只需要选择时间即可。

收费标准：Babbage-002为34美元/小时；Davinci-002为68美元/小时；GPT-3.5-Turbo为102美元/小时。

3）Azure OpenAI 服务中的推理托管：当用户完成微调后，就可以使用模型生成专属内容了。
在这里插入图片描述

如果你没有足够的算力资源平台来支撑模型的日常输出，微软同样提供了托管服务。

收费标准：Babbage-002托管每小时1.7美元，Davinci-002每小时1.7美元，GPT-35-Turbo，每小时7美元。

在这里插入图片描述

本文素材来源微软官网，如有侵权请联系删除

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/163265.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

微信小程序一键获取位置

微信小程序一键获取位置

需求有个表单需要一键获取对应位置并显示出来效果如下： 点击一键获取获取对应位置显示在 picker 默认选中前端代码如下: <view class"box_7 {{ showChange1? change-style: }}"><view class"box_11"><view class"…

阅读更多...

大鼠药代动力学（PK参数/ADME）+毒性实验结果分析

大鼠药代动力学（PK参数/ADME）+毒性实验结果分析

在真实做实验的时候，出现了下面真实测试的一些参数，一起学习一下： 大鼠药代动力学： 为了进一步了解化合物 96 的药代动力学性质，我们选择化合物 500 进行 SD大鼠药代动力学评估。经静脉注射和口服给药后观察大鼠血药…

阅读更多...

互联网行业汇总

互联网行业汇总

互联网行业汇总，全网最全！选行业不愁从事互联网选什么行业？这似乎是很多朋友的困惑。所以这里给大家把互联网行业做个细致的汇总，每个行业列举几个典型的APP，简单拆解下各自的盈利模式，希望能给大家提供参…

阅读更多...

【力扣1528】重新排列字符串

【力扣1528】重新排列字符串

👑专栏内容：力扣刷题⛪个人主页：子夜的星的主页💕座右铭：前路未远，步履不停目录一、题目描述二、题目分析1、Java代码2、C代码一、题目描述给你一个字符串 s 和一个长度相同的整数数组 indices。请你…

阅读更多...

Linux块设备缓存Bcache使用

Linux块设备缓存Bcache使用

1 Bcache简介 Bcache是Linux内核块层cache，它使用SSD来作为HDD硬盘的cache，从而起到加速作用。Bcache内核模块仅在Linux 3.10及以上版本支持，因此使用Bcache，需要将内核升级到3.10及以上版本，并在内核配置项中打开Bca…

阅读更多...

【学习笔记】RabbitMQ04：延迟队列的原理以及实现代码

【学习笔记】RabbitMQ04：延迟队列的原理以及实现代码

参考资料 RabbitMQ官方网站RabbitMQ官方文档噼咔噼咔-动力节点教程文章目录七、延迟队列7.1 什么是延迟队列7.2 延迟队列的解决方案7.2.1 定时任务7.2.2 **被动取消**7.2.3 JDK的延迟队列7.2.3 采用消息中间件（rabbitMQ7.2.3.1 适用专门优化后的死信队列实现延迟队…

阅读更多...

攻防世界web篇-unserialize3

攻防世界web篇-unserialize3

得出php代码残篇将代码补全后再在线php运行工具中进行运行在浏览器输入后得到下面的界面这里需要将O:4:“xctf”:1:{s:4:“flag”;s:3:“111”;} 改为 O:4:“xctf”:2:{s:4:“flag”;s:3:“111”;}

阅读更多...

单片机入门后该怎么学习进一步提升？

单片机入门后该怎么学习进一步提升？

单片机入门后该怎么学习进一步提升？ 可以将你目前会的单片机基础先整理一下，你看看运用这些基本的外设或者一些入门知识能做个什么东西，最近很多小伙伴找我，说想要一些单片机资料，然后我根据自己从业十年经验&#xff…

阅读更多...

查询企业信息的四种方法

查询企业信息的四种方法

在工作中或者对于找工作的求职人来说，怎么查看企业的信息呢？可能很多人会想到各种查查类软件，但是这类软件需要会员或者付费才能查看，对于没有会员的人来说，有没有其他查询企业的方法呢？答案肯定是有的&…

阅读更多...

Python 爬虫实战之爬淘宝商品并做数据分析

Python 爬虫实战之爬淘宝商品并做数据分析

前言是这样的，之前接了一个金主的单子，他想在淘宝开个小鱼零食的网店，想对目前这个市场上的商品做一些分析，本来手动去做统计和分析也是可以的，这些信息都是对外展示的，只是手动比较麻烦，所以…

阅读更多...

IDC：到2027年，全球生成式AI支出将达到1430亿美元

IDC：到2027年，全球生成式AI支出将达到1430亿美元

全球著名信息调查咨询机构IDC在官网公布了一项调查，到2027年，全球生成式AI（Generative AI，简称Gen AI）支出将达到1430亿美元，5年复合年增长率为73.3%。该支出包括：生成式AI的软件以及相关基础…

阅读更多...

报错：AttributeError: module ‘tensorflow‘ has no attribute ‘flags‘

报错：AttributeError: module ‘tensorflow‘ has no attribute ‘flags‘

改成如下： 报错原因：tensorflow1.x与2.x版本问题不兼容

阅读更多...

3D Web轻量化工具HOOPS Web Platform助力Rapid DCS快速上市碳估算产品！

3D Web轻量化工具HOOPS Web Platform助力Rapid DCS快速上市碳估算产品！

总部位于英国的Rapid DCS提供全面的交钥匙解决方案和服务，帮助建筑环境领域的客户充分利用数字化的优势。 Rapid DCS技术总监James Hunter表示：“如今的建筑项目需要一套与20甚至10年前的建筑项目不同的功能。” “例如，虽然成本规划一直很重…

阅读更多...

性能监控软件是什么?有哪些优势?

性能监控软件是什么?有哪些优势?

在现代科技驱动的世界中，计算机系统的性能对于企业和个人用户都至关重要。性能监控软件是一种不可或缺的工具，可以帮助我们实时跟踪、分析和优化系统的性能。本文将介绍性能监控软件的概念、其重要性以及如何选择和使用这些工具来提高系统效率。一、性能…

阅读更多...

【微服务 SpringCloud】实用篇 · Eureka注册中心

【微服务 SpringCloud】实用篇 · Eureka注册中心

微服务（3） 文章目录微服务（3）1. Eureka的结构和作用2. 搭建eureka-server2.1 创建eureka-server服务2.2 引入eureka依赖2.3 编写启动类2.4 编写配置文件2.5 启动服务 3. 服务注册1）引入依赖2）配置文件3&am…

阅读更多...

如何让你的Node.js应用程序处理数百万的API请求

如何让你的Node.js应用程序处理数百万的API请求

目录一、了解 Node.JS 和 API 请求二、优化 NodeJS 以实现高性能 1.使用异步操作 2.实现缓存 3.优化数据库查询 4.负载平衡 5.水平扩展三、测试和监控性能 1.负载测试 2.应用程序性能监控(APM) 四、结论一、了解 Node.JS 和 API 请求在我们深入研究这些技术之…

阅读更多...

29栈与队列——优先队列

29栈与队列——优先队列

目录 LeetCode之路——347. 前 K 个高频元素分析优先队列简单示例运行结果源码简析 LeetCode之路——347. 前 K 个高频元素给你一个整数数组 nums 和一个整数 k ，请你返回其中出现频率前 k 高的元素。你可以按任意顺序返回答案。示例 1: 输入: num…

阅读更多...

Java基础（三）

Java基础（三）

1. 异常 Java 异常类层次结构图概览： 1.1 Exception 和 Error 有什么区别？ 在 Java 中，所有的异常都有一个共同的祖先 java.lang 包中的 Throwable 类。Throwable 类有两个重要的子类: Exception :程序本身可以处理的异常，可以…

阅读更多...

uniapp 小程序实现图片宽度100%、高度自适应的效果

uniapp 小程序实现图片宽度100%、高度自适应的效果

因为image组件默认是有宽度跟高度的，所以这个高度不怎么好写通过load事件来控制图片的高度话不多说，直接上代码， <image class"img" src"/static/image.png" :style"{ height: imgHeight px }"mode&q…

阅读更多...

Linux-ssh

Linux-ssh

文章目录远程登录服务器配置远程服务器相关信息创建config文件配置config文件配置密钥登陆先创建密钥配置密钥文件执行命令scp传文件copy文件copy文件夹配置我们的vim和tmux 远程登录服务器 ssh userhostnameuser:用户名hostname：IP地址或域名第一次登陆会显示…

阅读更多...

最新文章

推荐文章