【抢先体验】开通使用 ChatGPT 语音版功能保姆级教程

image.png
大家好,我是苍何,一个土木转码的非典型程序员,也是一名技术管理者,同时也是 AI 应用的探索者。今天在视频号上看到和 ChatGPT 语音对话的视频,其声音的真实感太让人震撼了,于是也想去抢先体验一下 ChatGPT 语音版功能

网上搜索了许久,没找到相关实用教程,且很难找到语音版的入口。据 OpenAI 官方消息,在接下来的两周内,将向 Plus 和企业用户推出语音功能。那我们如何抢先体验该功能呢?

OpenAI官方对语音版的说明

本文将分享如何抢先体验 ChatGPT 语音版,并详细讲解使用指南。

一、什么是 ChatGPT 语音版

2023年9月25日 OpenAI 推出多模态功能,即 ChatGPT 将支持语音和图像。新的语音功能由新的文本到语音模型提供支持,该模型能够仅通过文本和几秒钟的示例语音生成类似人类的音频。OpenAI 与专业配音演员合作创作了每个声音。还使用开源语音识别系统 Whisper 将口语转录为文本。

**ChatGPT 语音版说白了就是能直接通过语音和 ChatGPT 进行对话,**让人震惊的是其声音的真实感和回答的逻辑性一度逼近贾维斯的感觉。

OpenAI 关于语音版公告

二、如何开通使用 ChatGPT 语音版

由于此功能现在还属于内侧阶段,仅部分用户能体验到,我这里说的是我亲测有效的方法(前提需要安卓手机)。大体流程是:安卓手机安装 Google Play,申请加入 Beta 测试,下载 ChatGPT Beta 版本,开通 plus 账号,打开语音入口。
以下是流程图。

2.1、申请加入 Beta 测试

这是最关键的一步,就是目前从应用商店下载的都是稳定版,很多未受邀请用户暂时无法体验,那我们需要申请加入 Beta 测试才可抢先体验该功能。这里以安卓的 Google Play 为例,演示如何加入 Beta 测试。

申请加入 Beta 测试

账号申请 Beta 测试需要几分钟,加入成功后我们就可以看到如上图提示,这个时候我们直接下载测试版本。一般而言,测试版本非稳定版本,但确是最新版本,也是我们抢先体验功能的基础。

2.2、开通 plus 账号

目前仅有 plus 账号才可抢先体验,所以需要开通。如何开通 plus 相信大家都已经会了,这里不赘述,但值得注意的是,由于 OpenAI 的封控策略,一定要注意尽量不要在 web 端开通以及尽量保证网络的「清洁」。

2.3、开通语音入口

打开设置
设置页面
点击 Beta Features

点击 Beta Features

开启 Voice conversations

开启 Voice conversations

注意:这里的 Browse with Bing 是 ChatGPT 的联网功能,我们以前需要通过插件联网,现在直接打开这个开关即可联网了。

点击主页图标

点击主页图标

开启语音对话

开启语音对话

查看对话历史

查看对话历史
我们每进行的一轮语音对话,均会以文本的形式进行对话展示,方便随时进行查看。

三、ChatGPT 语音版使用指南

3.1、哪些用户可以进行语音对话?

Plus 和 ChatGPT 企业计划的所有用户。其中 ChatGPT 企业计划管理员可以在管理工作区设置中为其用户切换可用性。预计一周之后会慢慢开放。

3.2、哪些应用程序可以进行语音对话?

语音对话可在适用于 iOS 和 Android 的 ChatGPT 移动应用程序上进行。

3.3、有多少个语音选项?

ChatGPT 从五种逼真的输出声音中进行选择,每种声音都有自己独特的音调和字符。可以通过 Setttings-Speech-Voice 进行声音选择。个人试验看 Breeze 对中文支持性更好。

语音设置

五种声音类型

3.4、我可以在语音对话中使用哪些模型?

GPT 3.5 和GPT 4 可用于语音对话。
请记住,对于Plus用户,GPT-4 每 3 小时有50条消息的上限。对于企业计划上的用户,没有消息上限。

3.5、我可以为语音对话设置音量限制吗?

在 ChatGPT 中,语音对话没有音量限制。音量将在设备本身上设置。

3.6、我可以在同一对话中使用ChatGPT视觉功能和语音对话吗?

可以使用视觉功能在聊天中启动语音对话,就像可以使用 GPT 3.5 或 GPT 4 在对话中启动语音对话一样。

3.7、为什么需要打开聊天记录和培训才能使用语音对话?

聊天记录和来自数据控件的培训必须切换,以便能够进行语音对话,以便可以查看对话的笔录。

主要是使用数据来提高模型性能,以何使用内容 (包括语音聊天的转录) 来改善服务和选择。

3.8、语音对话会不会保存音频

在测试版期间,来自语音对话的音频片段不会保存。ChatGPT 将音频片段发送到 Whisper API 以转录它们,但处理后不会保留它们。

要找到历史对话,可以在 ChatGPT 对话历史中找到语音对话中的文本转录。

3.9、语音对话是免提的吗?

一旦你进入语音对话,它是免提的,直到你退出语音对话。(相信以后会慢慢开放更多功能)
有手动控件,可暂停,继续和退出语音对话。

3.10、语音对话使用

开始对话:
要开始语音对话,需要点击耳机图标。建立连接后,ChatGPT 将听你讲话。
开启对话

暂停语音对话:
暂停语音对话
中断语音对话:
当ChatGPT正在说话时,您可以点击以中断:
中断

或者你可以点击停止图标:
停止图标
恢复语音对话:
点击恢复图标,然后重新开始
恢复语音对话
取消语音对话的静音:
点击取消静音。
点击取消静音
退出语音对话:
要退出语音模式,请点击 X 图标以结束语音对话,并返回到使用 ChatGPT 的基于文本的对话。
退出语音对话

3.11、可以让语音对话暂停多久?

没有限制,理论上可以无限时间暂停。

3.12、 收到 “对不起,我不能帮忙” 的回复是什么原因?

这是由于 ChatGPT 的安全措施造成的。如果提示符合,可以通过聊天中的“竖起大拇指/竖起大拇指” 选项向 ChatGPT 发送反馈。

四、总结

想象一下,当语音对话支持 API,我们可以把他集成到手机(虽然现在的 sari 也能如此,但还不够智能),放到人型机器人上,那不就是现实版的贾维斯吗?相信这一天不远了。拥抱 AI 才是普通人的破局之道。

全文完,你的点赞是对苍何创作最大鼓励\(^ ^)/


苍何个人介绍.png

创作不易,如果本文对你有帮助,欢迎点赞、收藏加关注,你的支持和鼓励,是我创作的最大动力。
文章最下方关注图片.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/151515.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Centos7安装MongoDB7.xxNoSQL数据库|设置开机启动(骨灰级+保姆级)

一: mongodb下载 MongoDB 社区免费下载版 MongoDB社区下载版 [rootwww tools]# wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-7.1.0-rc4.tgz 二: 解压到指定目录 [rootwww tools]# mkdir -p /usr/local/mongodb [rootwww tools]# tar -zxvf mongodb-…

选择适合普通公司的项目管理软件

不管是打工人还是学生党都适合使用Zoho Projects项目管理软件。利用项目概览功能,将整体项目尽收眼底,作为项目管理者,项目日程、进度都可见,Zoho Projects项目管理APP助推项目每一环节的进展,更便于管理者设计项目的下…

ThingsBoard如何自定义tcp-transport

1、概述 很久没有更新了,一直忙于其他的事情,最近去搞了一个在ThingsBoard中自定义一个tcp-transport,用于连接使用tcp长连接的设备,目前使用tcp和mqtt协议连接服务端的设备还是很多,ThingsBoard的PE版提供了Integration是可以实现tcp的接入,但是CE版是没有提供接入tcp长…

【MySQL】基本查询(二)

文章目录 一. 结果排序二. 筛选分页结果三. Update四. Delete五. 截断表六. 插入查询结果结束语 操作如下表 //创建表结构 mysql> create table exam_result(-> id int unsigned primary key auto_increment,-> name varchar(20) not null comment 同学姓名,-> chi…

IO 之 操作properties属性文件

propreties文件: properties文件是一种用于存储配置信息的文本文件,通常以“.properties”为文件扩展名。它是一种简单的键值对格式,用于保存应用程序的配置参数。 在properties文件中,每一行都包含一个键值对,键和值…

HTTPS工作过程,国家为什么让http为什么要换成https,Tomcat在MAC M1电脑如何安装,Tomcat的详细介绍

目录 引言 一、HTTPS工作过程 二、Tomcat 在访达中找到下载好的Tomcat文件夹(这个要求按顺序) zsh: permission denied TOMCAT的各部分含义: 引言 在密码中一般是:明文密钥->密文(加密) &#xff…

Spring源码解析——IOC属性填充

正文 doCreateBean() 主要用于完成 bean 的创建和初始化工作,我们可以将其分为四个过程: 最全面的Java面试网站 createBeanInstance() 实例化 beanpopulateBean() 属性填充循环依赖的处理initializeBean() 初始化 bean 第一个过程实例化 bean在前面一篇…

复旦大学EMBA:揭秘科创企业,领略未来战略!

智能制造,国之重器。作为制造强国建设的主攻方向,智能制造的发展水平关系到我国未来制造业在全球的地位与影响力。发展智能制造,是加快建设现代化产业体系的重要手段,提升供给体系适配性的有力抓手,也是建设数字中国的…

【C++设计模式之状态模式:行为型】分析及示例

简介 状态模式(State Pattern)是一种行为型设计模式,它允许对象在内部状态改变时改变其行为,看起来就像是改变了其类。状态模式将对象的状态封装成不同的类,并使得对象在不同状态下有不同的行为。 描述 状态模式通过…

Android用户登录与数据存储:从权限请求到内外部存储的完整实践【完整实践步骤、外部存储、内部存储】

步骤 1: 登录页面布局 在 MainActivity 中实现用户登录功能&#xff0c;首先创建一个布局文件 activity_main.xml 包含用户名和密码的输入字段以及登录按钮。 <!-- activity_main.xml --> <LinearLayoutxmlns:android"http://schemas.android.com/apk/res/andr…

Qt之实现圆形进度条

在Qt自带的控件中&#xff0c;只有垂直进度条、水平进度条两种。 在平时做页面开发时&#xff0c;有些时候会用到圆形进度条&#xff0c;比如说&#xff1a;下载某个文件的下载进度。 展示效果&#xff0c;如下图所示&#xff1a; 实现这个功能主要由以下几个重点&#xff1a…

记录vue开发实例

封装的表格组件 <template><div><div style"width: 100%" v-if"showList"><el-table v-loading.lock"loading" :data"dataList":header-cell-style"{background: #F2FCFE,fontSize: 14px,color: #50606D}&…

因为在此系统上禁止运行脚本

问题&#xff1a; 解决办法&#xff1a; vue项目搭建中"因为在此系统上禁止运行脚本"报错&#xff0c;解决方法 - 你的剧本 - 博客园 (cnblogs.com)

详解链表oJ<反转链表,链表的中间节点及链表的回文>

hello&#xff0c;大家好&#xff0c;这里是Dark FlameMaster,今天和大家分享的是有关数据结构链表的几道题目&#xff0c;链表的中间节点&#xff0c;反转链表及判断链表是否为回文结构&#xff0c;放在一起讲解会印象更加深刻。 文章目录 一&#xff0c;链表的中间节点二&…

从0到1基于ChatGLM-6B使用LoRA进行参数高效微调

从0到1基于ChatGLM-6B使用LoRA进行参数高效微调 吃果冻不吐果冻皮 ​ 关注他 cliniNLPer 等 189 人赞同了该文章 ​ 目录 收起 ChatGLM-6B简介 具备的一些能力 局限性 LoRA 技术原理 环境搭建 数据集准备 数据预处理 参数高效微调 单卡模式模型训练 数据并行模式模型训练 模型推…

自动驾驶学习笔记(二)——Apollo入门

#Apollo开发者# 学习课程的传送门如下&#xff0c;当您也准备学习自动驾驶时&#xff0c;可以和我一同前往&#xff1a; 《自动驾驶新人之旅》免费课程—> 传送门 《2023星火培训【感知专项营】》免费课程—>传送门 文章目录 前言 Ubuntu Linux文件系统 Linux指令…

水波纹文字效果动画

效果展示 CSS 知识点 text-shadow 属性绘制立体文字clip-path 属性来绘制水波纹 工具网站 CSS clip-path maker 效果编辑器 页面整体结构实现 使用多个 H2 标签来实现水波纹的效果实现&#xff0c;然后使用clip-path结合动画属性一起来进行波浪的起伏动画实现。 <div …

5分钟理解什么是卷积的特征提取

大家好啊&#xff0c;我是董董灿。 卷积算法之所以重要&#xff0c;关键在于其提取特征的能力。 5分钟入门卷积算法中提到&#xff0c;卷积模仿的就是人眼识图的过程&#xff0c;以“感受野”的视角去扫描图片&#xff0c;从而获取不同区域的图片信息。 在这一过程中&#x…

新风机注意事项有哪些?

选择和使用新风机时&#xff0c;有几个关键注意事项需要牢记&#xff1a; 安装位置&#xff1a;新风机的安装位置很重要。通常情况下&#xff0c;应将其安装在室外以避免室内产生噪音和减少室内的体积占据。确保选择合适的安装位置&#xff0c;以便新风机能够顺利引入新鲜空气。…

《从零开始学ARM》勘误

1. 50页 2 51页 3 236页 14.2.3 mkU-Boot 修改为&#xff1a; mkuboot 4 56页 修改为&#xff1a; 位[31&#xff1a;24]为条件标志位域&#xff0c;用f表示&#xff1b; 位[23&#xff1a;16]为状态位域&#xff0c;用s表示&#xff1b; 位[15&#xff1a;8]为扩展位域&…