AudioGPT推出,音频领域都不放过,ChatGPT这是杀疯了。

 

 

 

3 天前

 

ChatGPT云炬学长

​关注

今天和大家介绍的一个项目属于音频领域的ChatGPT的应用实践。真没想不到,在音频领域,ChatGPT都没有放过,ChatGPT这是杀疯了呀!

 

v2-26e1d6e40434ea3a4f0830e3e89ac9eb_1440w.webp

 

现在的ChatGPT是一个实打实的风口,也希望大家跟我一起努力在风口上飞起来!

之前我曾经写过三篇ChatGPT相关的,大家可以再去看一看,今天和大家介绍的大模型应用是AudioGPT,与其他的ChatGPT的区别在于,ChatGPT属于大模型的文字对话模型。

而AudioGPT则是针对于语音领域。AudioGPT可实现的功能有以下几点,给大家总结一下。

另外大家需要注意的是AudioGPT的使用是需要基于ChatGPT基础的,为什么这么说呢?原因在于需要我们通过使用OpenAI的API key进访问权限的验证,如图为OpenAI key的获取示意图

 

v2-6a865dbc8f36e287623333b4542b9e6b_1440w.webp

 

所以大家如果还没有OpenAI的GPT账号的,自己去申请一下,然后将这个API Key放到这个AudioGPT的输入框中,即可进行运行程序。

以下是AudioGPT程序的地址:

https://github.com/AIGC-Audio/AudioGPT

以下跟大家演示一下如何在自己的电脑上去运行AudioGPT的代码程序,以及如何学会正确运用AudioGPT实现对应的功能?

首先需要实现搭建模型运行环境,然后安装requirements文件列表里面的这依赖项,以及怎么实现在我们本地的客户端去运行AudioGPT的程序。

1. 创建运行程序新的conda环境

# create a new environment

conda create -n audiogpt python=3.8

2. 安装环境运行所需依赖,以及下载模型文件

# prepare the basic environments

pip install -r requirements.txt

# download the foundation models you need

bash download.sh

3. 导入你的OpenAI Key字符串进入代码文件

# prepare your private openAI private key

export OPENAI_API_KEY={Your_Private_Openai_Key}

4. 开始运行AudioGPT程序

至此我们可以实际检验AudioGPT的实际功能。

以上的操作步骤还是似乎还是偏向于极客,可以直接使用Hugging Face社区,调用实际的API接口,使用更加方便。以下是Hugging Face社区的代码地址:

https://huggingface.co/spaces/AIGC-Audio/AudioGPT

AudioGPT效果如下图所示:

 

 

实践环节演示

AudioGPT包括以下几种功能,由于AudioGPT的模型属于语音音频方向的大模型。其功能包括以下的内容分类。

第一、实现根据输入文本转换为语音文件的语音合成

例如:生成带有文本“here we go”的语音音频

 

 

第二、实现将单通道语音转换为双通道语音

 

 

第三、根据语言的文本描述生成对应语音

例如:生成狗叫声的音频:

 

 

第四,根据音频输出指定文字的描述

例如:给我这个生成音频的描述

 

 

第五、根据输入语音信号转换输出其对应的频谱图

 

 

第六、说明音频内部所包含的事件以及起止时间

例如:这段音频中的雷声是什么时候发生的?

 

 

不仅如此,AudioGPT也集成了图像识别的功能,根据图片输入的上传图片生成对应的内容描述音频

例如:上传下图的江南水乡的图片

 

 

然后通过江南水乡的图片,生成的雨水声音

 

 

怎么样感觉效果如何?不过其实告诉大家一个秘密,音频信号的处理,相对来说,比较占用内存,处理音频的时间较长,可以选择不同的加速硬件GPU,如下图所示

 

 

原始使用的T4显卡是免费的,其实理论上计算性能也还不错,免费的,还要啥自行车!

不过如果有更多的需要,当然也可以按需购买。

怎么样,赶快试一试吧!

发布于 2023-05-21 20:21・IP 属地辽宁

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6489.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

四少女火爆外网,AI杀疯了!

转自:量子位 | 金磊 四位美少女,带着AI画画在ChatGPT的热浪中杀出了一片天地。 新“魔法”一出,瞬间吸引全场目光: 原本是一张四个闺蜜在沙滩边上的普通合影照: 在新魔法的加持下,“啪的一下”画…

ChatGPT ✖️ 前端 = 有点er意思

HOT! HOT! HOT! 🔥 🔥 🔥 ChatGPT登上了国内各大平台的热搜榜,应该在去年11月末的时候就有不少同学了解并使用过,那个时候它刚刚问世,在互联网圈子里有了很大的热度,但是对于大众来说&#xff…

干掉 Google?ChatGPT 这几天杀疯了!

点击关注公众号,Java干货及时送达 推荐阅读: Spring 旗下最牛逼的国产项目! Spring Boot 3.0 正式发布,王炸!! 出品 | OSC开源社区(ID:oschina2013) 人工智能研究公司 OpenAI 上周正…

AudioGPT推出!音频领域都不放过,ChatGPT这是杀疯了!

大家好,我是千与千寻,你们可以叫我千寻哥,算一算写ChatGPT的技术文章已经写到第四篇了! 今天和大家介绍的一个项目属于音频领域的ChatGPT的应用实践。真没想不到,在音频领域,ChatGPT都没有放过,ChatGPT这是杀疯了呀! 现在的ChatGPT是一个实打实的风口,也希望大家跟我…

用ChatGPT面试杀疯了,拿下大厂

集中投了几家公司后,便开始面试,为了节约时间,我选择使用Chatgpt辅助面试,果然是最佳私人助手,就像多了一个贴心秘书! 1、将想要应聘公司的岗位要求,jd复制到Chatgpt 2、问模拟面试官可能问到的…

Stable Diffusion、ChatGPT爆火的背后!

整编 | Carol 参考 |《AIGC 发展趋势报告 2023》 出品 | AI科技大本营 “Generative AI(生成式AI)有什么社会价值?” 当腾讯研究院的研究员将上面这个问题输入到ChatGPT中,得到如下回复: "生成式AI是一种人工智能…

ChatGPT 火爆全球,我们能抓住的下一个风口在哪?

中国互联网行业正面临着巨大的压力和挑战,但也孕育着新的发展机遇。当下正值ChatGPT火爆,整个互联网行业充满了机遇和挑战,身处其中的我们能抓住什么呢? 思你所思,帮大家整理出了五大风口!希望对大家有所帮…

爆火!ChatGPT背后的这类芯片赢麻了!

2022年底,由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT一夜爆火,席卷全球多国及地区。毋庸置疑,ChatGPT火爆出圈得益于高性能计算、人工智能以及半导体等行业技术的飞速发展、不断迭代和有机结合。 该产品以强大的文字处理和人机交…

揭秘ChatGPT背后的传奇崛起,探索其引爆引爆网络的隐藏故事

文章目录 前言一、ChatGPT的诞生背景二、ChatGPT的技术原理三、ChatGPT的推广策略四、ChatGPT的未来展望五、橙子送书第3期 前言 ChatGPT是一款基于人工智能技术的聊天机器人,它的出现引起了广泛的关注和热议。在短短的时间内,ChatGPT就成为了全球范围内…

Spring boot +React集成ChatGPT 智能AI

在这里插入代码片import {Button, Input, Radio,Alert,Modal } from antd; import Marquee from react-fast-marquee; import {ChromeOutlined,WifiOutlined,AimOutlined } from ant-design/icons; import React, {useEffect, useState, useRef} from react; import chatgptPn…

中文调教指南,100个提升ChatGPT输出质量的中文prompts

最近这段时间ChatGPT的风实在是太大了,人工智能带给大家的冲击一波又一波,3月27日,根据高盛(Goldman Sachs)研究报告显示,以ChatGPT为代表的生成式AI产品,将对美国和欧洲三分之二工作岗位造成影…

Wombat:93%ChatGPT性能,无需RLHF就能对齐人类的语言模型

文 | zzy 文章地址: https://arxiv.org/abs/2304.05302v1 训练代码: https://github.com/GanjinZero/RRHF 模型权重: https://huggingface.co/GanjinZero/wombat-7b-delta 各个大模型的研究测试传送门 阿里通义千问传送门: https://tongyi.…

史诗级的突破,如何让GPT接口调用能绕过4000 tokens 的长度限制

最近很高兴有机会较为全面深入地研究GPT / ChatGPT这一热门技术,学到了不少东西,当然也遇到不少问题,其中一个问题就是,所有的GPT模型,都会有输入输出长度(加起来)的限制这个问题,就…

小扎、马斯克宣战ChatGPT!Meta和推特组建顶级AI团队,硅谷硝烟四起

【导读】ChatGPT大厂混战,怎能少得了Meta和推特?近日,小扎和马斯克也官宣下场,要做自己的ChatGPT了。 ChatGPT的爆火,直接改变了整个硅谷大厂的格局。 微软的步步出招,倒逼谷歌走出固步自封的境地&#x…

牛逼,玩转 ChatGPT!

ChatGPT是一种由OpenAI开发的人工智能模型,它可以模拟人类的对话交流,对话可以涉及各种话题。使用ChatGPT可以进行各种操作,例如自然语言生成、文本摘要、语言翻译、文本分类、问答系统等。下面是ChatGPT网站的可用链接,由于网络限…

对话冯·诺依曼理论奖得主叶荫宇:ChatGPT于行业智能,更像是全科医生对专科医生|数字思考者50人...

斯坦福大学讲席教授、冯诺依曼理论奖获得者:叶荫宇 ▎ChatGPT包罗万象,更像是一个全科医生,而运筹学以及求解器,则像是专科医生。 作者丨 韩敬娴 本文首发钛媒体APP 国际市场震荡不定,供应链波动剧烈、芯片短缺、碳排限…

开篇词:大模型国内应用落地思考与实践

自从GPT-3发布以来,随着以ChatGPT为首的应用工具一夜爆火,人工智能似乎找到了应用层面的合适出口,让大众、用户和产业,看到了大模型人工智能所具备的应用潜力。 国内外关于大模型的研究层出不群,各大厂都在进行大模型…

关于ChatGPT的一切;CUDA入门之矩阵乘;PyTorch 2.0发布|AI系统前沿动态

1.截止目前,关于ChatGPT的一切 ChatGPT是GPT3的一大飞跃,就像GPT3本身是GPT2的质的飞跃一样。目前,关于ChatGPT的解读内容数量和种类繁多,让人跟上非常困难,容易患错失恐惧症。因此,作者整理了一个笔记&…

ChatGPT也太神奇了

前段时间找了很多chatGPT国内基本上发现都是要收费的,价格贵的太离谱了。好在我再三搜索下找到了一款国内封装过的免费chatGPT,功能还是不错的,就是这回复速度有点慢,其实也不是不能用就是慢

2023财年Q4业绩继续下滑,ChatGPT能驱动英伟达重回巅峰吗?

近年来,全球科创风口不断变换,虚拟货币、元宇宙等轮番登场,不少企业匆忙上台又很快谢幕,但在此期间,有些企业扮演淘金潮中“卖水人”的角色,却也能够见证历史且屹立不倒。不过,这并不意味着其可…