网易云数据分析实战

网易云数据分析

字段:title,tag,text,collection,play,songs,comments

导入模块,读取数据

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import squarify
df = pd.read_excel('D:/Pandas/music_message.xlsx',header=0,names=['title','tag','text','collection','play','songs','comments'])
df.head()
titletagtextcollectionplaysongscomments
0梦想无处安放的日子 也要时常拿出来晾晒华语-治愈-感动介绍:和过去的时光,聊一聊 用文字记下的回忆和许下的心愿,如今正裹挟着时光的风霜,与你撞个满...824339509308
1治愈说唱 I 越过黑暗的那道光华语-说唱-治愈介绍:今天,你又是为何戴上耳机?才发现,音乐真的是有力量的,治愈的力量。愿你有好运气,如果没...26573875414212
2《姐姐的爱乐之程》云南站路演华语-流行-综艺介绍:一个热爱音乐的纯朴村寨,一颗生长在茶山上的苍天大树,一轮雨后艳丽的彩虹,一段闲适的时光...1175204799831
3你搜不到的土嗨神曲欧美-摇滚-流行介绍:【不喜勿喷,自用歌单+村民推荐】这歌单容易嗨上头,如果你开车/走路请注意安全!现在很多...167万970742002123972
4是你的垚/刘大壮/王小帅/王泽科华语-伤感-翻唱介绍:喜欢歌单的可以点个关注哟歌单制作:小攀哟歌单创建:2020.4.1歌单修改:2020....12万7869796115280
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1289 entries, 0 to 1288
Data columns (total 7 columns):#   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 0   title       1289 non-null   object1   tag         1289 non-null   object2   text        1289 non-null   object3   collection  1289 non-null   object4   play        1289 non-null   int64 5   songs       1289 non-null   int64 6   comments    1289 non-null   object
dtypes: int64(2), object(5)
memory usage: 70.6+ KB

数据处理、清洗

df['collection'] = df['collection'].astype('string').str.strip()
df['collection'] = [int(str(i).replace('万','0000')) for i in df['collection']]
df['text'] = [str(i)[3:] for i in df['text']]
df['comments'] = [0 if '评论' in str(i).strip() else int(i) for i in df['comments']]
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1289 entries, 0 to 1288
Data columns (total 7 columns):#   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 0   title       1289 non-null   object1   tag         1289 non-null   object2   text        1289 non-null   object3   collection  1289 non-null   int64 4   play        1289 non-null   int64 5   songs       1289 non-null   int64 6   comments    1289 non-null   int64 
dtypes: int64(4), object(3)
memory usage: 70.6+ KB
df.shape
(1289, 7)

数据预览

df.head()
titletagtextcollectionplaysongscomments
0梦想无处安放的日子 也要时常拿出来晾晒华语-治愈-感动和过去的时光,聊一聊 用文字记下的回忆和许下的心愿,如今正裹挟着时光的风霜,与你撞个满怀。那...824339509308
1治愈说唱 I 越过黑暗的那道光华语-说唱-治愈今天,你又是为何戴上耳机?才发现,音乐真的是有力量的,治愈的力量。愿你有好运气,如果没有,愿...26573875414212
2《姐姐的爱乐之程》云南站路演华语-流行-综艺一个热爱音乐的纯朴村寨,一颗生长在茶山上的苍天大树,一轮雨后艳丽的彩虹,一段闲适的时光。一场...1175204799831
3你搜不到的土嗨神曲欧美-摇滚-流行【不喜勿喷,自用歌单+村民推荐】这歌单容易嗨上头,如果你开车/走路请注意安全!现在很多年轻人...1670000970742002123972
4是你的垚/刘大壮/王小帅/王泽科华语-伤感-翻唱喜欢歌单的可以点个关注哟歌单制作:小攀哟歌单创建:2020.4.1歌单修改:2020.9.1...1200007869796115280

构建通用函数,简化代码

get_matplot(x,y,chart,title,ha,size,color)
x表示充当x轴数据;
y表示充当y轴数据;
chart表示图标类型,这里分为三种barh、hist、squarify.plot;
ha表示文本相对朝向;
size表示字体大小;
color表示图表颜色;

#构建函数
def get_matplot(x,y,chart,title,ha,size,color):# 设置图片显示属性,字体及大小plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']plt.rcParams['font.size'] = sizeplt.rcParams['axes.unicode_minus'] = False# 设置图片显示属性fig = plt.figure(figsize=(16, 8), dpi=80)ax = plt.subplot(1, 1, 1)ax.patch.set_color('white')# 设置坐标轴属性lines = plt.gca()# 设置显示数据if x ==0:passelse:x.reverse()y.reverse()data = pd.Series(y, index=x)# 设置坐标轴颜色lines.spines['right'].set_color('none')lines.spines['top'].set_color('none')lines.spines['left'].set_color((64/255, 64/255, 64/255))lines.spines['bottom'].set_color((64/255, 64/255, 64/255))# 设置坐标轴刻度lines.xaxis.set_ticks_position('none')lines.yaxis.set_ticks_position('none')if chart == 'barh':# 绘制柱状图,设置柱状图颜色data.plot.barh(ax=ax, width=0.7, alpha=0.7, color=color)# 添加标题,设置字体大小ax.set_title(f'{title}', fontsize=18, fontweight='light')# 添加歌曲出现次数文本for x, y in enumerate(data.values):plt.text(y+0.3, x-0.12, '%s' % y, ha=f'{ha}')elif chart == 'hist':# 绘制直方图,设置柱状图颜色ax.hist(y, bins=30, alpha=0.7, color=(21/255, 47/255, 71/255))# 添加标题,设置字体大小ax.set_title(f'{title}', fontsize=18, fontweight='light')elif chart == 'plot':colors = ['#adb0ff', '#ffb3ff', '#90d595', '#e48381', '#aafbff', '#f7bb5f', '#eafb50', '#adb0ff', '#ffb3ff', '#90d595', '#e48381', '#aafbff', '#f7bb5f', '#eafb50','#adb0ff', '#ffb3ff', '#90d595', '#e48381', '#aafbff', '#f7bb5f', '#eafb50','#adb0ff', '#ffb3ff', '#90d595', '#e48381', '#aafbff', '#f7bb5f', '#eafb50','#adb0ff', '#ffb3ff', '#90d595', '#e48381', '#aafbff', '#f7bb5f', '#eafb50','#adb0ff', '#ffb3ff', '#90d595', '#e48381', '#aafbff', '#f7bb5f', '#eafb50','#adb0ff', '#ffb3ff', '#90d595', '#e48381', '#aafbff']plot = squarify.plot(sizes=y, label=x, color=colors, alpha=1, value=y, edgecolor='white', linewidth=1.5)# 设置标签大小为1plt.rc('font', size=6)# 设置标题大小plot.set_title(f'{title}', fontsize=13, fontweight='light')# 除坐标轴plt.axis('off')# 除上边框和右边框刻度plt.tick_params(top=False, right=False)# 显示图片plt.show()
#构建color序列
color = [(153/255, 0/255, 102/255),(8/255, 88/255, 121/255),(160/255, 102/255, 50/255),(136/255, 43/255, 48/255),(16/255, 152/255, 168/255),(153/255, 0/255, 102/255)]

1.歌单播放量Top10

df_play = df[['title','play']].sort_values('play',ascending=False)
df_play[:10]
titleplay
40精选 | 网络热歌分享502522656
178那些好听到爆了的歌135485104
182精选|耳熟的翻唱合集121409168
3你搜不到的土嗨神曲97074200
97你会爱上这个流行华语歌单69498312
384超好听的高潮翻唱呀66282664
158精选|Cover的那些循环歌曲66277840
263「翻唱」好听的歌永远没有完整版。55291720
188网络热播的那些神仙声音(持续更新)48534648
19精选|Cover翻唱百听不腻36318572
df_play = df_play[:10]
_x = df_play['title'].tolist()
_y = df_play['play'].tolist()
df_play = get_matplot(x=_x,y=_y,chart='barh',title='网易云音乐华语歌单播放 TOP10',ha='left',size=8,color=color[0])
df_play

在这里插入图片描述

2.歌单收藏量Top10

df_col = df[['title','collection']].sort_values('collection',ascending=False)
df_col[:10]
titlecollection
40精选 | 网络热歌分享5460000
3你搜不到的土嗨神曲1670000
178那些好听到爆了的歌1430000
182精选|耳熟的翻唱合集1380000
384超好听的高潮翻唱呀810000
158精选|Cover的那些循环歌曲740000
263「翻唱」好听的歌永远没有完整版。690000
97你会爱上这个流行华语歌单680000
188网络热播的那些神仙声音(持续更新)490000
19精选|Cover翻唱百听不腻430000
df_col = df_col[:10]
_x = df_col['title'].tolist()
_y = df_col['collection'].tolist()
df_col = get_matplot(x=_x,y=_y,chart='barh',title='网易云音乐华语歌单收藏 TOP10',ha='left',size=8,color=color[1])
df_col

在这里插入图片描述

3.歌单评论数Top10

df_com = df[['title','comments']].sort_values('comments',ascending=False)
df_com[:10]
titlecomments
40精选 | 网络热歌分享19159
408献给用生命托起世界的英雄们11628
202致敬黑暗里的光 感谢你们点亮夜空4700
14篮球巨星科比,再见4097
3你搜不到的土嗨神曲3972
436【刷歌升级】60~70秒超短歌曲一万首3849
349穿越千万时间线,只想见你3793
1157【227大团结】美好的东西是不会死的3466
144『中文说唱』 只想私藏的顶级国语Flow2843
184摆地摊专用BGM,要的就是回头率!2822
df_com = df_com[:10]
_x = df_com['title'].tolist()
_y = df_com['comments'].tolist()
df_com = get_matplot(x=_x,y=_y,chart='barh',title='网易云音乐华语歌单评论数 TOP10',ha='left',size=8,color=color[2])
df_com

在这里插入图片描述

4.歌单收藏数量分布情况

df_collection = np.log(df['collection'])
df_collection
0        6.714171
1        7.884953
2        7.069023
3       14.328334
4       11.695247...    
1284     4.304065
1285     2.708050
1286     3.970292
1287     6.238325
1288     4.787492
Name: collection, Length: 1289, dtype: float64
df_collection = get_matplot(x=0,y=df_collection,chart='hist',title='华语歌单收藏数量分布情况',ha='left',size=10,color=color[3])
df_collection

5.歌单标签图

def get_tag(df):df = df['tag'].str.split('-')datalist = list(set(x for data in df for x in data))return  datalist
df_tag = get_tag(df)
# df_tag
def get_lx(x,i):if i in str(x):return 1else:return 0
for i in list(df_tag):#这里的df['all_category'].unique()也可以自己用列表构建,我这里是利用了前面获得的df[i] = df['tag'].apply(get_lx,i=f'{i}')
# df.head()
Series = df.iloc[:,7:].sum().sort_values(0,ascending=False)
df_tag = [tag for tag in zip(Series.index.tolist(),Series.values.tolist())]
df_tag[:10]
[('华语', 1287),('流行', 724),('伤感', 177),('说唱', 172),('治愈', 162),('翻唱', 96),('浪漫', 96),('民谣', 90),('夜晚', 77),('古风', 55)]
df_iex = [index for index in Series.index.tolist()][:20]
df_tag = [tag for tag in Series.values.tolist()][:20]
df_tagiex = get_matplot(x=df_iex,y=df_tag,chart='plot',title='网易云音乐华语歌单标签图',size=10,ha='center',color=color[3])
df_tagiex

在这里插入图片描述

6.歌单介绍词云图

词云图1

import stylecloud
from IPython.display import Image
stylecloud.gen_stylecloud(text=' '.join(list(df.text)), collocations=False,#palette='cartocolors.qualitative.Pastel_5',font_path=r'‪C:/Windows/Fonts/msyh.ttc',#icon_name='fas fa-dragon',icon_name='fas fa-music',#icon_name='fas fa-cat',#icon_name='fas fa-dove',size=400,output_name='music.png')
#已生成词云图片,这里展示一下
Image(filename='music.png')

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PVAJixSs-1608555402642)(wyy_files/wyy_37_0.png)]

词云图2

import os  
import jieba
from pyecharts.charts import Bar, Pie, Line, WordCloud, Page
from pyecharts import options as opts 
from pyecharts.globals import SymbolType, WarningType
WarningType.ShowWarning = Falseimport stylecloud
from IPython.display import Image # 用于在jupyter lab中显示本地图def get_cut_words(x_series):# 读入停用词表stop_words = [] with open(r"D:/Pandas/已学习/如何制作stylecloud词云?/stop_words.txt", 'r', encoding='utf-8') as f:lines = f.readlines()for line in lines:stop_words.append(line.strip())# 添加关键词my_words = ['好听', '华语', '喜欢', '音乐', '耳机', '歌手', '网易云']   for i in my_words:jieba.add_word(i) # 自定义停用词my_stop_words = ['哈哈哈', '哈哈哈哈', '评论']stop_words.extend(my_stop_words)               # 分词word_num = jieba.lcut(x_series.astype('str').str.cat(sep='。'), cut_all=False)# 条件筛选word_num_selected = [i for i in word_num if i not in stop_words and len(i)>=2]return word_num_selectedtext1 = get_cut_words(x_series=df.text)#df.columns某一列def gen_my_stylecloud(text, file_name, icon_name='fas fa-music'):#这里的icon_name可以自定义更换stylecloud.gen_stylecloud(text=' '.join(text), max_words=1000,collocations=False,font_path=r'‪C:/Windows/Fonts/msyh.ttc',icon_name=icon_name,size=653,output_name=f'{file_name}.png')  
gen_my_stylecloud(text=text1, file_name='music_text')
Image(filename='music_text.png')

在这里插入图片描述

7.歌曲出现次数TOP10

dfm = pd.read_csv('D:\Pandas\music_name_pandas.csv',encoding='utf-8')
dfm.shape
dfm['name'] = dfm['name'].str.strip()
dfm['count'] = 0
df_name = dfm.groupby('name',as_index=False)['count'].count().sort_values('count',ascending=False)
df_name = df_name[:30]
df_name
namecount
2047偏爱50
1821会不会(吉他版)50
4951永不失联的爱45
2715在哪里都很好42
5953耗尽40
1801他只是经过37
4563是但求其爱36
5086海底34
5871经济舱 (Live)33
3108如果当时202031
4566是你想成为的大人吗30
4571是想你的声音啊30
4020我很好(吉他版)30
4375斯芬克斯星座28
3601彩券28
1386三号线(吉他版)27
4217执迷不悟27
2943天外来物23
1376万有引力20
5361爱,存在20
5591相安19
4195所念皆星河19
6301谁说梦想不能当饭吃19
3829想见你想见你想见你18
6661野心18
3095如果你也这样过17
4595晚风16
5732空的城16
2787夏天的风15
2723在这个年纪也许不配拥有爱情15
df_name = df_name[:10]
names = df_name['name'].tolist()
plays = df_name['count'].tolist()
df_name = get_matplot(x=names,y=plays,chart='barh',title='网易云音乐华语歌单歌曲 TOP10',ha='left',size=10,color=color[3])
df_name

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TJF1leBQ-1608555402651)(wyy_files/wyy_43_0.svg)]

8.歌单贡献up主Top10

df_user = pd.read_csv('D:\Pandas\playlist.csv',encoding='utf-8',header=0,names=['url','title','play','user'],sep=',')
df_user.shape
df_user = df_user.iloc[:,1:]
df_user['count'] = 0
df_user = df_user.groupby('user',as_index=False)['count'].count()
df_user = df_user.sort_values('count',ascending=False)[:10]
df_user
usercount
226原创君32
289安阳汪涛24
356我自清欢丨被嫌弃的唐唐的一生19
550蒙丽娜沙的微笑14
559螚安Vivienne12
114mayuko然12
341情思天鹅12
260圈圈的呆子11
273大肥猫好可爱哟11
541苏奕杰10
df_user = df_user[:10]
names = df_user['user'].tolist()
nums = df_user['count'].tolist()
df_u = get_matplot(x=names,y=nums,chart='barh',title='歌单贡献UP主 TOP10',ha='left',size=10,color=color[4])
df_u

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-z3AJnpBX-1608555402660)(wyy_files/wyy_47_0.svg)]

总结:

csv数据存在部分读取不全的情况,我的解决办法打开一个空的excel,然后打开导入并选中csv,这时会弹出窗口提示你设置分隔符,而不是直接双击csv文件用excel打开,两者有区别。
然后对每项数据在excel进行简单筛选,因为有些数据会存在格式问题,当然你也可以直接pd读取,然后根据报错去excel调整相应的列,我这里的问题是collection列的数据存在不能转换int,原因就是有一行的数据没有被分割,手动修改或者直接删除即可。这样得到的效果也有缺失,但是比之前只有800多条多了200多条,还是值得的。
究其原因,可能是爬取保存的数据格式或者是默认分隔符为,所致,因为文字信息里面也存在’,’。

补充:

加上:error_bad_lines=False,上面的问题即可解决,意思是忽略此行

简单测试,成功,数据基本上没有丢失

import pandas as pd
import numpy as npdf = pd.read_csv('D:\Pandas\网易云数据分析\music_message.csv',header=0,error_bad_lines=False,names=['title','tag','text','collection','play','songs','comments'],encoding='utf-8-sig')
df.to_excel('demo.xlsx',index=False)

爬虫代码:

from bs4 import BeautifulSoup
import requests
import timeheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}for i in range(0, 1330, 35):print(i)time.sleep(2)url = 'https://music.163.com/discover/playlist/?cat=华语&order=hot&limit=35&offset=' + str(i)#修改这里即可response = requests.get(url=url, headers=headers)html = response.textsoup = BeautifulSoup(html, 'html.parser')# 获取包含歌单详情页网址的标签ids = soup.select('.dec a')# 获取包含歌单索引页信息的标签lis = soup.select('#m-pl-container li')print(len(lis))for j in range(len(lis)):# 获取歌单详情页地址url = ids[j]['href']# 获取歌单标题title = ids[j]['title']# 获取歌单播放量play = lis[j].select('.nb')[0].get_text()# 获取歌单贡献者名字user = lis[j].select('p')[1].select('a')[0].get_text()# 输出歌单索引页信息print(url, title, play, user)# 将信息写入CSV文件中with open('playlist.csv', 'a+', encoding='utf-8-sig') as f:f.write(url + ',' + title + ',' + play + ',' + user + '\n')
'''
Author: 你爸爸lzm
Date: 2020-12-20 23:19:00
Notes: 使用built命令快速得到一些常用的snippets,右击py文件可以preview代码
LastEditTime: 2020-12-21 21:56:48
'''
from bs4 import BeautifulSoup
import pandas as pd
import requests
import timedf = pd.read_csv('playlist.csv', header=None, error_bad_lines=False, names=['url', 'title', 'play', 'user'])headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}for i in df['url']:time.sleep(2)url = 'https://music.163.com' + iresponse = requests.get(url=url, headers=headers)html = response.textsoup = BeautifulSoup(html, 'html.parser')# 获取歌单标题title = soup.select('h2')[0].get_text().replace(',', ',')# 获取标签tags = []tags_message = soup.select('.u-tag i')for p in tags_message:tags.append(p.get_text())# 对标签进行格式化if len(tags) > 1:tag = '-'.join(tags)else:tag = tags[0]# 获取歌单介绍if soup.select('#album-desc-more'):text = soup.select('#album-desc-more')[0].get_text().replace('\n', '').replace(',', ',')else:text = '无'# 获取歌单收藏量collection = soup.select('#content-operation i')[1].get_text().replace('(', '').replace(')', '')# 歌单播放量play = soup.select('.s-fc6')[0].get_text()# 歌单内歌曲数songs = soup.select('#playlist-track-count')[0].get_text()# 歌单评论数comments = soup.select('#cnt_comment_count')[0].get_text()# 输出歌单详情页信息print(title, tag, text, collection, play, songs, comments)# 将详情页信息写入CSV文件中with open('music_message.csv', 'a+', encoding='utf-8') as f:# f.write(title + '/' + tag + '/' + text + '/' + collection + '/' + play + '/' + songs + '/' + comments + '\n')f.write(title + ',' + tag + ',' + text + ',' + collection + ',' + play + ',' + songs + ',' + comments + '\n')# 获取歌单内歌曲名称li = soup.select('.f-hide li a')for j in li:with open('music_name.csv', 'a+', encoding='utf-8') as f:f.write(j.get_text() + '\n')

数据集大家自己通过爬虫代码抓取吧。

数据集:
链接:https://pan.baidu.com/s/1LtOReq75Put9NMtegKCCCQ
提取码:love

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23999.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最近抖音上虚拟元宇宙项目-猜歌名,代码解析

介绍一下最近抖音上元宇宙虚拟项目猜歌名&#xff0c;直播游戏。用户互动猜歌名&#xff0c;30秒后自动切歌。 CSDN项目源码&#xff1a;https://download.csdn.net/download/u010978757/85326344 类似的弹幕互动游戏除了猜歌名&#xff0c;还有挤地铁、广场舞和舞厅蹦迪的&a…

德清租房软件测试,门头沟实习生出租房

10 图 2室 65㎡ 苏州街 海淀南路小区 距4号线大兴线海淀黄庄地铁站步行438m 来自经纪人: 陈伟建 1天前 8300元 8 图 1室 35㎡ 北太平庄 花园路8号院 距10号线牡丹园地铁站步行1122m 来自经纪人: 陈泽科 1天前 4800元 10 图 1室 45㎡ 西北旺 芳怡园 距16号线西北旺地…

训练数据集操作方法总结

参考博客 移动九天毕昇&#xff1a;https://blog.csdn.net/weixin_45887062/article/details/126796359 肆十二&#xff1a;&#xff08;B站有详细解说&#xff09;https://blog.csdn.net/ECHOSON/article/details/121939535?ops_request_misc%257B%2522request%255Fid%2522%2…

chatgpt赋能python:Python多种输出格式详解

Python多种输出格式详解 对于Python程序员来说&#xff0c;输出是非常重要的。无论是在开发阶段还是在生产环境中&#xff0c;输出都是我们调试程序和确认程序运行是否正常的重要手段。Python标准库提供了丰富的输出格式&#xff0c;本文介绍了几种常见的输出格式及其使用方法…

Vue3实现chatgpt的流式输出

前言&#xff1a; 我在使用Vue3开发一个chatgpt工具类网站的时候&#xff0c;翻阅了不少博客和github上的一些相关项目&#xff0c;都没能找到适合Vue3去实现stream的流式数据处理。经过踩坑&#xff0c;最终实现了适用直接调chatgpt接口的方法以及改为调用Python后端接口的方…

ChatGPT基础知识系列之大型语言模型(LLM)初识

ChatGPT基础知识系列之大型语言模型(LLM)初识 ChatGPT本质是一个对话模型,它可以回答日常问题、挑战不正确的前提,甚至会拒绝不适当的请求,在去除偏见和安全性上不同于以往的语言模型。ChatGPT从闲聊、回答日常问题,到文本改写、诗歌小说生成、视频脚本生成,以及编写和调…

特朗普、马斯克和比尔·盖茨贫民窟AI画“让人尖叫”

点击上方“AI遇见机器学习”&#xff0c;选择“星标”公众号 重磅干货&#xff0c;第一时间送 深度学习与NLP编辑 一组名为“贫民窟的亿万富豪”的人工智能&#xff08;AI&#xff09;画作在网上发布后&#xff0c;引起了全球关注。这组画作的作者是印度数字艺术家戈库尔皮莱&a…

华为开发者大会2023官宣,华为云在憋什么大招?

文丨智能相对论 作者丨沈浪 华为云也坐不住了。 在此之前&#xff0c;百度、阿里、商汤、科大讯飞等国内科技厂商以及微软、谷歌等国际巨头都已经发布了自家的大模型新品以及AIGC等相关应用。而华为云手握盘古大模型&#xff0c;却始终按兵不动&#xff0c;迟迟没有正式进场…

又一家顶级的大模型开源商用了!Meta(Facebook)的 Llama 2 搅动大模型混战的格局...

“ 百模大战&#xff0c;花落谁家&#xff1f;” 01 — 开源、免费‍ 今年2月24日&#xff0c;Meta推出大语言模型Llama&#xff08;羊驼&#xff09;&#xff0c;按参数量分为7B、13B、33B和65B四个版本。它凭借一己之力&#xff0c;引导了开源大模型的发展&#xff0c;由其演…

深度测评全新大模型「天工」,这些AI体验太香了

ChatGPT火了后&#xff0c;很多人都在关注“国产ChatGPT”的名号究竟花落谁家。 事实上&#xff0c;名号不重要&#xff0c;体验才是王道。ChatGPT能够火成“史上增长最快的消费者应用”&#xff0c;关键在于把体验提升到了新层次。毕竟对于用户来说&#xff0c;并不清楚产品背…

BLEXBot是什么蜘蛛,需要屏蔽这个爬虫吗

BLEXBot这个蜘蛛也是最近爬的比较厉害的一个&#xff0c;属于一家美国的反向链接查询网站&#xff08;WebMeUp&#xff09;的蜘蛛程序&#xff0c;它会大量的抓取我们的网站链接&#xff0c;所以一旦我们发现有他的抓取的踪迹&#xff0c;就会发现他真的是大量的抓取你的链接。…

孔乙己终结者!GPT-4拿100美元自创业,还要让马斯克下岗

【导读】GPT-4引发的新一波革命&#xff0c;把打工人推上了「断头台」。孔乙己的未来在哪里&#xff1f; GPT-4才诞生4天&#xff0c;人类就要失业了&#xff01; 不仅要取代马斯克&#xff0c;还当上了大Boss&#xff0c;「孔乙己」的未来该怎么办&#xff1f; 就连Sam Altman…

文字转绘画的AI绘画效果不好?用ChatGPT辅助下立竿见影

对于那些喜欢宅在家里度过时光的女孩们来说&#xff0c;这种略带“莫测高深”的生活方式已经成为她们的日常习惯。不需要拘束的服装&#xff0c;只需舒适的衣服&#xff0c;蜷缩在舒适的沙发上与电脑、电视作伴&#xff0c;身边还要放置各种零食和饮料。最重要的是要有一只可爱…

申请百度语音识别API 接口-免费

1、浏览器打开&#xff1a;语音识别_语音识别技术_百度语音识别-百度AI开放平台 2、右上角-控制台&#xff0c;先登录上账号&#xff0c; 3、然后去点立即使用&#xff0c;进入后台&#xff0c; 4、点击-去领取&#xff0c;领取免费的额度 5、进去之后先实名认证&#xff0c;可…

百度API调用(三)——语音识别

python 调用百度语音识别API 一、开通百度语音技术接口服务二、python实现百度语音识别1、实现功能2、代码&#xff08;已加注释&#xff09; 最后 一、开通百度语音技术接口服务 基本过程&#xff1a; 1、打开百度ai开放平台 https://ai.baidu.com/ 2、打开控制台 3、选择…

百度语音SDK使用

百度语音SDK提供: 语音识别&#xff1a;将声音转成文字语音合成&#xff1a;将文字转成语音文件&#xff0c;然后播放语音文件&#xff0c;即文字变声音。语音唤醒&#xff1a;语音唤醒&#xff0c;激活运用程序 在这里&#xff0c;本篇介绍百度语音合成的使用。 百度语音介…

python 语音识别(百度api)

文章目录 前言准备下载库代码实现以及编写我的key语音的录入&#xff1a;使用百度语音作为STT引擎并通过pyttsx3函数将返回的内容读出来形成简单的对话完整代码运行结果 前言 现在语音助手已经成为我们生活中ai的代表&#xff0c;下面让我们看一下语音助手的语音输入功能 准备…

Python调用百度API实现语音识别(一)

咪哥杂谈 本篇阅读时间约为 2 分钟。 1 前言 上篇文章介绍了下如何用 Python 剪辑视频&#xff0c;想回顾的同学可以拉到文章最下面&#xff0c;有历史链接。 有了上篇文章野狼disco的音频&#xff0c;今天就来带大家玩一下百度的API&#xff0c;如何借用百度 API 的语音识别功…

百度语音识别服务 —— 语音识别 REST API 开发笔记

在以前的项目中用到了百度语音识别服务&#xff0c;在这里做一个笔记。这里还是要和大家强调一下&#xff0c;最好的学习资料就是官网网站。我这里只是一个笔记&#xff0c;一方面整理了思路&#xff0c;另一方面方便以后我再次用到的时候可以快速回忆起来。 百度语音识别服务…

树莓派实现语音识别与语音合成——百度云语音识别API

本文采用百度云语音识别API接口&#xff0c;实现低于60s音频的语音识别&#xff0c;也可以用于合成文本长度小于1024字节的音频&#xff0c;此外采用snowboy离线语音唤醒引擎可实现离线语音唤醒&#xff0c;实现语音交互。基于本内容可实现语音控制小车&#xff0c;语音控制音箱…