谷歌AI拜大年:为聋哑人带来科技福利,首页涂鸦有惊喜

晓查 发自 家中
量子位 出品 | 公众号 QbitAI

大年初一,谷歌用人工智能为大家带来了双份的喜悦。

首先是谷歌AI博客更新了一项新的技术,为聋哑人带来了科技福利,只要有一部Android手机就能享受到实时语音转文字的技术。

逢年过节,谷歌涂鸦(Google Doodle)自然也不会缺席,今年过年谷歌把TensorFlow技术融入Doodle中,每个人都可以试一试这个十二生肖皮影戏。

实时语音转文字

这项服务名为实时转写(Live Transcribe),现已在谷歌Play商店提供免费下载

640?wx_fmt=png

Live Transcribe支持70多种语言,覆盖全球80%以上的人口,当然包括中文在内。

语言转文字已经不是什么稀奇的技术,谷歌也早已在YouTube中加入了这项功能。但Live Transcribe的强大之处在于,它达到了为聋哑人提供实时对话的实用程度。

以前基于实时语音转文字,通常需要计算密集型模型、详尽的用户研究和昂贵的连接访问。

为了解决这些问题,谷歌使用云服务提高实时转写的准确性,但也带来了的网络数据消耗的问题。

640?wx_fmt=png

为此,谷歌基于此前在AudioSet上的VGGish模型,实现了一个基于设备的神经网络语音检测器。它能检测语音并自动管理到云端的网络连接,最大限度地减少长时间的数据使用。

为了使实时转录尽可能直观,谷歌与专门面向聋人提供高等教育的加拉德特大学合作,启动用户体验研究合作。

转换后的文字需不需要用不同颜色显示单词的可信度?这是一个问题。传统上认为这对用户有帮助。

640?wx_fmt=gif


而谷歌的研究表明,如果这些单词如果在可信度上没有区分,文本反而更易于阅读。因此Live Transcribe展示的文字全是白色。

另一个提升用户体验的是显示当前环境噪声水平。在嘈杂房间里识别讲话内容是一个很大的挑战。

640?wx_fmt=gif

为了解决这一问题,软件中加入了一个指示器,形象地展示语音与噪声的大小关系,让用户根据实际情况实时调整手机话筒的位置。上图中的小圆点代表环境噪声大小,大圆表示语言的实时音量。

最后附上Live Transcribe的下载地址:

https://play.google.com/store/apps/details?id=com.google.audio.hearing.visualization.accessibility.scribe

十二生肖皮影戏

640?wx_fmt=gif

谷歌今天首页的Doodle已经变成庆祝中国农历新年,内容不仅仅是猪年的窗花,点击进去有更多惊喜——用TensorFlow技术教你皮影戏。

皮影戏是中国一种讲故事的古老艺术方式,用剪纸或手势放在光源前,投影在半透明的屏幕上。

现在,所有人都可以用Google Doodle的影子艺术来庆祝农历新年。用户可以在相机前摆出不同手势变化出十二生肖造型。

640?wx_fmt=gif

去年谷歌就已经开始利用TensorFlow和TPU处理器来识别用户的手势,现在又用TensorFlow.js把它移植到浏览器中,在任何带前置摄像头的手机或电脑上都可以直接运行这套手势识别的机器学习模型。

试玩地址:

https://shadowart.withgoogle.com/?lang=zh-cn

加入社群

为给AI从业者提供更好的交流平台,量子位现开放「AI+行业」社群,将会不定期邀请AI大咖、知名企业家、技术大牛进群分享,福利多多,欢迎小伙伴入群交流。


面向人群:AI相关从业者,技术、产品等人员,根据所在行业可选择相应行业社群;


入群方式:请在量子位公众号(QbitAI)对话界面回复关键字“行业群”,获取入群方式。


Ps.为保证社群价值,小助手会对申请入群的朋友进行审核,请大家理解!

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25828.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用Netty实现WebSocket网络聊天室

最近学习Netty,学习到WebSocket一章节,将Netty中WebSocket的样例代码做了一些简单的改造,实现了一个简易的WebSocket网络聊天室,源码并非完全自己实现,只是将一些别人的代码做了下整合改造,今分享至此&…

聋哑六年级计算机课教学进度计划,小学六年级下册信息技术教学计划三篇

【导语】六年级的学生,通过三年的信息技术课的学习,已经对信息技术这门课很熟悉了,他们已经懂得了一些关于信息技术课的基础知识,掌握了计算机的基本操作,能利用画图软件绘出简单的图画,学习了Word文字处理…

计算机学院五名学生开发手语app,我院开发的手语合成系统有望让聋哑人用上手机...

高交会上参观者就系统性能向开发人员提问 网络信息中心宣(文/肖琼林 吴兴勤 图/吴兴勤)我院计算机科学与技术学科部智能计算研究中心开发的基于虚拟人技术的中国手语合成系统,有望成为千百万聋哑人的福音。 中国有数量巨大的聋哑人群体,据北京市手语研究…

【博主推荐】HTML浪漫表白求爱(附源码)

HTML浪漫表白求爱 带花询问表白HTML源码带花询问表白HTML效果展示爱心花环表白HTML源码爱心花环表白HTML效果展示动画图片表白HTML源码动画图片表白HTML效果展示酷炫爱心表白HTML源码酷炫爱心表白HTML效果展示树形爱心表白HTML源码树形爱心表白HTML效果展示唯美爱心表白HTML源码…

4链提币接口通道源码

介绍: 淘到的多签提币接口 可以借鉴参考 仅用于研究 请与下载24小时内删除 您的任何行和后果与本站无关 建议任何操作都走官方! 云盘下载地址: http://zijieyunpan.cn/yXYGwOTuCoT 演示:

最新仿闲鱼链接闲鱼验货宝+独立后台管理

后台一键生成链接,独立后台管理 教程:修改数据库config/Conn 不会可以看源码里有教程 下载程序:https://pan.baidu.com/s/16lN3gvRIZm7pqhvVMYYecQ?pwd6zw3

转转闲鱼源码搭建教程

教程:修改数据库账号密码直接使用。 下载程序:https://pan.baidu.com/s/16lN3gvRIZm7pqhvVMYYecQ?pwd6zw3

chatgpt赋能python:Python区域找图教程:快速定位您需要的图像

Python 区域找图教程:快速定位您需要的图像 在计算机视觉和机器人领域中,区域找图是一项重要的任务。它可以帮助我们找到图像中的特定区域,从而提高我们对图像的理解和分析能力。在本教程中,我们将学习如何使用Python中的OpenCV库…

基于ChatGPT生成的泊松圆盘采样代码 Python纯算法源码

先上代码直接运行 # -*- coding: utf-8 -*- """ --********************************************************************-- --file: 柏森采样示例代码 --author: donganning --create time: 2023/3/30 14:24 --description: --***************************…

IdentityServer 4 自定义身份校验/通过 token获取用户信息

Demo https://github.com/MartinAaron/data_collection 1、自定义身份校验 public static IEnumerable<Client> GetClients(){return new List<Client>{//grant_type basicnew Client{ClientId "xczx",AccessTokenLifetime 36000,AllowedGrantTypes G…

微信小程序登录 + 基于token的身份验证

官方时序图如下&#xff1a; https://developers.weixin.qq.com/miniprogram/dev/framework/open-ability/login.html 图里其实说的很清楚了&#xff0c;清理下流程&#xff1a; 1.前端调用wx.login()获取code值 2.前端通过调用wx.getUserInfo获取iv、rawData、signature、e…

Token:用户身份验证的令牌

一、Token是什么 Token&#xff0c;就是用户身份验证的令牌&#xff0c;代表执行某些操作的权利的对象&#xff0c;本质上是服务端生成的一串加密字符串、用于客户端进行请求的“令牌”。 当用户第一次使用账号密码成功登 陆后&#xff0c;服务器就生成一个token和token失效…

调用华为API实现身份证识别

调用华为API实现身份证识别 1、作者介绍2、调用华为API实现身份证识别2.1 算法介绍2.1.1OCR简介2.1.2身份证识别原理2.1.3身份证识别应用场景 2.2 调用华为API流程 3、代码实现3.1安装相关的包3.2代码复现3.3实验结果 1、作者介绍 雷千龙&#xff0c;男&#xff0c;西安工程大…

二十二、身份验证与权限

一、 准备工作 为了讲清楚身份验证与权限&#xff0c;我们再创建一个应用projects,设计模型如下&#xff1a; class Project(models.Model):name models.CharField(项目名称, max_length20, help_text项目名称)desc models.CharField(项目描述, max_length200, help_text项目…

人脸核身基础版 SDK 接入 > 合作方后台上送身份信息

文章目录 一、概述二、实现流程2.1. 获取获取 access_token2.2. 获取 SIGN ticket2.3. 生成签名2.4. 上送身份信息2.5. 获取 NONCE ticket 三、实战3.1. 获取获取 access_token3.2. 获取 SIGN ticket3.3. 生成签名3.4. 上送身份信息3.5. 获取 NONCE ticket 四、开源地址 一、概…

身份证验证接口API(仅需一行代码,公安部实时接口)

身份确认在互联网越来越普及&#xff0c;在二手、电商、贷款、交友、招聘等主流互联网应用中都有明确的刚需&#xff0c;传统的 身份证核验方式是用户上传身份证图片&#xff0c;客服后台人肉审核&#xff0c;但问题在于根本无从确认身份证的真实性&#xff0c;也不能确认该身份…

危!GPT将影响80%工作岗位,挣得越多越危险?OpenAI发布重磅研究

源&#xff5c;新智元 GPT-4发布没几天&#xff0c;OpenAI直接告诉所有人&#xff0c;GPTs是通用技术&#xff0c;80%的美国人的工作受到影响。想要保命&#xff0c;且看这34大「铁饭碗」。 前脚刚推出GPT-4&#xff0c;OpenAI后脚就发布了35页论文官宣&#xff1a; 80%的美国人…

音视频技术开发周刊 | 286

每周一期&#xff0c;纵览音视频技术领域的干货。 新闻投稿&#xff1a;contributelivevideostack.com。 比尔盖茨&#xff1a;AI 时代开启 盖茨谈到AI如何改善人类的不平等现象&#xff0c;并在医疗、教育等方面做出贡献&#xff0c;但也存在风险。 GPT-4 Copilot X震撼来袭&a…

对话 ClickHouse CTO Alexey:目光不仅限于成为最快的数据库 | 近匠

作为世界上最快的 OLAP 列式数据库之一&#xff0c;ClickHouse 能在毫秒级的时间内处理数百亿行的数据。ClickHouse 公司在官网上&#xff0c;也是简单扼要地介绍了自己的数据库&#xff1a;“Fast”。 ClickHouse 的灵魂人物 AlexeybMilovidov&#xff0c;则是一位将“慢”践行…

马斯克放话:没有我就没有 OpenAI,连名字都是我起的!

整理 | 郑丽媛 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 在 ChatGPT、GPT- 4 的爆火下&#xff0c;近来 OpenAI 这个名字已逐渐成为科技圈的“高频热词”&#xff0c;其创立初期与马斯克之间的“恩怨”也被时常提及。 有人说自从马斯克走后&#xff0c;Open…