逃离无声的世界,跟AI一起听叶落的声音

9月27日,是第63个国际聋人日。在国际聋人日结束两天后,YouTube却取消了可以帮助听障人士的字幕选项,让人唏嘘。数字时代如同一个未曾停歇的洪流。而在这洪流之中,听障人士因为被按下了「静音键」而被数字世界渐渐遗忘和抛弃。毕业于哈工大的张建宗找到了帮助听障人士触碰数字世界的途径。

 

近日,YouTube 突然取消了视频上的「社区贡献」功能,原本内容创建者可以给他们的视频上传字幕和说明。

 

逃离无声的世界,跟AI一起听叶落的声音

 

 

在7月份宣布的这一举措一经出台,就引发了社区的强烈抗议,此举惹恼了失聪者、听力障碍者和大批国外粉丝。

 

这几乎是谷歌有史以来最糟糕的决定,9月27日,是第63个国际聋人日。在国际聋人日结束两天后,YouTube 却取消了可以帮助听障人士的字幕选项。

 

逃离一个无声世界,听障人士如何踏上「数字班车」?

 

你的世界声色犬马,五彩斑斓,然而有没有想过,在我国有2780万听障人士,还生活在一个寂静无声的世界中。

逃离无声的世界,跟AI一起听叶落的声音

 

移动互联网、人工智能、云服务等信息技术快速发展的今天,数字时代如同一个未曾停歇的洪流,滚滚向前。而在这洪流之中,这些听障人士因为被按下了「静音键」而被数字世界渐渐遗忘和抛弃。

 

作为一名技术人,哈尔滨亿时代数码科技开发有限公司的技术负责人张建宗很早地注意到了这当中的隐忧。

 

他毕业于哈尔滨工业大学,计算机科学与技术专业。名校加身,前途一片光明,本来有大把的机会可以进大型企业工作,但在这些机会中,他并没有找到自己想要找寻的「意义」。

 

此后多年,他全身心地投入到了信息无障碍领域的产品开发工作中,矢志不渝。

 

加入亿时代对于张建宗来说是一件有价值的事,有情怀的人做起事情来总是很有动力。2008年北京奥运会和残奥会期间,亿时代给予全程网站无障碍技术支持。

 

逃离无声的世界,跟AI一起听叶落的声音

 

 

张建宗讲到,在去年一次很偶然的机会看见一位听力障碍者,在努力的使用两部手机来学习视频内容:一部手机播放视频,通过一根专用的连接线,由另一部手机进行字幕翻译。

 

对于普通人来讲,明明是再简单不过的事情,对于听障人士来讲却需要大费周章。

 

这一幕也深深地印在了他的脑海中,长久以来与计算机打交道的他,马上想到为什么不能用一个手机就解决他们交流的问题。

 

随着需求调研的深入,张建宗对于听障用户的需求逐渐清晰起来,除了前面无字幕视频的字幕提取,听障用户平时同样也会在生活、办公中的陌生人社交感到阻碍,如何弱化他们的日常「疏离感」显得尤为重要。

 

技术,不应是冰冷的代码和算法,而应该服务于每一个个体才是最本质的需求,社交需求就是其中最主要,也最容易被忽视的。

 

于是,在张建宗的脑海里,一款具备语音文字互转、实时视频语音字幕转写、在线远程视频手语翻译功能的应用构想应运而生。紧接着就是9个月的努力开发和迭代优化,终于「畅听无碍」APP正式上线,开始免费向听障用户提供服务。

 

逃离无声的世界,跟AI一起听叶落的声音

 

 

这背后还有和华为工程师的不解之缘。

 

亿时代作为黑龙江的企业代表之一,在华为黑龙江代表处的陪同下共同加入了走进华为的参观访问,在此过程中接触到华为在19年提出的TECH4ALL数字包容倡议,十分感动。亿时代出于对理念的认同,华为技术的信任,达成了这次有「温度」的合作。

 

有华为底层的技术作为支撑,结合听障人士的生活,提供了AI场景的无限可能。

 

华为解决方案工程师王一帆表示,「在这个项目中华为提供了华为云的能力,同时也提供了大量的研发和营销人员帮助项目实现落地,并帮助市场推广。」

 

畅听无碍,接过了数字世界的传声筒,刷剧学习无障碍

 

孔庆贤是畅听无碍APP第一位手语志愿者,她已经从事帮助听障人士的工作有12年之久。据她描述,自己做这件事的初衷是因为目睹了一次在教堂举行的聋哑人婚礼,他们用嘶哑的声音喊出了「我愿意」。

 

正是出于这份感动,她辞掉了本职工作,义无反顾地致力于用手语翻译帮助听障人士。

 

但毕竟仅仅通过单一的人力来帮助听障人士,力量还是太稀微了,弥合数字鸿沟,需要技术的大力加持和资源的汇集。

 

在畅听无碍APP上,听障人士可以通过远程视频方式与专业的手语翻译进行沟通,再由手语翻译和医生、政府、警察、律师、窗口办事人员、 亲友等进行沟通。达到辅助听障人士沟通的目的。

 

逃离无声的世界,跟AI一起听叶落的声音

 

 

从孔庆贤的亲身经历中,张建宗也获得了更多的灵感和开发的需求。如今畅听无碍已经有超过1万的用户在使用,通过用户的不断反馈进一步优化产品。

 

逃离无声的世界,跟AI一起听叶落的声音

 

 

与普通人不同,「看」是听障者感知世界最重要的方式,除了手语翻译之外,语音和文字的转换成了听障人士和外界沟通的最主要桥梁之一。

 

「畅听无碍」的背后正是基于华为云的语音识别、语音合成、实时语音转写等相关的人工智能技术,从而让张建宗的技术畅想变成现实应用。

 

「畅听无碍」APP提供的「自如交流」服务,就好比听障人士随身携带的一名「语音助手」。尤其是在与陌生人交流时,例如问路咨询,商场购物时,不方便通过社交软件交流,可以通过「畅听无碍」,通过语音-文字相互转换,达到随时随地快速沟通的目的。

 

此外,在多人会议交流等场景,「畅听无碍」可以提供全程录音功能和文档保存功能,并一键分享到微信、微博、QQ等进行二次采集编写,对于听障朋友而言,他们不必再被不明来龙去脉的会议结论而困扰。声音,如此得以被「看见」。

逃离无声的世界,跟AI一起听叶落的声音

 

而这些看的见的声音,来自华为云。

 

现在语音转写技术,大都使用了很深的神经网络,在实验环境的准确率和转写速度相差不多,但是实际使用中却参差不齐,而使用畅听无碍的用户所处环境复杂多样,对语音识别和转写的稳定性要求更高。

 

华为云的语音转写技术,将词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升了编解码速度和转写准确率,一句话,一段话,多人群聊等场景都能很好地适应。

 

语音转写可以帮助听障人士「听」到别人说的话,而要想更好地沟通,声音无疑是最好的方式,畅听无碍不仅可以把语音实时转写成文字,也能将文字合成为接近真人的发音,让听者感受不到差异,输出的语音音色和语速都是可调的,听起来更加自然,也让冰冷的技术更加人性化了。

 

数字时代,也催生出了诸多新兴生活和娱乐方式,抖音、快手、B站等等一众新兴社交平台层出不穷, B站数据显示,2019年一年已有1827万人在B站学习,相当于2018年高考人数的2倍。

 

但是,由于大量的视频没有字幕,这让听障人士以前不得不敬而远之。因此,得益于实时语音转写的AI技术,当「畅听无碍」可以实时的将视频中的连续音频流准确转换成文字字幕时,这无疑给了听障人士更全面地了解世界,跟上时代节奏的机会。

逃离无声的世界,跟AI一起听叶落的声音

 

 

当前,虽然「畅听无碍」APP通过人工智能技术可实现语音文字实时互转,在一定程度上辅助了听障人士的沟通与生活,但在一些「复杂沟通」场景下,如在医院问诊、法律咨询、窗口办事等,仍需要专业的手语志愿者进行辅助交流。

 

因此,在亿时代的不懈努力下,他们通过自建手语翻译中心,以远程视频的形式为听障人士免费提供各类专业领域的实时手语翻译。「畅听无碍」成为了听障人士随身相伴的「手语翻译」,让他们不再因为交流的障碍而寸步难行。

 

逃离无声的世界,跟AI一起听叶落的声音

 

基于AI技术的「畅听无碍」APP,不仅仅是解决了听障人士简单的交流问题,更重要的是对于他们生活质量的提升,让他们感受到了世界的善意与美好。

 

而这正是AI本该有的样子,技术本该有的温度。

 

「数字包容」惠及全球5亿人,这才是AI正确的打开方式

 

从基础的社交、办公到生活娱乐,AI技术助力「畅听无碍」惠及了听障人士生活的方方面面。从此,一个原本无声的世界,因为有AI的加持,而变得绘声绘色。有这样的初衷,技术也不再是冰冷的代码和算法,而是一个个鲜活的个体更丰富的生活。

 

2019年,华为曾发出「TECH4ALL数字包容」倡议,希望通过技术、应用和技能,赋能每个人、每个家庭、每个组织,实现数字包容愿景,共同构建万物互联的智能世界。

 

逃离无声的世界,跟AI一起听叶落的声音

 

 

用华为轮值董事长胡厚崑的话说,TECH4ALL,旨在在接下来的5年里让全球再多5亿人从数字技术中获益,最终实现科技普济天下。

 

如今,AI也被越来越多的技术人运用到了各种领域,它已成为了热带雨林的守护者,荒漠化问题的解决者,环境污染的治理者等等。

 

逃离无声的世界,跟AI一起听叶落的声音

 

 

当AI不再是单单追求生产效率提升换取商业价值的工具,而是面向需要帮助的群体为他们提供全新的生活、工作方式和融入世界的机会的底座时,这才是AI的「正确的打开方式」,和为人类发展带来的真正价值。

 

「畅听无碍」为面向残障人士志愿服务的免费软件。

 

当前虽然「畅听无碍」APP通过人工智能技术可实现语音文字互转,在一定程度上辅助了听障人士的沟通与生活,但在一些场景下,仍需要手语志愿者通过「畅听无碍」APP中在线视频通话的功能,为听障人士提供实时手语翻译。

 

当前我国手语方言超过百种,手语专业志愿者非常稀缺,希望大家可以将信息转发,让更多具有良好手语基础的志愿者可以看到,加入到「畅听无碍」的志愿者阵营中,更好的为听障人士提供一份帮助。

 

加入方式:下载「畅听无碍」APP-->「我的」-->「角色切换」-->选择「手语翻译」。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25833.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一文看尽 2020 年谷歌 AI 重大突破

2021-01-28 10:12:14 在二十年前刚刚加入谷歌时,我们关注的问题只有一个——如何面向这么多不同种类的联网计算机提供一整套质量出色且涵盖范围全面的网络信息搜索服务。到如今,尽管我们面临着各种各样的技术挑战,但谷歌已经基本达成了组织全…

厚积薄发的90后:读博前三年零文章,后期发力产出11篇一作,现任985高校博导...

点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 本文来源:重庆发布、重庆大学电气工程学院、清华研读间 本科毕业于山东大学,随后保研直博到清华大学,毕业后任职某知名企业做研究,再到如今成为重庆大学的博士生…

谷歌AI拜大年:为聋哑人带来科技福利,首页涂鸦有惊喜

晓查 发自 家中量子位 出品 | 公众号 QbitAI 大年初一,谷歌用人工智能为大家带来了双份的喜悦。 首先是谷歌AI博客更新了一项新的技术,为聋哑人带来了科技福利,只要有一部Android手机就能享受到实时语音转文字的技术。 逢年过节,谷…

用Netty实现WebSocket网络聊天室

最近学习Netty,学习到WebSocket一章节,将Netty中WebSocket的样例代码做了一些简单的改造,实现了一个简易的WebSocket网络聊天室,源码并非完全自己实现,只是将一些别人的代码做了下整合改造,今分享至此&…

聋哑六年级计算机课教学进度计划,小学六年级下册信息技术教学计划三篇

【导语】六年级的学生,通过三年的信息技术课的学习,已经对信息技术这门课很熟悉了,他们已经懂得了一些关于信息技术课的基础知识,掌握了计算机的基本操作,能利用画图软件绘出简单的图画,学习了Word文字处理…

计算机学院五名学生开发手语app,我院开发的手语合成系统有望让聋哑人用上手机...

高交会上参观者就系统性能向开发人员提问 网络信息中心宣(文/肖琼林 吴兴勤 图/吴兴勤)我院计算机科学与技术学科部智能计算研究中心开发的基于虚拟人技术的中国手语合成系统,有望成为千百万聋哑人的福音。 中国有数量巨大的聋哑人群体,据北京市手语研究…

【博主推荐】HTML浪漫表白求爱(附源码)

HTML浪漫表白求爱 带花询问表白HTML源码带花询问表白HTML效果展示爱心花环表白HTML源码爱心花环表白HTML效果展示动画图片表白HTML源码动画图片表白HTML效果展示酷炫爱心表白HTML源码酷炫爱心表白HTML效果展示树形爱心表白HTML源码树形爱心表白HTML效果展示唯美爱心表白HTML源码…

4链提币接口通道源码

介绍: 淘到的多签提币接口 可以借鉴参考 仅用于研究 请与下载24小时内删除 您的任何行和后果与本站无关 建议任何操作都走官方! 云盘下载地址: http://zijieyunpan.cn/yXYGwOTuCoT 演示:

最新仿闲鱼链接闲鱼验货宝+独立后台管理

后台一键生成链接,独立后台管理 教程:修改数据库config/Conn 不会可以看源码里有教程 下载程序:https://pan.baidu.com/s/16lN3gvRIZm7pqhvVMYYecQ?pwd6zw3

转转闲鱼源码搭建教程

教程:修改数据库账号密码直接使用。 下载程序:https://pan.baidu.com/s/16lN3gvRIZm7pqhvVMYYecQ?pwd6zw3

chatgpt赋能python:Python区域找图教程:快速定位您需要的图像

Python 区域找图教程:快速定位您需要的图像 在计算机视觉和机器人领域中,区域找图是一项重要的任务。它可以帮助我们找到图像中的特定区域,从而提高我们对图像的理解和分析能力。在本教程中,我们将学习如何使用Python中的OpenCV库…

基于ChatGPT生成的泊松圆盘采样代码 Python纯算法源码

先上代码直接运行 # -*- coding: utf-8 -*- """ --********************************************************************-- --file: 柏森采样示例代码 --author: donganning --create time: 2023/3/30 14:24 --description: --***************************…

IdentityServer 4 自定义身份校验/通过 token获取用户信息

Demo https://github.com/MartinAaron/data_collection 1、自定义身份校验 public static IEnumerable<Client> GetClients(){return new List<Client>{//grant_type basicnew Client{ClientId "xczx",AccessTokenLifetime 36000,AllowedGrantTypes G…

微信小程序登录 + 基于token的身份验证

官方时序图如下&#xff1a; https://developers.weixin.qq.com/miniprogram/dev/framework/open-ability/login.html 图里其实说的很清楚了&#xff0c;清理下流程&#xff1a; 1.前端调用wx.login()获取code值 2.前端通过调用wx.getUserInfo获取iv、rawData、signature、e…

Token:用户身份验证的令牌

一、Token是什么 Token&#xff0c;就是用户身份验证的令牌&#xff0c;代表执行某些操作的权利的对象&#xff0c;本质上是服务端生成的一串加密字符串、用于客户端进行请求的“令牌”。 当用户第一次使用账号密码成功登 陆后&#xff0c;服务器就生成一个token和token失效…

调用华为API实现身份证识别

调用华为API实现身份证识别 1、作者介绍2、调用华为API实现身份证识别2.1 算法介绍2.1.1OCR简介2.1.2身份证识别原理2.1.3身份证识别应用场景 2.2 调用华为API流程 3、代码实现3.1安装相关的包3.2代码复现3.3实验结果 1、作者介绍 雷千龙&#xff0c;男&#xff0c;西安工程大…

二十二、身份验证与权限

一、 准备工作 为了讲清楚身份验证与权限&#xff0c;我们再创建一个应用projects,设计模型如下&#xff1a; class Project(models.Model):name models.CharField(项目名称, max_length20, help_text项目名称)desc models.CharField(项目描述, max_length200, help_text项目…

人脸核身基础版 SDK 接入 > 合作方后台上送身份信息

文章目录 一、概述二、实现流程2.1. 获取获取 access_token2.2. 获取 SIGN ticket2.3. 生成签名2.4. 上送身份信息2.5. 获取 NONCE ticket 三、实战3.1. 获取获取 access_token3.2. 获取 SIGN ticket3.3. 生成签名3.4. 上送身份信息3.5. 获取 NONCE ticket 四、开源地址 一、概…

身份证验证接口API(仅需一行代码,公安部实时接口)

身份确认在互联网越来越普及&#xff0c;在二手、电商、贷款、交友、招聘等主流互联网应用中都有明确的刚需&#xff0c;传统的 身份证核验方式是用户上传身份证图片&#xff0c;客服后台人肉审核&#xff0c;但问题在于根本无从确认身份证的真实性&#xff0c;也不能确认该身份…

危!GPT将影响80%工作岗位,挣得越多越危险?OpenAI发布重磅研究

源&#xff5c;新智元 GPT-4发布没几天&#xff0c;OpenAI直接告诉所有人&#xff0c;GPTs是通用技术&#xff0c;80%的美国人的工作受到影响。想要保命&#xff0c;且看这34大「铁饭碗」。 前脚刚推出GPT-4&#xff0c;OpenAI后脚就发布了35页论文官宣&#xff1a; 80%的美国人…