人工智能再次超越人类,这次是阅读理解

在斯坦福大学举办的阅读理解比赛中,由微软和阿里巴巴分别独立开发的人工智能的得分都超过了人类。

在斯坦福大学举办的阅读理解比赛中,由微软和阿里巴巴分别独立开发的人工智能(AI)模型的得分均超过了人类。

这一人工智能里程碑是借助斯坦福大学问答数据集(Stanford Question Answering Dataset,SQuAD)实现的。该数据集由对应于500篇以上维基百科(Wikipedia)文章的超过10,000个问答对组成。阿里巴巴模型的得分为82.44,而微软亚洲研究院(Microsoft Research Asia)提交的模型则超过了这一成绩,得分为82.65。人类在SQuAD测试中的得分为82.304。

尽管是以微弱优势取胜,称不上表现优秀,但这代表自然语言处理(NLP)软件首次得以在这一特定基准上超越人类。谷歌、IBM、Facebook、腾讯、三星、Salesforce和其他公司也已向这项测试提交了自己的模型,但目前为止没有任何模型达到人类的阅读理解水平。

阿里巴巴和微软的成就表明,NLP技术的水平距离在诸如客户服务、旅行和医疗保健等领域的商业应用程序中扮演更重要的角色越来越近。如果与搜索引擎配对,可利用这项技术为企业和消费者提供所有类型的有用交互。微软表示,已在自己的必应(Bing)搜索引擎中集成了其SQuAD模型的早期版本。

微软称,软件开发人员正在努力使用这项技术将上下文引入这些交互中。微软的人工智能博客中提到:例如,假设您询问某个系统“德国总理出生于哪一年”,那么当您提出后续问题“她出生在哪座城市”时,您可能会想要它理解自己仍然在谈论同一件事。

尽管NLP领域出现了这一最新进展,微软亚洲研究院副院长周明承认,整体而言,人类在理解语言的复杂程度方面仍然比软件优秀。“自然语言处理领域仍存在许多挑战,我们大家都需要继续投资并推进其发展,”周明表示。“这一里程碑只是一个开端。”

这一观点得到了纽约大学计算机科学部门教授兼长期人工智能研究者欧内斯特·戴维斯(Ernest Davis)的详细阐述,他的观点被《华盛顿邮报》上一篇有关此话题的文章引用。戴维斯承认,尽管阿里巴巴和微软的工作成果令人印象深刻,但许多阅读理解基于阅读任何特定文章前已经了解的内容。而这些模型不会将此类上下文纳入其中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/72789.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

与AI合作穿越剧 编剧徐婷:AI脑洞大,但无法替代人类的情感表达

热门喜剧秀《周六夜现场》本季提前结束,美剧《亿万》最新第七季的更新搁浅,漫威新电影《新刀锋战士》暂停拍摄……美国影视娱乐行业的编剧们以抵制AI为由的大罢工,开始影响诸多作品的产出,据说造成了100亿美元的损失。 这场罢工已…

人工智能简史+电子版原文

自从学习了人工智能,对其的发展史产生了浓厚的兴趣,于是选择了《人工智能简史》这本书细细品味。下面将分享我看书时的一些体会。 人工智能的发展过程 我们想要理解人工智能,首先要知道这个名词从何而来。1956年达特茅斯会议被公认为人工智能…

AI:周志华老师文章《关于强人工智能》的阅读笔记以及感悟

AI:周志华老师文章《关于强人工智能》的阅读笔记以及感悟 导读 关于人工智能,长期存在两种不同的目标或者理念。一种是希望借鉴人类的智能行为,研制出更好的工具以减轻人类智力劳动,一般称为“弱人工智能”,类似…

《人工智能》之《绪论》习题解析

教材:《人工智能及其应用》,蔡自兴等,2016m清华大学出版社(第5版) 参考书: 对应同系列博客:《人工智能》之《绪论》 《人工智能》之《绪论》习题解析 1 什么是人工智能?试从学科…

解读人工智能续写名著的经典论

这段时间,人工智能“续写”名著的现象受到舆论聚焦。在人工智能的“作品”中,“林黛玉大战孙悟空”之类“脑洞大开”的情节纷纷亮相,大大超出了一般人的预料。面对《聊斋志异》里的经典故事,人工智能竟然创作出了 “蒲松龄笔下的狼…

论人工智能——写在当今人工智能突飞猛进的时代

人工智能是现代科技领域最为热门的研究方向之一,它是一种基于计算机技术和算法的智能体系,可以模拟人类的思维和判断能力,实现诸如语音识别、图像识别、自然语言处理等多项智能化任务。在日常生活中,人工智能的应用已经变得日益广…

股票交易接口软件服务涵盖范围有哪些?

通常所说的股票交易接口软件是指量化交易程序员们可以自行查询各大交易网站或交易所的股票历史数据及行情数据的工具,如:实时报价;走势图;价差图;基金、债券、期货、外汇、保险等各类金融数据查询等,进行数…

android官方转圈圈,android 弹出之后,一直转圈圈??

flutter version: version: 1.0.01 environment: sdk: ">2.1.0 <3.0.0" photo: 0.4.5 1 code: GestureDetector( child: Text(从相册选择), onTap: () async { var assetPathList await PhotoManager.getImageAsset(); _pickAsset(PickType.onlyImage, pathL…

爬取股票的历史数据(个股)

股票的历史数据爬取 爬取网易财经的个股历史数据 爬取链接&#xff1a;http://quotes.money.163.com/trade/lsjysj_000001.html? 先爬取股票的对应的代码 爬取股票代码的网站 https://www.banban.cn/gupiao/list_sh.html 代码 import requests,pymysql,re,datetime impo…

计算机技能高考600分,高三一模成绩530高考能上600分吗

有可能。很多地方在高三为了督促同学复习不松懈&#xff0c;一模二模的考试往往试题难度会比高考更高&#xff01;同时模拟考也往往不像高考评分那么工整、有详尽的步骤分&#xff0c;这就导致了学生考分的偏低。三模的试卷由于接近高考了&#xff0c;学生的状态好了&#xff0…

参加物理竞赛就是偏科严重?今天说说参加物理竞赛的好处和坏处!

前段时间&#xff0c;质心姐姐跟一些朋友聊起了竞赛这个话题。发现好多人都不知道竞赛能保送清北这个东东&#xff0c;或者就是略知一二~这让质心姐姐想来写一篇关于参加物理竞赛好处和坏处的文章。 先说说好处&#xff1a; 可以通过参加物理竞赛保送清北一般参加物理竞赛的流…

计算机竞赛满分学霸,数学英语满分!物理竞赛银牌!广西学霸杨晨煜730分的好成绩是怎样炼成的?...

6月23日中午&#xff0c; 2019年广西高考成绩出炉&#xff01;考生可以通过电话、短信、网站查询成绩 来&#xff0c;大家呼吸一下&#xff0c; 肃穆的一刻又来了 让各位家长和学生关注的 除了高考分数线 莫过于是谁的成绩能领跑全广西 南宁二中男生杨晨煜取得好成绩 (其中数学…

AP物理12近两年真题及知识点分布

2022年AP物理1和物理2的考试已经告一段落&#xff0c;CB官网也第一时间更新了这两个科目的北美FRQ真题。随着世界大部分地区恢复线下教学&#xff0c;本次考试也恢复到了传统的纸笔模式。然而&#xff0c;鉴于国内疫情形势严峻复杂&#xff0c;大陆部分地区都在近期宣布取消AP大…

2021高考理综单科成绩查询,2021全国各省市高考总分及各科分数 分值是多少

2021年高考7月7日至9日举行&#xff0c;全国大部分地区使用全国卷&#xff0c;江苏等地自主命题&#xff0c;上海、浙江、山东、海南等属于高考改革地区&#xff0c;不分文理。下面是2021全国各省市高考总分及各科分数&#xff0c;高考前可能会有微调&#xff0c;具体分数请以考…

NOC2021年测试卷1

一、单项选择题(共15题,每题3分,共45分) 1.下列应用不能体现人工智能技术的是()。 A、使用语音输入法输入文字B、使用OCR软件从图像中识别汉字C、某软件支持在线中英文互译D、某网站自动统计歌曲下载次数2.点击绿旗执行图中的脚本,若角色的坐标为 (25, 20) ,则说出的内…

高一物理题整理

1 船过河问题 【分析及解答】 这个题的关键是如何理解船的速度&#xff0c;题目假设船的速度是不变的&#xff0c;也就是一直是 v 2 v_2 v2​。 列方程如下&#xff1a; { 120 v 1 ∗ 10 d v 2 ∗ 10 d v 2 sin ⁡ θ ∗ 12.5 v 1 v 2 cos ⁡ θ \left\{\begin{array}{l} …

chatgpt赋能python:Python获取QQ群成员的方法及注意事项

Python获取QQ群成员的方法及注意事项 如果你是一名新手开发者&#xff0c;或者是有多年开发经验的python工程师&#xff0c;但是想进一步深入学习python&#xff0c;那么这篇文章就是为你量身定做的。今天我们将会讨论如何使用Python获取QQ群成员&#xff0c;并且分析一些需要…

LLT-发现股市中的“大浪”

引言&#xff1a; 股市中小的波动经常干扰股票投资人对大趋势的判断&#xff0c;倘若股市的波动同信号波动类似&#xff0c;那是不是可以用处理信号的方式处理股票波动发现大的波动呢&#xff1f;我们知道通信领域在处理信号波动时也常会遇到被噪音干扰的问题&#xff0c;这些噪…

盘点为下个牛市做准备的10个新Layer1

牛市的高光项目&#xff0c;往往都诞生于上一轮熊市。 作者&#xff1a;Azuma&#xff1b;编辑&#xff1a;郝方舟 出品 | Odaily星球日报&#xff08;ID&#xff1a;o-daily&#xff09; Crypto 世界对周期性循环并不陌生&#xff0c;自比特币诞生以来&#xff0c;这个行业已经…

用Python分析微博股市热度和A股走势的关联

摘要 俗话说&#xff1a;牛市在静悄悄中开启&#xff0c;在狂热中结束。在牛市开始时往往已经经过了数年的熊市&#xff0c;市场内大部分股票跌跌不休&#xff0c;市场投资者逐渐不在关注股市&#xff0c;在股市无人问津的时候&#xff0c;股票的估值达到了很低的水平&#xf…