雷锋网【AI科技评论】按:在刚刚过去的2017数据科学杯(2017 Data Science Bowl)吸引了全球10000名数据科学家参赛,大家在癌症检测算法上各显神通。其中来自清华的两位科学家组成的团队捧得一等奖。此外所有的获奖团队将会在即将到来的2017 GTC大会分享他们的大赛经验,雷锋网(公众号:雷锋网)也将亲临现场进行报道。以下为雷锋网编辑对此次大赛的简单介绍。
肺癌是所有癌症中最致命的,并不仅仅是因为它是最常见的变异疾病。
据美国肺脏协会报道,几乎百分之八十的病人都会在确诊后的五年内死亡。大部分原因是因为人们发现癌症时已经太晚了。
数据科学杯是人工智能中最令人振奋的比赛之一,清华大学的两位研究者廖方舟(Liao Fangzhou)和Li Zhe 利用深度学习和GPUs构造出了一个算法可以救命,就是及早的识别癌症去治疗它。他们的挑战是使用机器学习去提高CT扫描的精确度。CT在检测肺癌上比X光更加有效。
这两位研究者击败了其余将近2000个研究团队,共计10000名研究员,赢得了第三届数据科学杯的第一名,奖励50万美金。赞助商有咨询公司Booz Allen Hamilton ,Kaggle数据科学工会,以及来自英伟达和其他公司的赞助者。
5月8号至11号,其中胜出的团队将会在GPU科学大会(GTC)上分享获胜经验。大会举办地在硅谷,胜出者将会来一起瓜分100万美金。这是竞赛举办以来奖金最多的一次。由劳拉和约翰阿诺德基金提供资金支持。
第二名获奖团队奖励20万美金,第三名奖励10万美金,剩余的奖金则由前十名的其他团队平分。
参赛者Liao是清华大学计算神经科学的博士生,他的参赛动机来自于他个人的想法,肺癌在他们的家乡很常见,那里空气污染严重,在他中学旁边就有一个烟雾弥漫的工厂。比赛开始不久,他得知他的一位朋友也得了这病。
他们团队使用的是英伟达 TITAN X GPUs 来训练卷积神经网络。
其他的优胜者分别是:
• 第二名:Julian de Wit and Daniel Hammack,他们都是来自荷兰的软件和机器学习工程师,在2016年的数据科学杯,Julian de Wit排名第三,在他的私人博客中,详细描述了他在肺癌筛查中负责的部分。
• 第三名:Aidence团队,使用的是特斯拉K80 GPU 加速器来开发他们的算法,他们的团队成员是在为位于旧金山的非盈利公司Open AI工作。
此次数据科学杯不仅展现了强大的集体智慧,而且数据科学和先进的分析算法可以被用来攻克社会难题,例如根除癌症。
需求:精确的肺癌CT扫描
低剂量CT扫描比之常规的的X射线更可能检测到癌症,它可以将身体截面详细显示出来。在最近的美国国家癌症研究所的实验中,接受低剂量CT扫描比只通过X射线检测癌症的死亡风险要降低百分之十五到二十。
不幸的是,根据发表在《内科学年鉴》的一项研究,多达三分之一的CT扫描在没得肺癌时探测到了肺癌,给病人和他的家人造成了不必要的恐慌和紧张,而且也产生了一些不必要的检查和其他程序。
降低低剂量CT扫描的出错率是提高肺癌CT筛查准确性并对公众健康产生积极影响的关键步骤。国家癌症研究所项目主任Keyvan Farahani这样说道。Farahani,是即将举行的GTC会议的嘉宾之一,对比赛的设计和数据集提供科学指导。
在今年的数据科学杯参赛者的登录时长约为15万个小时,并提交了近18000个算法。
要了解更多关于深度学习如何正在改变医疗保健等行业,敬请关注雷锋网。此外,美国西部时间5月10日上午9:00 - 11:00,黄仁勋将用2个小时的Keynote阐明今年NVIDIA推动人工智能的全线产品和战略,大家可以关注官方页面http://nvda.ws/2qQOhGM收看。在GTC大会,我们也会第一时间将精彩信息从硅谷报告给大家。
本文作者:杨文
本文转自雷锋网禁止二次转载,原文链接