腾讯新研究登Nature子刊,让细胞与计算机直接“对话”,还能辅助医生精准治癌...

羿阁 发自 凹非寺
量子位 | 公众号 QbitAI

腾讯把BERT方法用于单细胞注释技术,还登上了Nature子刊

能辅助医生精准治癌的那种。

c442e50fb6e6fdb0ad81ae54df4d8a5f.png

此次聚焦的单细胞RNA测序(scRNA-seq)技术,一直被称为生命科学领域的的革命性工具,对于“精准医疗”具有极高的应用价值。

但是,以前受制于数据样本量小、人工干预多等因素,一直难以推广使用。

这次腾讯首次将“transformer”应用到该领域,使其真正实现了高解释性高泛化性高稳定性

目前,该模型已在GitHub上开源 (链接附在文末)。

新模型怎么做到的?

众所周知,人类各种组织之间细胞的类型、状态和相互作用差异巨大。

单细胞RNA测序技术的出现,可以细粒度地观察和刻画各个物种中组织、器官和有机体中单细胞分子图谱(细胞表达),堪称给细胞中的每个基因都印上专属“身份证”。

通过这一技术,研究人员可以更好地研究这些组织及其中存在的不同类型的细胞。

更进一步地说,还可以更好地了解肿瘤微环境,以达到精细分析病因、精准匹配治疗方案的效果。

882a2036b587103e9d3a2d4a398f0efc.jpeg

但是,受数据样本量小、人工干预多、过度依赖marker gene(已报道的特异性基因)等因素的影响,单细胞测序细胞类型注释技术一直面临着泛化性、可解释性、稳定性均比较低的问题,现存的算法也难以有更广泛的应用。

具体来说,人工注释费时、主观性强、误差大、不利于发现新的细胞类型;机器注释则经常出现在一个检测组织里有效,换到另外一个检测组织里就没效的问题,还是需要人工参与。

为此,研究人员开发了一种基于预训练深度神经网络的模型:scBERT模型,并首次将“transformer”运用到单细胞转录组测序数据分析领域。

scBERT模型,顾名思义是基于BERT的思路和范式。

236fe982c19162964e7a6b52f12c49b2.png

在预训练数据选择上,为了保证全基因组内基因级别的可解释性,scBERT没有做任何的降维或筛选处理,最大程度上保留数据本身的特性和信息。

此外,该模型复用了大规模的公开数据集,包含不同实验来源、批次和组织类型的单细胞数据,以保证模型能学习到更为“通用”的知识,精准捕获单个基因的表达信息及两两基因之间的作用关系。

093a52b58c6fed3be07edbd6f57cb9d9.png

在实验中,scBERT模型也证实了其在单细胞测序上呈现出的高解释性、高泛化性、高稳定性。

截至目前,通过了9个独立数据集、超过50万个细胞、覆盖17种主要人体器官和主流测序技术组成的大规模benchmarking测试数据集上,该算法模型的优越性均得以验证。

值得一提的是,在极具挑战的外周血细胞亚型细分任务上,相较现有最优方法的70%准确度提升了7%。

3bd0f4bf26e648b800e750dbe645d400.png

不仅如此,这一技术的突破在实际应用中也有很重要的价值:

未来可用于临床单细胞测序数据,并辅助医生描述准确的肿瘤微环境、检测出微量癌细胞,从而实现个性化治疗方案或者癌症早筛。

同时,对疾病致病机制分析、耐药性、药物靶点发现、预后分析、免疫疗法设计等领域都具有极其重要的作用。

研究团队

研究团队主要来自腾讯AI Lab,共同一作有三位:Fan Yang、Wenchuan Wang和Fang Wang。

研究人员称,未来他们会继续基于自身先进AI技术的积累,与下游临床、制药和生命科学基础研究领域进行密切合作。

GitHub链接和论文链接放在文末,感兴趣的小伙伴可以自取~

GitHub链接:
https://github.com/TencentAILabHealthcare/scBERT

论文链接:
https://www.nature.com/articles/s42256-022-00534-z#Abs1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/55478.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一文速览医学多模态进展

每天给你送来NLP技术干货! © 作者|杨锦霞 机构|中国人民大学高瓴人工智能学院 来自 | RUC AI Box 引言:目前,自然图像-文本的多模态预训练模型已经在各种各样的下游任务上取得了非常好的效果,但是由于…

模拟登录百度做一些事

最近写了一个程序,模拟登录百度进行一些操作,例如下载文库文档,网盘,修改个人信息等等,分析过程很痛苦,但是做完之后回头想想还是很意思的。代码有点乱,我不整理了,这里分享一下模拟…

微信网页PC端登录扫二维码登录

最近搞得PC端扫二维码登录,写了个控制器,把方法和注意事项都整理了一下,给大家共同学习下。 先说步骤吧: 1.注册微信开放平台https://open.weixin.qq.com,一定要清楚微信开放平台和微信公众平台是分别独立的&#xff0…

微信网页版登陆原理

微信网页版登陆原理 请求微信服务器返回一个会话ID 微信Web版本不使用用户名和密码登录,而是采用二维码登录,所以服务器需要首先分配一个唯一的会话ID,用来标识当前的一次登录,通过请求地址: https://login.weixin.qq.…

web网页登录

web登录验证 1.创建loginDemo项目 2.添加tomcat 3.在web目录下创建jsp文件login fail success UserData 4.修改web.xml设置首页 5.演示 欢迎使用Markdown编辑器 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器…

百度登录界面

1 <!doctype html>2 <html lang"en">3 <head>4 <meta charset"UTF-8">5 <title>百度一下</title>6 <meta name"Keywords" content"关键字">7 <meta name"Descript…

pc端网页实现微信扫码登录

微信开发文档&#xff1a;https://developers.weixin.qq.com/doc/oplatform/Website_App/WeChat_Login/Wechat_Login.html 点击按钮&#xff0c;跳转到微信授权页面&#xff0c;会出现一个二维码。 //拉取授权页面 let APPID 网页应用的appid let REDIRECT_URI encodeUR…

电脑wifi只能微信聊天但是不能打开百度上网

问题描述&#xff1a;WiFi手机可以连接&#xff0c;电脑上也能连接&#xff0c;可以微信聊天&#xff0c;但是不能浏览器上网&#xff0c;显示域名解析错误。 背景:小编过了年回来上班后&#xff0c;发现公寓里的无线网在电脑上无法访问互联网&#xff0c;就非常的纳闷。首先我…

高级程序员和新手小白程序员区别你是那个等级看解决bug速度

IT入门深似海 ,程序员行业&#xff0c;我觉得是最难做的。加不完的班&#xff0c;熬不完的夜。 和产品经理&#xff0c;扯不清,理还乱的宿命关系 一直都在 新需求-做项目-解决问题-解决bug-新需求 好像一直都是这么一个循环。&#xff08;哈哈哈&#xff09;我觉得一个好的程序…

微软Office Plus吊打WPS Office?不一定,WPS未来被它“拿捏”了

微软Office Plus吊打WPS Office&#xff1f; 微软的Office是一款非常强大的软件。不仅仅在办公领域中能给我们带来便利&#xff0c;在娱乐和生活的各个方面的管理也能带来很多便利。 当然&#xff0c;作为国产办公软件的排头兵WPS与微软Office的抗衡已经有长达30多年&#xf…

百度的文心一言 ChatGTP 的对比

同样的5个问题&#xff0c;让百度的“文心一言”与ChatGPT来回答&#xff0c;两者区别在于&#xff0c;前者是就坡下驴的“傻瓜”式回复&#xff0c;后者是细思极恐的AI脱口秀。抛开高下立判不谈&#xff0c;尽管百度十年磨一剑专攻人工智能&#xff0c;但和国外的AI产业相比&a…

毕业写论文不要傻傻的到中国知网CNKI充值了,分享几个常用的写论文必备的网站!

我把这 7 个工具&#xff0c;发给了毕业两年的学姐&#xff01;看完学姐都懵了&#xff0c;说&#xff1a;早知道有这么好的资源&#xff0c;当年在学校写毕业论文也不会那么痛苦了&#xff01; 1、搜论网 找学术论文&#xff0c;就上搜论网 www.soolun.com为老师、学生、媒…

【快速写好毕业论文】你不得不知晓的七个常用文献搜索平台

本篇推文共计2000个字&#xff0c;阅读时间约3分钟。 01 引言 又是一年的毕业季&#xff0c;毕业论文成为了大多数同学们难以逾越的屏障。 毕业论文存在以下特点&#xff1a; 章节多、页码多、图表多、文献多、编号多。 那么如何快速写好毕业论文&#xff0c;安稳度过学生阶段最…

大数据时代,我竟然在用Excel和SPSS做数据分析,真香!

目录 写在前面概述什么是统计?统计.计算机与统计软件(重点)变量及其分类数据收集 第二章问卷的组成和结构几种典型的问卷题型: 第三章:数据的录入和清理数据的录入数据的清理3.4在Excel中核对数据建立调查问卷的SPSS数据文件 第4章单变量的一维频率分析利用SPSS对单选题进行一…

教你接入Midjourney,不用梯子也能玩

1、效果 话不多说&#xff0c;先上最终出图效果&#xff0c; 我给的关键词是一只白色的猫 2、接入流程 API文档可以来这里查&#xff08;可以白嫖100次midjourney出图和10次gpt4体验&#xff09;&#xff0c;我这里精简一下接入流程&#xff0c;方便大家快速接入 2.1、文字生…

超级编程AI登上Science封面!AlphaCode编程大赛卷趴一半程序员

【导读】在编程比赛中达到人类水平的AlphaCode&#xff0c;再登Science封面。 这个12月&#xff0c;正当OpenAI的ChatGPT势头正旺时&#xff0c;那个曾经卷趴一半程序员的AlphaCode登上Science封面了&#xff01; 论文链接&#xff1a;https://www.science.org/doi/10.1126/sc…

斯坦福2023【FrugalGPT】减少大模型的商业化应用成本

文章目录 主要解决问题采用什么方法Prompt adaptationLLM approximationLLM cascade 实验结论讨论与展望 FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance 主要解决问题 这篇文章主要是要解决如何降低调用大语言模型的成本(Chat…

智见|黄铁军:未来的大模型生态中将会只有少数赢家

2023智源大会可谓群星璀璨。中外200余位人工智能顶级专家参会&#xff0c;人工智能领域最关键的人物、机构悉数亮相。 全面、专业、前沿&#xff0c;会场上大咖们观点激荡、多元碰撞&#xff0c;会场下观众们兴奋异常、座无虚席。 会上&#xff0c;北京智源人工智能研究院院长黄…

开放丨Kaldi语音识别理论与实践

语音识别是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学。这项技术可以提供比如自动客服、自动语音翻译、命令控制、语音验证码等多项应用。近年来&#xff0c;随着人工智能的兴起&#xff0c;语音识别技术在理论和应用方面都…

【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍

由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟&#xff08;AIIA&#xff09;评估组、快商通、语音之家、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍&#xff0c;将于2022年10月9日18:30-19:30线上直播。 沙…