NEWS|药物发现公司正在定制ChatGPT:方法如下

大型语言模型正在帮助科学家与人工智能交谈,甚至产生潜在的药物靶点。

近几个月来,世界大部分地区都被OpenAI的ChatGPT等文本生成引擎的出现所震惊,人工智能(AI)算法能够生成看起来像是由人类编写的文本。虽然像微软和谷歌这样的科技公司专注于使用此类引擎来改善搜索,而其他人则担心它们可能会导致大量抄袭文章、假新闻和糟糕的诗歌的出现,但生物技术公司正在研究这些算法来支持他们的业务,从而促进药物发现。

已经依赖人工智能寻找新药的生物技术公司可以将文本生成作为一种简单、直观的方式,与其他一些人工智能和机器学习工具进行互动。Andrew Beam是哈佛大学公共卫生学院流行病学系的科学顾问,他称ChatGPT是“一个非常有趣的界面”,它允许用户比当前的界面更容易地使用其他形式的人工智能。

例如,纽约和香港的Insilico Medicine是一家通过其人工智能驱动的平台搜索潜在药物靶点的公司,现在正在使用ChatGPT作为与其靶标发现平台交互的新方式,增强知识图谱提供的关系和集成 - 以前是整合数据的主要方法。计算化学家Petrina Kamya是Insilico Medicine的AI平台负责人兼总裁。他说,由于ChatGPT,他们可以与自己的发现系统进行对话:''而不是点击,点击和点击,你只需要问一个问题,它就会组成你阅读和理解的文本。''

除了使用聊天机器人来帮助制作书面材料,如论文、专利或授权申请外,其他人还可以将它们专门用于药物发现-作为一种专门针对生物科学的高级搜索引擎。“我们可以有一个更具体的,例如,Bio ChatGPT或Med ChatGPT,''阿拉巴马大学伯明翰分校的计算化学家Lurong Pan说,他是Ainnocence的创始人兼首席执行官,Ainnocence是一个拥有帮助药物发现平台的生物技术公司。''这可能会改变人们的搜索方式。例如,谷歌和DeepMind今年早些时候发布了Med-PaLM,这是一个旨在为医疗问题提供答案的聊天机器人。

所有这些聊天机器人都基于大型语言模型(LLM),该算法经过从互联网收集的数百万个文本示例进行训练。LLM是一种生成AI——能够创建以前不存在的数据。对于文本,LLM学习单词之间的统计关系。然后,给定诸如问题之类的提示,它们通过预测哪个单词最有可能跟随前一个单词来生成文本。结果似乎非常自然,尽管聊天机器人经常做出与现实不一致的陈述-“幻觉”事实。ChatGPT基于名为Generative Pre-train Transformer的LLM,Med-PaLM借鉴了Google的Pathways Language Model,,而Bard是Google正在将其纳入其搜索引擎的更通用的聊天机器人,依赖于对话应用程序的语言模型(LaMDA)。

Kamya说:''这些LLM已经被证明对寻找药物的人有用''。以前,Insilico平台的用户能够查看知识图谱,这是与特定疾病相关的基因的可视化表示,以及已知与这些基因相互作用的物质。这是有用的信息,但研究人员使用它的方式是有限的。现在,随着聊天功能的增加,数据变得更容易访问。Kamya说:''能够与该工具进行对话非常有用。如果你能够以你想要的方式查询我们的生物医学知识图,它会变得'更有趣''。

例如,如果一个科学家想调查牛皮癣,聊天功能可以查看该疾病的知识图。它将提供一个文本描述,包括涉及牛皮癣的主要信号通路和基因,以及已知的与它们相互作用的化合物。然后,用户可以提出任何问题 - 例如,''这个图中有多少个基因?''- 并获得即时响应,或者寻找基因与特定疾病(如肉瘤)之间的关联。名为PandaOmics的Insilico平台显示肉瘤的顶级靶基因是PLK1。用户可以进一步询问,请求链接到特定途径 - 例如细胞凋亡 - 并立即得到答案。

ChatGPT 生成对话输出。然后,Insilico使用多年来收集的根据自己的数据训练的其他预测AI程序来验证聊天中出现的内容。因此,''我们的输出非常准确'',该公司创始人兼首席执行官Alex Zhavoronkov说。Zhavoronkov的母语不是英语,他也使用ChatGPT来帮助他在撰写论文时提高语法,他最近因为通过将ChatGPT列为期刊文章的合著者而引起了争议。

科学家们还发现,llm有助于连接数据并以不同的方式表示数据。''总部位于英国牛津的制药技术公司Exscientia一直在试验LLM,将普通的英语陈述翻译成精心构建的机械断言,以帮助生成他们的知识图谱'',该公司的首席技术官Garry Pairaudeau说。

LLM仍在不断发展,开发人员正在以惊人的速度添加功能。十二月发布的ChatGPT基于OpenAI的GPT 3.5版本。更新 GPT-4 于三月月中旬发布,性能大大优于其前身。三月底,ChatGPT增加了一个所谓的检索插件,可能对药物发现特别有用。这是一个允许软件搜索个人或公司文档的模块,伦敦人工智能驱动的生物技术公司BenevolentAI的首席技术官Dan Neil对此感到兴奋,因为它可以根据公司自己的数据定制聊天功能。''如果你有一个专门的分析,你写下来并在公司内部文件中描述,你可以说,'嘿,看看我们在内部得到的这些结果,这如何更新你的想法?你能找到或想象生命科学中的其他新方法,这些方法实际上利用了我们发现的这些信息吗?',''他说。

尽管名字不同,但语言模型不需要接受英语或其他人类语言的训练。同样的,对统计关联的衍生技术也可以应用于DNA或蛋白质序列的“语言”。然后,它们可以产生新的蛋白质,而不是一个新的句子,这可能会成为很好的药物靶点。“这是同样的想法,”Beam说,“但我们展示的是生物数据,而不是来自互联网的文本。”

有些人担心,训练人工智能系统设计很有可能击中目标的分子需要大量数据,这些数据由人类手工标记。这样的收集并不总是即将推出,因为定期提供这些信息的公司并不总是热衷于分享它。Pan说:''允许ChatGPT写句子的同样的方法可能会为新的分子设计提供完美的解决方案。一个提供了大量未标记数据的语言模型——比如UniProt数据库中包含的近2.5亿条蛋白质序列——可以自己推导出分子构建块之间的正确关系。''

Bioxcel治疗公司使用人工智能来识别在第二阶段或第三阶段试验中,甚至在批准后被搁置的药物,该公司正在考虑LLM从不同的数据库中挑选出潜在的化合物。但是,神经科学家兼该公司首席战略官Frank Yocca说:''只有当LLM适合Bioxcel的人工智能工具套件时,它们才会被证明是有价值的。现在,就你得到的东西而言,它不是很准确'',他警告说。''但我们正处于起步阶段。''

确保结果准确并避免人工智能幻觉的一种方法是尼尔所说的“证据浮出水面”。当LLM产生它声称是事实的东西时,他的公司添加了一种算法来提供引用和参考来支持这一点。他们的系统使用语义搜索(一种评估单词含义的方法)从论文和生物学文本中提取支持断言的句子。该系统从数百万份文档中选择一些相关句子,并将它们呈现给人类专家,然后人类专家可以查看这一小部分数据来判断所谓的事实是否真实。

Yocca说,人们可能会被最新技术所诱惑,而忽视它是否真的有助于他们实现目标。他说:''你只要让机器去做你想做的事情,而不一定能给你一个功能性的答案,就会消耗你,我们尽量避免这种情况。”

不是每个人都加入了ChatGPT的潮流。“基本上我们已经拥有了生成我们想要的东西的所有工具,我们已经在探索很多信息,我们现在并没有试图扩展更多,”巴黎Enterome免疫学研究负责人Joao Magalhaes说。首先,他担心提供患者信息来训练LLM可能会损害隐私。

不过,他并不反对采用新的人工智能技术。例如,该公司使用AlphaFold,这是DeepMind开发的人工智能系统,该系统可以观察氨基酸序列,并使用这些序列来预测蛋白质的三维结构,包括许多以前未知的结构。''这对我们来说是一个巨大的进步,''Magalhaes说。他将密切关注ChatGPT,如果它看起来可能有用,公司将考虑采用它。

Beam指出,其他类型的生成人工智能,例如可以从随机噪声中创建图像的扩散模型,已经进入生物学领域。因为这些模型可以创建蛋白质结构的新图像,所以它们''可以说是药物发现和药物开发的更直接的路线'',Beam说。

他说,如果不出意外,ChatGPT的兴起使人们广泛意识到生成人工智能的潜力,并鼓励生物技术公司仔细研究。“ChatGPT让每个人都意识到的是生成模型的力量,”Beam说。

文献来源: nature biotechnology Volume 41 | May 2023 | 585–596 | 586

-------------------------------------------

欢迎点赞收藏转发!

下次见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28092.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT强势加入芯片设计!不用学专业硬件描述语言了,说人话就行

西风 发自 凹非寺量子位 | 公众号 QbitAI 和ChatGPT聊聊天,就可解决CPU开发过程中的一大难题? 纽约大学(NYU)研究人员完成了一件看似不可能的事情: 无需专业的硬件描述语言(HDL),仅靠…

激素、酶、细胞因子区别;肿瘤细胞信号通路

参考: https://www.xuetangx.com/course/THU08261001403/12423502?channeli.area.learn_title 本文章主要有chatgpt生成: 1、激素、酶、细胞因子区别 概念、功能 激素、酶和细胞因子都是生物活性物质,激素、酶和细胞因子都是蛋白质&#…

雷军宣布进军ChatGPT大战!国内ChatGPT赛道一触即发!

4-14号,小米CEO雷军在微博宣布,正在研发一些“有趣的技术和产品”。 雷军称,此前曾多次被问及对于大模型和AIGC的看法。 此次,雷军正式对这些问题公开进行回应,表示“在AI领域已经耕耘多年”,对大模型“当然…

ChatGPT 提示词全网最全案例汇总

GPT地址,收藏不迷路:https://ai.cxyquan.com/ ChatGPT 提示词案例分享 充当旅游指南 我想让你做一个旅游指南。我会把我的位置写给你,你会推荐一个靠近我的位置的地方。在某些情况下,我还会告诉您我将访问的地方类型。您还会向我推…

比较了几种编程语言后,我终于get到了少儿编程的真谛

真是让人感受到人工智能有多么神奇! 看展途中,同去的朋友对我说,自己一直觉得未来人工智能是大趋势,所以正在让孩子学编程。可是,他看孩子学的编程都只是用一款叫Scratch的软件拖来拖去,做做简单的动画和游…

少儿编程简介

少儿编程一般来说,是针对4-17岁的青少年儿童开展的教育,不像众多家长了解的成人编程那样,不是单纯的敲击键盘、枯燥地编写一行行晦涩难懂的英文代码,而是以青少年可以接受的方式,比如实体积木块,图形化积木…

少儿编程值得报班学习吗?别问了,程序员懵了

今年中小学生的暑假期间,想必很多程序员收到了以下私信: 程序员你好,少儿编程值得学习吗? 1、不是一个行业,你让程序员怎么回答? 程序员从事的工作,属于互联网行业;少儿编程的培训&…

向幼儿群体提供实用的少儿编程

政策为青少年、儿童编程教育背书。首先,我国政府、教育部门发布文件明确表明支持青少年、儿童编程教育的发展。格物斯坦认为:为了应对人工智能时代发展的需要,越是进步和充满便利的时代,越需要人的思考和认识。AI时代,…

谷歌全线反击!PaLM 2部分性能已经超越GPT-4

ChatGPT横空出世,所有人都能够明确感知到AI的惊人潜力,瞬间改变了整个AI行业的节奏,不紧不慢的谷歌也开始紧张了。 ChatGPT舆论热潮仍未消退,红色警报又拉响 北京时间5月11日凌晨1点,Google I/O 2023开发者大会上发布…

ChatGPT初体验step by step:ChatGPT解决人类提出的数理逻辑问题,Python编程实践

ChatGPT初体验step by step:ChatGPT解决人类提出的数理逻辑问题,Python编程实践 如果已有有效的open ai的api key,则跳过本文(1)(2)(3)(4)&#x…

我的 ChatGPT初体验

要有一个ChatGPT帐号,这个很重要,YouTube 有很多教程,这里就不细说了, 最近家里的房子想装修,个人是小白知识匮乏,就想问下ChatGPT给一些学习思路和方法下面直接上图了。

写给开发同学的 AI 强化学习入门指南

该篇文章是我学习过程的一些归纳总结,希望对大家有所帮助。 最近因为 AI 大火,搞的我也对 AI 突然也很感兴趣,于是开启了 AI 的学习之旅。其实我也没学过机器学习,对 AI 基本上一窍不通,但是好在身处在这个信息爆炸的…

vue3.0仿微信聊天|Vue3+Vant3.x聊天实例

Vue3-Chatroom 基于vue3.x开发的仿微信界面聊天室。 使用vue3.0vuex4.xvue-router4vant3.xv3popup构建的移动端聊天实例。基本实现了消息发送/gif动图、图片/视频预览、网址查看、红包/朋友圈等功能。 实现技术 编码/技术:vscodevue3.0/vuex4.x/vue-router4UI组件库…

4DIAC 运行时(Forte)连接PIFace Digital 2 模块

Piface 模块 Piface 是树莓PI 上的一个通用数字输入输出模块。采用SPI 与树莓派通信。 该模块使用microchip的MCP23S17SP 芯片。通过SPI 接口控制16个GPIO 端口,端口可以设置为输入或者输出方式。使用单一的接口来扩展linux IO 端口,减少了软件的复杂性…

什么是音色?

要问最近最火的节目是什么? 《浪姐》绝对可以冲击C位。 要问最近最火的剧是哪部? 有全中国小学生最近都怕的张东升老师那部前三甲无疑。 要问最近最火的歌是哪首? 《Mojito》或许是唯一的答案。 这首极具拉丁风格的歌让周董再一次回答了“谁是…

关于springboot+simbot+mriai实现QQ群智能回复机器人

前言 前几天在一个在一个java的交流群上发现了一个舔狗机器人,感觉有点意思。在git上逛了一圈发现simbot这个框架封装得还不错,这是一个基于kotlin的框架但他并不仅至此。用java也是能进行编写工作,我们简单尝试一下。 前期准备 本次demo使用…

四. IEC 61499开源项目4diac配置modbus

开源的4diac运行时只支持modbus主站(modbus客户端),配置forte运行时支持modbus主站可以通过运行时操作支持modbus从站的远程IO模块,此处讲解的是modbus tcp。从4diac官网下载的forte运行时默认是不支持modbus协议的,要…

PDF Forte Pro(PDF转换器)v3.1.2免费版

PDF Forte Pro是一款优秀的PDF转换器,它支持将超过10种常用文件格式转换为PDF,包括word,Excle,PPT,PSD,Image和Dwg。所有Windows平台完美兼容,转换后的PDF文档无质量损失,而且拥有超…

FORTE和RIPPLE(瑞波)出资一亿美元成立基金,帮助游戏开发者应用区块链技术

a16z被投企业Forte向游戏开发者提供区块链技术平台和资金支持。 为游戏行业提供区块链技术平台的Forte和Ripple(瑞波)的开发者生态基金Xpring出资一亿美元成立基金帮助游戏开发者更好的利用区块链技术。该笔资金将与Forte的技术平台一起运作,…

关于MS Access替代方案 低代码神器 nuBuilder Forte:基于PHP和MySQL开源工具

很久很久以前用MS Access 写了几个程序,一直想把它们换掉,但始终没有找到一个工作量适度的工具,近来有点时间于是在网上查询,终于有了新发现nuBuilder Forte,这是需要服务器和PHP的软件包,一般来说花一到两…