在过去的一年中,人工智能迎来了突破性的技术,它们来自OpenAI的DALL-E2和ChatGPT。
Link: https://openai.com/dall-e-2
Link: https://openai.com/blog/chatgpt
或许你在网络上已经或多或少了解了一些,甚至已经在无意中使用过了这些技术所带来的成果。而这些技术,已经开始冲击传统的AI,并带来全新的研究方向。
介绍
DALL-E2和ChatGPT都是生成式人工智能,也就是说,它可以根据简单的描述和关键词来创造出事物。例如,DALL-E2是根据文本描述,来生成相应的图像;ChatGPT则是一种自然语言模型,能够实现自然对话,也就是说你可以和它对话,甚至可以解决一些问题,如图。
图片来自官网
研究相关
如此充满创造性的生成式人工智能在生物技术领域同样受到关注。例如,蛋白质工程的传统方法涉及执行迭代诱变和蛋白质序列的选择和从头设计以创建具有所需特性的蛋白质,包括结构和序列特异性。但是生成式AI有可能改变这一协议,使其更容易从头生成人工蛋白质序列。
Madani及其同事开发了ProGen,这是一种语言模型,在通过已知蛋白质家族的2.8亿个序列的训练后,可以生成具有可预测功能的蛋白质序列。
Link: https://www.nature.com/articles/s41587-022-01618-2
生物技术公司也在研发和利用生成式AI来创造新的治疗药物。因为小分子药物研发领域将受益于这些生成式人工智能模型。进入FDA审批程序的候选药物最终很少被批准用于临床,但人工智能模型有潜力发现更多与生物学相关的化合物。例如,于2020年成立的Generate Biomedicines公司,便开始使用生成式人工智能来创建蛋白质,并且这些蛋白质可以用作新型疗法,更好地适应特定条件。
Link:https://generatebiomedicines.com
对于研究人员和学生,则是开发了一个名为OpenBioML的“开放研究实验室”, OpenBioML的目标是成为一个机器学习和生物学交叉的开放、合作研究实验室。从讨论最新的发展到为前沿项目合作,再到复制封闭资源的研究。寻求最大限度地发挥人工智能在生命科学中的积极影响。OpenBioML得到了Stability AI(由生物技术公司所开发)的支持,旨在通过为合作研究项目提供大规模计算资源,使该技术民主化。其首批两个项目包括BioLM,将自然语言处理应用于计算生物学和化学,以及DNA- diffusion,开发可以通过文本提示生成DNA序列的人工智能。
Link:https://openbioml.org/
结语
虽然传统的机器学习方法已经在生物医学领域取得了很多的成功案例,但是仍然存在一些不足。生成式人工智能的出现,将进一步推动生物医学的发展。生成式AI在生物医学领域应用的前景如何呢?
有请chatGPT来给我们讲两句。[鼓掌!][欢迎!]
生成式 AI 在生物科学领域的应用可能具有巨大的潜力。例如,生成式模型可以生成新的分子结构,以便进行药物发现和开发;生成式模型可以生成新的生物图像,以便进行生物医学图像分析;生成式模型还可以生成新的基因组数据,以便进行基因组学研究等。
然而,生成式 AI 在生物科学领域的应用仍然面临许多挑战。例如,生成式模型的准确性和可靠性仍然需要进一步提高;生成式模型的解释性和透明性仍然需要进一步提高;生成式模型的数据偏差问题仍然需要得到解决。
因此,总体来说,生成式 AI 在生物科学领域的应用前景具有很大的潜力,但仍然需要解决许多技术挑战。