DeeCamp2022 结营,AI 如何挑战生命科学关键难点?



AI+ 生命科学发展历史中,AlphaFlod2 解决了困扰生物学界长达 50 年的蛋白质空间结构预测难题,成为 AI+ 生命科学领域里程碑事件。

在全球 AI+ 生命科学技术快速发展背景下,全球已披露超过 30 款 AI 技术参与研发的药物进入临床试验阶段,资本市场上也受到认可,全球已有 10 多家公司成功上市。

未来,AI+ 生命科学还有哪些其他的想象空间?在由创新工场和清华大学智能产业研究院联合主办的 DeeCamp 人工智能训练营中,来自 AI 与生命科学跨学科领域的多位高校学员给出了自己的答案。

在刚刚过去火热的 2 个月中,来自清华大学、北京大学、南洋理工大学、复旦大学、中科院计算所、香港中文大学等全球各个地区顶尖高校的计算机、生命科学等专业的 150 多位学员自发组成 30 支队伍,多所顶尖高校的 30 支参赛队伍,聚焦用 AI 探索生命科学新边界这一主题。

最终入围辩论赛的 6 支队伍,尝试基于人工智能技术解决生命科学领域的 PROTAC 药物研发、大规模蛋白质组学信息发现、药物分子发现、全基因组表达预测、蛋白质相分离能力预测、蛋白结构预测酶活性等问题,最终挑战大规模蛋白质组学信息发现赛题的 ProteinMiner 团队摘得 DeeCamp2022 总冠军的荣誉。

在本次大赛中,多支参赛团队关注的问题也是产业关注的热点,来自学生的全新视角和多位资深产业人士的碰撞,能够碰撞出哪些新思路?

DeeCamp2022 结营,AI 如何挑战生命科学关键难点?

DeeCamp 学员

探索生命科学未解难题

DeeCamp 人工智能训练营是创新工场发起的一项面向全球大学生的公益项目,专注培养应用型 AI 人才,迄今已经举办六届。

今年 DeeCamp 将 AI 应用聚焦于生命科学领域,当下这一时期也正是 AI+ 生命科学从早期的技术积累逐渐过渡到价值验证阶段。

过去,制药行业到目前依然是效率最低的行业之一,也是信息技术难以颠覆的行业,但 AI 技术对生物技术的改革依然势不可挡。AI 已经开始渗透到药物研发的各个环节,包括虚拟筛选、分子生成、靶点发现、ADMET 预测、药物重定向、化合物合成等药物发现阶段。

有很多专家认为,AI 将构建医疗行业的全新革命。DeeCamp 的参赛学员们则为这场全新革命带来了新想象。

其中,获得总冠军的 ProteinMiner 挑战蛋白质组学信息发现。

蛋白质测序是人类理解生命活动,并对之进行调控的最重要的环节之一,虽然基因测序已经日渐成熟,但蛋白测序还缺乏高通量的测序技术。与此同时,传统分析方法依赖已有蛋白质序列数据库信息,无法分析全新的蛋白质或者抗体,蛋白质从头测序的需求应运而生。

ProteinMiner 立足于 AI 与大数据驱动的蛋白质的质谱测序技术,致力于提升大规模地发现未知的蛋白序列与结构信息的能力。ProteinMiner 提出预训练的 AI 谱图语言大模型,提升质谱从头测序的精度,加速免疫相关的新抗原 / 抗体的发现,以推动个性化免疫治疗的进程。此外,ProteinMiner 提出谱图分类深度模型,实现快速的交联质谱数据的鉴定,构建实验数据支撑的组学规模的蛋白质空间距离信息数据库。

DeeCamp2022 结营,AI 如何挑战生命科学关键难点?

对于产业界未能解决的难题,DeeCamp 的学员们通过 AI 技术探索突破口;在另一个维度上,DeeCamp 学员们也创想通过 AI 为现有的解决方案降本增效。

以镁伽科技为产业导师的 InfGene 团队为例,InfGene 探索基于代表性基因集的全基因组表达预测技术,这支由海内外高校成员组成的复合团队通过算法计算减少必须的基因组检测次数使用。

这一技术旨在减少超高通量测量的成本。全基因组表达谱的数据需要测量人类 20000 多个基因的转录表达水平,超高通量的检测造成较高的成本。事实上,人类基因表达之间存在高度的关联,不同基因的表达水平之间存在相互推算的可能。

在这一理论基础上,美国国立卫生研究院 ( NIH ) 启动了 LINCS 计划,推出了低成本转录组检测技术 L1000。

L1000 技术就利用了基因表达之间的相关性,基于大规模的统计分析辨识出 978 个基因作为全基因组的标志基因 ( landmark genes ) ,通过测量标志基因的表达量,可以推算出其余 20 000 多个基因的表达量。

InfGene 团队发现分形自编码器(FAE)可以选取相比 L1000 Panel 更加精简的代表性基因集作为特征,在 XGBoost 模型上达到比 L1000 Panel 更优的全基因组表达预测表现。该方法有望进一步节约大规模测量成本,形成可专利的新 Panel,并拓展应用至建立组织特异性 Panel,推动精准医疗。




上一篇:引领基因测序仪“国产替代”,华大智造登陆科
下一篇:微生物发酵床养猪的技术要点