Prof. Yasset Perez-Riverol
EMBL’s European Bioinformatics Institute
Quantms ecosystem: data, formats and algorithms to generate AI-ready proteomics datasets
Yasset Perez-Riverol教授系统阐述了Quantms生态系统的构建目标与关键技术路线。他指出,当前蛋白质组学数据在规模、格式和质量控制等方面仍存在显著差异,这极大限制了其在人工智能模型中的可用性。为此,Quantms通过标准化的数据结构、可扩展的算法模块以及自动化的处理流程,致力于将原始质谱数据高效转化为“AI-ready”的结构化输入。Yasset Perez-Riverol教授详细介绍了生态系统在数据清洗、保留时间校准、特征提取、定量一致性控制等核心环节中的策略优化,并强调了格式统一在提升数据重用性与跨项目通用性方面的关键作用。此外,Quantms还支持与多种下游机器学习框架无缝集成,为蛋白质组学研究提供了一个高度灵活、可重复的分析平台。该演讲为AI与蛋白质组学深度融合提供了重要的技术路径与实现参考。
Prof. Chris Sander
Harvard Medical School
Machine learning for proteomic perturbation biology
Chris Sander教授阐述了“扰动生物学”的愿景:通过系统性地扰动细胞并测量多维响应,构建可计算、可预测的虚拟细胞模型。他指出,挑战在于超越单一蛋白质测量,整合时序数据与领域知识,以数据驱动方式重新定义细胞过程。其团队利用AI方法(如蛋白质结构预测与设计模型EVcouplings)指导酶工程和药物设计(如靶点灵活性、组合用药),并将范围扩展到疾病预防,例如利用电子健康记录预测胰腺癌风险。最终目标是构建从细胞、组织到器官的多尺度可执行模型,实现从预测到干预的精准医学。
Arunima Singh 编辑
Nature Methods
Publishing in Nature Methods and pursuing an editorial career
Nature Methods 杂志资深编辑 Arunima Singh 博士为会议作了精彩报告,她详细介绍了期刊的主要关注领域、编辑团队构成及文章类型。进一步分享了编辑在审稿过程中重点关注的要素,包括选题(topic)、创新性与重要性(novelty and significance)、实用性与普适性(practical value and generality)、验证性(validation) 以及应用性(application),并系统讲解了 Methods 类文章的写作技巧。
Singh 博士特别强调,Nature Methods 最核心的关注点是方法本身——作者应当 “make the method the star”。此外,她指出,研究者应将工作放在更广阔的学科背景下,不仅要阐述当前的技术前沿(state-of-the-art),更要突出自己的方法如何 超越(beyond) 现有技术;同时应提供直接的比较并展示方法的具体应用。她还提醒,方法的可重复性(reproducibility) 和对编辑、审稿人而言的可理解性(accessibility) 同样至关重要。
此外,Singh 博士还介绍了作为专业编辑的日常工作,以及成为科学期刊编辑所需的经历与技能,如提升写作与阅读能力、持续关注科研前沿动态(keep informed about broad research trends)、并积极与编辑建立联系(network with editors)等。她的分享为未来希望投稿 Nature Methods 或立志从事科学出版工作的研究者提供了宝贵的指导与启发。
Prof. Henning Hermjakob
European Bioinformatics Institute, EMBL-EBI
Reactome 4: pathways reimagined – dynamic visualisation and intelligent chat
图片
Henning Hermjakob教授介绍了Reactome数据库第4版的重要更新,重点展示了全新上线的动态通路图可视化功能,以及集成的智能对话助手,旨在提升用户的交互体验与分析效率。新版Reactome支持通路图的动态重构,并可实现上下游信号传播路径的自动追踪,显著增强了生物通路数据的可视化深度与可解释性。讲座现场还演示了如何通过自然语言提问与平台进行交互,实现对关键分子事件或功能模块的快速定位。这一系列功能的迭代升级,不仅进一步巩固了Reactome作为高质量开放数据库的地位,也使其成为支持系统生物学研究的强大智能平台。
Prof. Wout Bittremieux
University of Antwerp
A living benchmark to advance AI in proteomics de novo peptide sequencing
图片
Wout Bittremieux教授介绍了一个名为 “A Living Benchmark to Advance AI in Proteomics De Novo Peptide Sequencing” 的平台。该平台提供了29个基准数据集,共包含640万条已注释的谱图,涵盖了多种物种(人类、动物、植物、微生物)、多种酶切方式以及不同类型的质谱仪器。应用场景包括免疫肽组学、宏蛋白质组学、单细胞蛋白质组学、抗体研究以及病毒翻译后修饰(PTMs)。
通过三种主流的蛋白质组搜库工具获得了 ground truth PSMs。该平台同时整合了18种de novo测序工具的运行环境与参数设置,可系统地比较预测PSM与真实PSM 的一致性,并计算肽段和氨基酸水平的评估指标。值得一提的是,这些de novo预测工具会持续更新,使该平台保持动态演进。
总体而言,该平台为基于AI的de novo肽段测序提供了一个功能强大、持续更新的标准化基准体系,为推动de novo测序方法的发展做出了重要贡献。
Prof. Wilson Goh Wen Bin
Nanyang Technological University
Harnessing AI and proteomics for mental health diagnostics and prognostics: Towards scalable care in Singapore
图片
Wilson Goh教授的报告介绍了一个利用AI和蛋白质组学来改善精神健康诊断与预后、旨在实现新加坡可扩展护理的研究项目。报告强调了全球精神健康危机以及对于精准生物诊断和早期干预(特别是对精神病)的需求。
该研究基于LYRIKS研究队列,收集复杂的纵向数据(临床、神经心理、多组学)。其核心方法是开发复杂的数据中心AI算法(如PROJECT, MVIDIA, OPDEA)来分析蛋白质组学数据。这些方法能稳健处理缺失数据,整合多视图信息,并识别与生物学相关的蛋白质特征,这些特征能够预测如精神分裂症和耐药性等状况。最终目标是建立一个国家精神健康蛋白质组学平台,将这些工具与电子健康记录和数字健康数据相结合,从而实现从社区到临床层面的早期筛查、风险分层和个性化治疗。
高歌 教授
北京大学
Towards a causality-oriented Cell in silico: From prediction to design
图片
高歌教授提出了构建一个“面向因果的在硅基细胞”的愿景,旨在从预测走向设计。他指出,尽管多组学技术揭示了细胞作为功能单元的异质性及基因调控的复杂性,但如何解析其内在的因果层级关系仍面临挑战。他的团队主张,将海量组学数据与前沿AI/机器学习方法相结合,构建一套基于数据驱动和知识引导原则的“因果导向生成模型”。这一方法将弥合从数据到认知的鸿沟,最终实现一个“细胞调控语言模型”,从而在计算机中模拟并理性设计细胞的调控行为。
Allegretti Yuan Hu 编辑
Cell Systems
Behind the scenes at Cell Press
图片
本次由 Cell Systems 科学编辑Allegretti Yuan Hu博士主讲的题为“Behind the scenes at Cell Press”的报告,全面介绍了Cell Systems 及其运营模式。作为爱思唯尔旗下机构,Cell Systems 拥有涵盖生命、物理、临床及环境科学等多个领域的广泛期刊组合。
演讲详细阐释了编辑评估稿件的标准与流程,包括研究范围、重要性及方法论严谨性等。同时,重点介绍了为作者提供的多项服务,如预审询、稿件转移以及创新的多期刊投稿系统,旨在提升投稿效率并赋予作者更多选择。此外,报告还提供了关于如何优化摘要、图表和方法描述等实用建议,以助力研究人员更顺畅地在 Cell Systems 这类高影响力期刊上发表研究成果。Cell Systems 期刊致力于通过“定量、基于推断的研究方法”和计算模型来“ rigorous 理解任何生物现象”的定位,与构建AI驱动细胞模型这一前沿领域的研究范式高度契合,是该领域成果的理想发表平台。
周沛劼 教授
北京大学
On the mathemtaical and algorithmic considerations of AI virtual cell construction
图片
周沛劼教授的本次报告主要探讨了AI虚拟细胞(AIVC)的未来,质疑目前对受大型语言模型启发的基础模型的依赖。他认为,AIVC的发展应遵循三个关键原则。首先,使用语义向量的基础模型可能不是完整解决方案,因为最近的基准测试表明它们往往无法超越传统方法,在扰动预测等生成任务上表现不佳。其次,AIVC应该整合生物学先验知识,而非纯黑箱模型——明确建模细胞周期、适应性变化和生长动力学等过程可提高准确性。演讲者倡导”生物学转运”而非单纯的最优传输,使用微分方程结合神经网络来平衡可解释性和预测能力。最后,AIVC代表着向主动学习的范式转变,模型指导实验设计而非被动分析数据。他还提出,在数据受限的场景下,扩散模型可能优于语言模型方法,并介绍了流匹配等无需模拟的方法用于高效生成建模。最终愿景是创建结合生成能力、机制理解和主动实验指导的闭环系统。
孙思琦 教授
复旦大学
A controllable foundation model for general and specialized biomolecular structure prediction
图片
孙思琦教授介绍了IntelliFold,这是一个在通用与专用生物分子结构预测领域取得突破的可控基础模型。他首先回顾了肽段从头测序、蛋白质结构预测技术的发展,并指出在FoldBench基准测试下当前模型在抗体-抗原、蛋白-核酸复合物等复杂场景下面临的挑战。并介绍IntelliFold模型的核心优势:支持蛋白质、核酸等多种模态的高精度预测,具备超快速、低内存的计算效率,并能通过自定义约束精准预测变构位点等关键结构。
温翰 研究员
北京科学智能研究院 / 北京大学
AIVC enabled by multimodal and dynamical foundation model
图片
温翰教授介绍了团队最新开发的大规模核酸预训练模型Uni-RNA。该模型在RNA结构预测与功能注释等任务中表现出色,显著提升了核酸层面组学数据的建模能力。他进一步探讨了大规模基础模型(foundation models)与神经网络动力学在生命科学组学研究中的应用潜力,尤其是在复杂系统建模与虚拟实验模拟中的前景。在此基础上,他提出AIVC有望基于多模态与动态基础模型(multimodal and dynamical foundation models),整合转录组、蛋白质组、空间组学、显微成像等多源异构数据,构建具备时间维度和上下文感知能力的统一细胞状态表示框架。他指出,AIVC的建立将突破传统静态细胞建模的局限,使研究者能够更真实地模拟细胞在多种刺激下的动态响应,为机制探索、药物筛选和疾病建模提供更智能的计算平台。
Dr. Daniel Hornburg
Bruker
Every cell counts, every peptide matters: From large scale studies to smallest single cells, recent advancements in mass spectrometry-based proteomics
图片
丹尼尔博士系统介绍了timsTOF系列仪器的技术特性:其在稳健性、检测深度与灵敏度方面表现卓越,能够规模化支撑生物学研究发现,助力高质量蛋白质组数据的积累。该技术可在多个维度精准区分不同类型的多肽,包括酶解肽段、免疫肽、糖肽、基于ABPP技术的活性探针肽以及化学背景信号。他还详解了不同型号timsTOF的适用场景:在单细胞层面,timsUltra AIP技术通过实现每30000平方微米区域内500个单细胞/秒的检测速率,有效获取空间单细胞蛋白质组数据;而TimsOmni平台则专注于翻译后修饰与蛋白质形态分析,显著提升免疫肽的发现能力。
焦玉霞 编辑
Genomics, Proteomics & Bioinformatics
Publishing with GPB, a premium journal in the omics field
图片
Genomics, Proteomics & Bioinformatics(简称 GPB)是中国国家生物信息中心和中国遗传学会联合主办、牛津大学出版社出版的国际期刊,在 JCR 遗传与遗传学领域排名前 10%,最新两年影响因子为 7.9。执行主编焦玉霞博士在报告中介绍了期刊的定位与特色,强调 GPB 致力于发表全球范围内高质量的多组学研究与技术创新,涵盖综述、观点、原创研究、数据库、网络工具、方法与协议等多种类型。她还介绍了期刊的作者服务与学术活动,并鼓励研究者积极投稿,共同推动组学领域的发展。