官方网站-首页官方网站-首页

公司动态

“磐石”大模型发布:应对科研数据孤岛和工具壁垒

时间:2025-07-28 09:30:07 阅览:334

【导(dǎo)语(yǔ)】随(suí)着(zhe)科(kē)研(yán)疆(jiāng)域的(de)迅(xùn)速(sù)扩(kuò)张(zhāng),人(rén)类(lèi)科(kē)学(xué)家(jiā)正(zhèng)面(miàn)临(lín)海(hǎi)量(liàng)数(shù)据(jù)与(yǔ)复(fù)杂(zá)跨(kuà)学(xué)科(kē)难(nán)题(tí)带(dài)来(lái)的(de)“认(rèn)知(zhī)过(guò)载(zài)”挑(tiāo)战(zhàn)。在(zài)此(cǐ)背(bèi)景(jǐng)下(xià),人工智能(AI)的角色正发生深刻转变,从信息检索工具演变为科学家的智能伙伴。2025年7月26日,上海世界人工智能大会(WAIC)上,中国科学院发布了自主研发的开源科学基础大模型“磐石”,旨在应对科研领域的数据孤岛、专业推理能力不足等挑战。该模型通过异构混合专家架构和课程式训练方法,实现了对科研工具的高效整合与深度理解,有望成为科学家的得力助手与协作伙伴。这一变革正引领我们迈向人、机器与信息世界深度交汇的新时代,加速科学发现的步伐。

·近年来,各大AI厂商纷纷推出AI科研助手,希望将AI深度融入科研流程,辅助科学家进行假设、设计实验、分析结果乃至启发新发现。

科学研究的疆域正以前所未有的速度扩张,其前沿早已深入到人脑难以直观想象的微观与宏观世界。面对每天产生的海量论文、动辄PB级的实验数据和日益复杂的跨学科难题,人类科学家正面临着“认知过载”的挑战。在此背景下,人工智能(AI)的角色正在发生深刻的转变——它不再仅仅是一个能快速检索信息的“博学”工具,而正演化为能够理解、推理并与科学家协同工作的“智能伙伴”。

2025年7月26日,上海举办的世界人工智能大会(WAIC)“人工智能赋能生命科学论坛”上,中国科学院(CAS)正式发布了其自主研发的开源科学基础大模型——“磐石”。该模型旨在应对当前科研领域面临的数据孤岛、专业推理能力不足和研发生态封闭等挑战,为跨学科科技创新提供一个坚实的智能化平台。

2025世界人工智(zhì)能大会(WAIC)“人工智能赋能生命科学论坛”现场。拍摄/季敬杰

中国科学院科技基础能力局副局长曾大军介绍,现代科学研究面临的一大瓶颈是“数据孤岛”与“工具壁垒”。以药物研发为例,可能需要融合基因组学、蛋白质结构学、化学合成等多个领域的数据与工具。在传统模式下,这些知识和(hé)工(gōng)具(jù)散(sàn)落(luò)在不同的数据库和软件中,格式各异,互不兼容,跨领域协作的效率因此大打折扣。通用AI虽然在语言处理上表现出色,但往往缺乏对特定科学领域底层规律的深刻理解,难以胜任严谨的科学推理。

“磐石”大模型通过采用“异构混合专家”(MoE)架构来对科研工具进行整合。这可以通俗地理解为一个“专家委员会”:当模型接收到一个任务,比如预测蛋白质结构,它不会用一个通用的“大脑”去思考,而是会自动将任务分配给委员会中专精于此的“蛋白质折叠专家”(如集成AlphaFold能力);当任务是解析化学物质光谱时,则会调用“化学分析专家”。这种架构确保了问题能由最合适的“专家”来解决,大大提升了专业任务的准确性(xìng)和效率。

为了让这些“专家”真正懂得科学,其训练方式也与通用AI有所区别。“磐石”采用了“课程式训练”的方法,如同培养一名人类学生。它首先系统性地学习了从高中到硕博阶段的数理化、天地生等基础学科的核心定理与知识体系,构建起扎实的理论基础。曾大军表示,“磐石”被投喂了超过1.7亿篇科技文献和源自国家重大科学装置的90PB高质量实验数据。这种训练使其不仅能“记住”知识,更能理解科学知识之间的逻辑关联,从而具备了一定的科学通识推理能力。

这种能力有望极大地提升科研效率。过去,一名博士生可能要花费数月时间阅读上千篇文献才能写出一篇高质量的综述,而“磐石”的“文献罗盘”智能体能将这一过程缩短至几小时。它不仅能总结内容,更能自动梳理技术脉络、分析研究图谱。曾大军说,其产出质量已接近人类博士研究生水平。

除了是高效的“助手”之外,AI也开始具备成为科研“协作者”的能力。“磐石工具调度台”如同一个智能项目经理,当科学家提出一个高阶的研究目标,例如“分析这次高能粒子对撞产生的数据,寻找某种稀有信号”,调度台能自动理解任务,并智能地规划出所需的一系列专业分析软件和计算流程,然后按序调用执行,大大降低了前沿科学工具的使用门槛,让科学家能更专注于科学问题本身。

在生命科学领域,这一新范式的影响尤为突出。中科院学科交叉团队利用“磐石”搭建的“数字细胞”模型,在一个寻找疾病靶点的真(zhēn)实(shí)案(àn)例(lì)中(zhōng)全自(zì)动(dòng)完(wán)成(chéng)了(le)从(cóng)检(jiǎn)索(suǒ)7个(gè)专(zhuān)业(yè)数(shù)据(jù)库(kù)、集成(chéng)5个(gè)不(bù)同(tóng)功(gōng)能(néng)的(de)AI模(mó)型(xíng)、分(fēn)析(xī)海(hǎi)量(liàng)生(shēng)物(wù)文献(xiàn)的(de)复(fù)杂(zá)流(liú)程(chéng)。在(zài)短(duǎn)短(duǎn)两(liǎng)周(zhōu)内(nèi),它(tā)便(biàn)发(fā)现了一个过去未知的、与线粒体疾病相关的潜在新靶点,并通过了初步的实验验证。这相比传统研究范式,效率实现了超过十倍的跃升。

近年来,各大AI厂商纷纷推出AI科研助手,希望将AI深度融入科研流程,辅助科学家进行假设、设计实验、分析结果乃至启发新发现。中国科学院副院长、中国科学院院士吴朝晖在论坛中表示,这场由AI驱动的变革,正引领我们迈向人、机器与信息世界深度交汇的新时代。未来,科学家与AI的协同共创,无疑将加速我们解开生命奥秘、攻克重大疾病的步伐,开启一个科学发现无限可能的新纪元。