
北京时间2月19日,由上海交通大学人工智能学院与医学院附属新华医院联合研发的DeepRare罕见病循证推理诊断系统相关成果正式发表于国际顶刊《自然》。
这套全球首个针对罕见病诊断、推理过程可追溯的智能体系统,早在去年7月就已上线,为罕见病“确诊难、漏诊率高”的全球性难题提供了中国方案。

| 罕见病并不“罕见”
罕见病虽然单病种患病率<1/2000,但全球已发现7000+种罕见病,累计影响超3亿人群,其中80%为遗传性疾病。
但长期以来,行业始终面临双重困境:
由于症状复杂、病例稀缺、医生认知有限等,患者平均确诊周期超过5年,反复转诊、误诊和非必要干预屡见不鲜。
同时,传统医疗AI多为“黑盒式”输出,仅能给出诊断结论,却不能提供透明的推理过程和权威证据支撑,既难以获得临床医生的充分信任,也无法深度融入合规的临床诊疗流程中。
| DeepRare到底是什么?
DeepRare是基于大语言模型驱动的多智能体系统,以“中枢-分身-知识库”三层架构为核心,实现了对传统医疗AI的优化升级:

◆中枢主机
由大语言模型(比如DeepSeek-V3)驱动,带记忆功能,全程统筹诊断流程,把所有收集到的证据汇总分析,生成候选诊断结论与推理依据,为临床医生提供决策支持;
◆专业智能体服务器
整合40余种专业工具,分工处理症状提取、疾病标准化、基因分析、病例检索等专项任务;
◆多源数据源
涵盖PubMed、OMIM、OrphaNet、真实临床病例库等,为诊断提供可验证的依据。

DeepRare通过模拟临床医生的真实诊断思维,构建了“信息采集-分析假设-循证验证-反思推理-结论输出”的闭环诊断流程。
其核心突破在于,每一项诊断结论都附带完整的推理链条,每一步推理都直接关联可核验的权威医学证据,实现了诊断过程的全流程“白盒化”。
| DeepRare核心数据
研究团队通过不同国家地区的9个数据集、6401个临床案例,对比传统诊断工具、各种大模型以及资深专家,对DeepRare进行了全面评估:

在单靠HPO表型(即标准化症状术语)诊断的情况下,第一次诊断准确率达57.18%,比第二名的推理大模型高出23.79个百分点;
如果结合基因检测结果,系统准确率能够达到70.61%,比临床常用的基因诊断工具Exomiser(55.9%)高出不少;
另外还找了10位罕见病专科医生,审核DeepRare的180个诊断推理链,95.4%获得认可;
用新华医院的163个真实病例,让5位有10年以上经验的罕见病专家和DeepRare同台PK,DeepRare的首诊命中率(Recall@1)*为64.4%(专家54.6%),前5位诊断命中率(Recall@5)为78.5%(专家65.6%)。
*Recall@K:指系统给出的前 K 个(Top-K)诊断建议中,包含正确疾病的比例。例如Recall@5 即正确疾病出现在前5位中的任意位置的比例,以此类推。

目前,DeepRare已上线用户友好的Web应用(文末获取??),支持临床数据录入、症状标准化映射、诊断报告自动生成;并且已在GitHub开源(文末获取??),支持GPT、DeepSeek等多类大模型灵活部署,降低不同规模医院的应用门槛。
此外,上海交通大学医学院附属新华医院已完成系统院内部署与内测,DeepRare即将作为“质控员”上岗,协助医生在给罕见病患者看病时“查漏补缺”。
同时团队已与国内头部基因检测机构达成合作,未来将实现基因检测临床解读报告的自动化生成,进一步降低技术应用门槛。

DeepRare这种仅通过临床症状描述即可完成较高准确率的罕见病初筛,无需完全依赖高端基因检测设备的特性,可有效弥补基层医院、非专科医院的罕见病诊疗能力短板,为智慧医联体、区域医疗中心建设提供跨层级的专科辅助工具。
「信息来源」
https://doi.org/10.1038/s41586-025-10097-9
https://deeprare.cn
https://github.com/MAGIC-AI4Med/DeepRare
发表评论
登录
手机
验证码
手机/邮箱/用户名
密码
立即登录即可访问所有OFweek服务
还不是会员?免费注册
忘记密码其他方式
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论