天士力数智中医药大模型文章入选高引用研究
近日,天士力数智中医药团队发表在国际权威期刊《美国医学信息学协会杂志》的论文《Lingdan: enhancing encoding of traditional Chinese medicine knowledge for clinical reasoning tasks with large language models》,成为该刊近期被引用次数最多的文章之一,标志着中医智能化研究已获国际学术界广泛关注与认可。


在全球大语言模型如ChatGPT等技术迅速发展的背景下,中医古籍《黄帝内经》《本草纲目》等凝聚的千年智慧,却因文言文表述、独特理论体系与复杂语法,对现代AI构成了显著挑战。如何让前沿AI真正理解并运用中医知识,成为关键研究问题。
为此,数智中医药团队联合北京交通大学医学智能研究所的周雪忠教授团队深度合作,共同研发打造真正懂中医、会辨证、能开方的大型语言模型——灵丹(Lingdan),实现了在中医临床推理任务上的重要突破。
01
数据工程:构建中医知识新体系
研究团队构建了三大核心数据集,为AI学习中医奠定基础:
中医预训练数据集(TCMPT):包含1.6亿个词元,涵盖古籍、教材、病历、药典、药品说明书等多源知识;
中成药问答数据集(TCPM Dialogue):通过“知识问答化”技术生成20万组高质量对话,涵盖主治,配伍等关键信息;
脾胃病处方推荐数据集(SSHPR):基于广安门医院的临床诊疗数据,包含3.9万条结构化医案,专注中医处方智能推荐。
团队还创新性地提出了中医交互式诊断对话框架(TCM-IDDF),基于思维链技术模拟真实诊疗流程。
02
三大模型:实现中医AI的
“理、法、方、药”全栈能力
基于高质量数据集,团队研发了覆盖不同场景的中医AI模型系列:
灵丹预训练模型(Lingdan Pre-trained):在通用大模型基础上注入中医知识,构建底层理解能力;
灵丹中成药对话模型(Lingdan-TCPM-Chat):支持多轮辨证与中成药推荐;
灵丹处方推荐模型(Lingdan-PR):针对中医处方推荐任场景优化的专业模型。
测试显示,处方推荐模型在Top@20 F1分数上比最佳基线模型提升18.39%,展现出优秀泛化能力。研究还发现,通过随机调整处方药味顺序进行数据增强,可显著提升模型鲁棒性、减少“AI幻觉”,体现了中医“方有合群之妙用”的配伍智慧。
03
高引用背后:创新与实用的双重突破
本论文获得高频引用,主要源于以下几方面突破:
数据层面:与现有中医AI数据集相比,灵丹数据集在数量和质量上均超越以往模型。
方法创新:研究团队提出了知识语言化和知识问答化等新方法,提升了中医知识的结构化表达与推理能力。
临床实用性:模型可直接从病历推荐处方,降低应用门槛,更贴近实际场景。
跨领域价值:为其他专业领域的大语言模型应用提供了可参考框架。
04
数智本草:赋能中医药垂直领域
目前,数智中医药团队已经开发了“计算+ 语言”双模型的数智本草大模型,为中医药的智能化发展提供系统性解决方案。通过智能问答、交互计算、文档生成和智能应用四种模式,为用户提供从重要机制解析到中医药复方及组分创新开发的全方位研发辅助。并涵盖了数智中药研发、中医智能诊疗和中药智能服务等多个场景。
作为“数智本草”大模型体系中的开源版本,灵丹大模型不仅奠定了该系列坚实的技术基础,更以开放协同的生态架构,助力中医药领域共创智能未来。
05
展望未来:开启中医智能化的新篇章
目前,团队正在积极推进灵丹2.0版的研发工作,致力于在模型规模、推理能力与临床适配性上实现进一步突破。
未来,天士力数智中医药团队将继续围绕推进模型多模态化、病种全覆盖、临床系统验证等方向深化研究,推动构建“理、法、方、药”一体化的智能辅助诊疗系统,真正成为中医传承与创新的数字化伙伴。
【特别声明:部分文字及图片来源于网络,仅供学习和交流使用,不具有任何商业用途,其目的在于传递更多的信息,并不代表本平台赞同其观点。版权归原作者所有,如涉版权或来源标注有误,请及时和我们取得联系,我们将迅速处理,谢谢!】












