从医学角度总结并点评已问世的中医药大语言模型
对于已问世的中医药大语言模型,笔者觉得这条“留言”点评最到位:“用“大模型幻觉”对抗“大世界玄学”。当然这篇主要目的是总结下目前的中医药大语言模型,了解下喂了这么资料后,从医学角度还能怎么提高大模型效果。。

对于已问世的中医药大语言模型,笔者觉得这条“留言”点评最到位:“生的随机,死的模糊”。用“大模型幻觉”对抗“大世界玄学”。当然这篇主要目的是总结下目前的中医药大语言模型,了解下喂了这么资料后,从医学角度还能怎么提高大模型效果。

先来看看目前已问世的中医药大模型:
表:目前已问世中医药大语言模型一览
| 大模型 | 联合开发单位 | 部分特色功能 | |
| 1 | 仲景 | 复旦大学、同济大学 | 中医方剂数据及诊断思维逻辑的推理 |
| 2 | 海河·岐伯 | 天津智图、天津中医药大学、现代中药高等实验室等 | 智能问诊、生成电子病历等 |
| 3 | 数智岐黄 | 华东师范大学、上海中医药大学、华东理工大学等 | 中医药知识智能问诊、健康咨询、中医药知识建构态交互 |
| 4 | 数智本草 | 天士力、华为云 | 发现天然药物,生成新方剂 |
| 5 | TCMLLM | 北京交通大学计算机与信息技术学院医学智能团队 | 实现中医临床辅助诊疗(病证诊断、处方推荐等)中医药知识问答等任务 |
| 6 | 神农中医药大模型 | 华东师范大学计算机科学与技术学院智能知识管理与团队服务 | 医疗问诊 |
| 7 | Huang-Di | 由南京大学信息管理学院及郑州大学人工智能学院合作完成 | 中医古籍知识问答 |
| 8 | 本草智库·中医药大模型 | 成都中医药大学、药数据圈、天府中药数据仓 | 中药知识提取与生成、中药重金属领域解决方案输出 |
| 9 | 盘古大模型 | 九方健策、华为云 | 药物研发、智慧医疗等 |
| 10 | “华佗”中医药大模型 | 室州市场监管、华为 | 药物研发、智慧医疗等 |
| 11 | “歧黄问道”大模型 | 太经中医院 | 临床治疗,中医养生调理方案等 |
| 12 | “讯飞星火”大模型 | 科大讯飞 | 辅助诊疗,健康咨询 |
| 13 | “聪宝素问”大模型 | 中医聪宝 | 辅助诊疗,诊后随访,疗效评估,健康管理 |
| 14 | “天河灵枢”大模型 | 国家超级计算天河中心、天津中医药大学等 | 量身定制针灸治疗方案 |
| 15 | 中医药横琴大模型 | 横琴安头智能 | 辅助诊疗,提供个性化治疗方案 |
先简单总结下模型:
1. 具体构建方法
-
各个模型使用预训练和微调策略进行构建,如“仲景”模型基于Qwen1.5-1.8B-Chat模型,通过在专有医疗数据集上的多次迭代训练,并严格设置prompt模板实现模型在中医领域的推理能力。
-
大多数模型,如"数智岐黄"和"数智本草",采用了预训练+检索增强生成的方式,同时结合了插件调用技术以实现特定功能。
2. 所使用的语料
-
这些模型广泛采用了中医经典文献、医学教科书、临床病历等作为核心语料。
-
例如,“数智岐黄”模型的语料包括《黄帝内经》、《伤寒杂病论》等1000余本中医古籍,以及相关中医药知识图谱,而“数智本草”结合了数千万条中药成分、靶点、专利等内容,确保涵盖了药物、方剂、病理等多方面信息。
3. 应用场景
-
这些大模型广泛应用于中医药知识问答、临床辅助诊疗、药物研发及健康管理等场景。
-
如“海河·岐伯”大模型基于古医书记载的场景模拟了中医问诊,为中医药数智化转型提供了支持;“天河灵枢”大模型则在针灸治疗方案个性化推荐方面发挥作用,进一步推动针灸领域的智能化发展。
现存的主要问题
申明:如果大模型是骗投资人钱,那当我什么都没说,这些大模型岁月静好!
从实际医学应用角度出发,以下问题要供同行考虑的,尤其是工科同行考量:
1. 高质量语料

这些模型在构建过程中,虽然广泛使用了中医典籍和临床文献,但缺乏严格的循证医学评估,也大量使用低质量的证据(见下金字塔)。循证医学强调通过系统性评估和科学实验证据验证治疗效果,而许多中医药大模型所使用的数据尚未经过现代循证医学的严格审查。因此,模型给出的诊疗建议可能未经过充分的科学验证,缺少临床随机对照试验的支持,导致其在临床应用中可靠性和有效性难以得到保证。最终就是“幻觉”+“垃圾结论” = 错上加错。

如果不想让大模型还要做META分析,那高质量的结论性语料主要得综合程度很高的循证证据,这个是非常耗费人力和财力的领域,是无数医学科研同行研究成果的结晶。那如何获得这些高质量的语料证据,这就是完全是“循证医学”的问题。
- 模型透明度与可解释性
目前中医药大语言模型在决策过程中往往缺乏透明度和可解释性,这使得模型给出的诊断或治疗建议变得难以理解和验证。特别是在推荐具体治疗方案时,模型是基于哪些数据和逻辑进行推理,医务人员很难获得详细解释。
因此,医生无法明确知道模型决策的依据和过程,也难以对模型的推荐进行合理性判断和干预。这种不透明性可能严重影响医务人员对模型结果的信任和接受度,进而限制模型在实际临床中的应用。尤其在医疗领域,医生对患者的治疗负有直接责任,如果无法解释诊断依据和治疗逻辑,医务人员可能倾向于不依赖模型的建议。这种情况不仅削弱了模型对医学实践的支持作用,也可能使模型的应用风险增加。
在中医药大语言模型甚至是医学大模型的开发中,需要特别关注提高模型的可解释性,让模型的推理和来源过程更加透明,以便医务人员能够理解和信任模型的建议,从而更有效地将其应用于患者的诊疗决策中。
3. 决策所提供的信息和内在逻辑
这些中医药大语言模型在构建时,可能忽视了医学中的一些重要内在逻辑。例如,在医学中,症状与病因的联系是通过长期积累的临床经验和系统性研究建立起来的,而这些模型可能无法有效理解和把握这种联系的因果关系。此外,疾病的诊断和治疗过程往往涉及多个复杂的因素,包括个体差异、并发症的存在、药物的交互作用等,而大模型的推理方式可能不具备足够的细致性,无法如医生一般整合多维度的信息做出精准的医疗决策。此外,医学中的许多概念是抽象和动态的,无法通过简单的文字描述完全传达,如机体的病理变化、疾病进展的过程、患者的整体健康状况等,这些方面在模型的训练和推理中可能缺乏深入体现,从而限制了模型在医学中的实用性。

从医疗决策角度来看,医学不仅需要考虑诊断的精确性,还需要评估不同治疗方案的风险、收益及患者特征。大模型在这方面往往缺乏细致的推理能力,尤其是在面对多种治疗方案时,难以权衡并给出个性化的建议。而医学决策的核心在于循证,需基于科学实验和临床数据,当前这些模型在循证医学方面仍存在明显不足,影响其应用于临床决策的安全性。
简单一句话结论
交互应答类专科医学大模型真要落地应用,还有一些路要走(但未必很长)。
零基础如何学习AI大模型
领取方式在文末
为什么要学习大模型?
学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术,如自然语言处理和图像识别,正在推动着人工智能的新发展阶段。通过学习大模型课程,可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术,从而提升自己在数据处理、分析和决策制定方面的能力。此外,大模型技术在多个行业中的应用日益增加,掌握这一技术将有助于提高就业竞争力,并为未来的创新创业提供坚实的基础。
大模型典型应用场景
①AI+教育:智能教学助手和自动评分系统使个性化教育成为可能。通过AI分析学生的学习数据,提供量身定制的学习方案,提高学习效果。
②AI+医疗:智能诊断系统和个性化医疗方案让医疗服务更加精准高效。AI可以分析医学影像,辅助医生进行早期诊断,同时根据患者数据制定个性化治疗方案。
③AI+金融:智能投顾和风险管理系统帮助投资者做出更明智的决策,并实时监控金融市场,识别潜在风险。
④AI+制造:智能制造和自动化工厂提高了生产效率和质量。通过AI技术,工厂可以实现设备预测性维护,减少停机时间。
…
这些案例表明,学习大模型课程不仅能够提升个人技能,还能为企业带来实际效益,推动行业创新发展。
学习资料领取
如果你对大模型感兴趣,可以看看我整合并且整理成了一份AI大模型资料包,需要的小伙伴文末免费领取哦,无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
部分资料展示
一、 AI大模型学习路线图
整个学习分为7个阶段

二、AI大模型实战案例
涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,皆可用。


三、视频和书籍PDF合集
从入门到进阶这里都有,跟着老师学习事半功倍。


四、LLM面试题


五、AI产品经理面试题

如果二维码失效,可以点击下方链接,一样的哦
【CSDN大礼包】最新AI大模型资源包,这里全都有!无偿分享!!!
😝朋友们如果有需要的话,可以V扫描下方二维码联系领取~
更多推荐
所有评论(0)