在医疗领域,任何辅助工具能否被医生真正采用,最终都需要经得起专业医学体系的检验。相比演示效果或主观体验,标准化考试与高年资评估,被视为衡量医学专业能力的重要客观标准。
在这一背景下,轻松健康集团发布的循证医学智能体“证元芳”,通过国家级医学考试与高阶临床能力测试,对其专业能力进行了系统验证。
在 CMB2023 中国执业医师资格考试 基准测试中,证元芳以 100% 正确率取得满分成绩,成为国内首个在国家级医学考试中获得满分的 AI 系统。该考试覆盖医学基础理论、诊疗规范与临床思维等多个维度,被视为衡量执业医生专业能力的重要标准之一。
业内普遍认为,这一结果具有明确的参考意义。一方面,它表明证元芳在医学知识的准确性与规范性层面,已达到临床执业准入所要求的基本标准;另一方面,也反映出循证医学智能体路径在控制医学幻觉、保障输出可靠性方面的优势。相比之下,多款通用大模型及医疗增强模型在同类测试中的表现仍存在差距。
在更高难度的测试中,证元芳的表现进一步受到验证。在肿瘤科正高、副高考试中,证元芳在涉及复杂病情判断、多方案权衡与循证推理的问题中取得 SOTA 成绩,整体表现显著优于包括 OpenEvidence 在内的多款国内外同类产品。
与基础考试不同,高年资医学考试更强调临床经验的抽象能力、证据整合能力以及在不确定条件下进行决策推理的能力。这类题目往往不存在唯一答案,而是要求考生在多种可能路径中,基于证据做出最合理判断。证元芳在该类测试中的表现,说明其不仅具备扎实的医学知识基础,更能够在复杂情境中进行多维度循证分析。
业内分析指出,这一能力与证元芳的产品设计路径密切相关。通过系统整合中国医学指南、国际权威文献与结构化医学知识图谱,并结合可解释的推理机制,证元芳在输出结论的同时,保留了清晰可追溯的证据链条,从而降低了生成式 AI 在医学场景中可能带来的风险。
同时,证元芳所依托的 5000 万+ 条中英文权威医学数据底座,以及对中国医学体系的完整覆盖,也为其在考试与复杂临床推理中的表现提供了基础支撑。这种以本土医学规范为核心、兼顾国际循证标准的能力结构,被认为是其相较国际同类产品的重要差异化优势。
轻松健康集团方面表示,相关考试成绩并非产品目标本身,而是对循证医学智能体路径的一次阶段性验证。未来,证元芳将继续围绕真实临床场景迭代能力,在确保安全、合规与可解释性的前提下,探索 AI 在临床决策支持领域的更深度应用。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。