平安医疗大模型荣登HealthBench Hard榜首 医疗AI落地多学科会诊场景

2026/04/24 07:49来源:第三方供稿

 

 

 

当人工智能技术加速渗透各行各业,医疗领域始终是AI落地最受关注也最具挑战性的方向之一。不同于通用AI的泛化能力比拼,医疗AI对专业精度、临床逻辑、决策安全性有着极致要求,能否突破咨询辅助的浅层应用,真正走进临床诊疗核心,成为衡量行业实力的核心标尺。

 

近日,由平安科技携手平安好医生北大医疗联合研发的平安医疗大模型3.5,在全球医疗AI权威评测HealthBench Hard中斩获全球最高分57.27,超越OpenAI、Meta、百川蚂蚁等多家头部科技企业,刷新该基准当前成绩纪录。

 

 

这份评测成绩,不止是平安集团技术实力的量化佐证,更标志着平安正推动医疗AI从传统的信息获取、健康咨询,进一步走向复杂病种辅助决策、多学科协同诊疗等更接近临床核心的应用场景。

 

登顶高难度临床评测,硬核实力获国际认可

 

此次平安医疗大模型参与评测的HealthBench基准由OpenAI发布,由60个国家、26个医学专的262名医生共同构建包含5000组高仿真多轮医疗对话,并设置48,562项由医生制定的评分标准,是全球少数面向真实临床场景设计的专业医疗大模型评测体系。

 

其中,HealthBench Hard被视为其高难度子集。OpenAI从5000组对话中筛选1000组更具挑战性的案例,用于测试模型在复杂、不确定、高风险临床场景中的推理能力上限。这一基准同时也是OpenAI评估先进模型及医疗健康产品的重要参考。

 

 

在该测试中,平安医疗大模型3.5获得57.27分,位列第一,高于百川(44.4分)、Meta(42.8分)、OpenAI(42分)、蚂蚁(39.6分)等国内外厂商。在全球医疗AI竞逐加速的当下,这一成绩也意味着,中国企业正在高门槛医疗智能赛道上形成自己的技术竞争力。

 

摒弃应试化训练 复刻真实医生临床推理逻辑

 

区别于通用大模型侧重标准化问答的训练逻辑,平安医疗大模型尽可能贴近真实临床中的复推理过程依托平安长期积累的“筛、管、治、康”全病程服务闭环数据,覆盖专科问诊、常见病诊断、用药建议、慢病管理、医疗保健等多个环节。

 

临床普遍存在患者症状描述模糊、病情动态变化、关键信息缺失等难题,研发团队对此设计了由患者数字分身、自适应评估智能体、临床知识图谱组成的动态诊断模拟环境,将医生在不确定条件下的判断过程建模为multi-turn RL推理任务。

 

针对医疗推理高复杂、低容错的特点,团队采用三阶段递进训练:静态框架内化构建具临床逻辑的知识体系动态思维链探索实现复杂场景下的长链与跨学科推理最终实现高阶推理能力跃迁。同时,通过 OPD蒸馏提升知识压缩效率,并自研 全链路幻觉控制引擎,融合上下文及语境学习、不确定量化等算法,实现从提示词、训练到推理阶段的全流程风险控制,以降低幻觉率。

 

地肿瘤MDT场景 让优质医疗资源普惠下沉

 

依托大模型能力优势,平安率先瞄准国内医疗现实临床需求,落地肿瘤MDT多学科会诊场景。数据显示,平安每年服务肿瘤理赔客户约30万人,相关赔付成本约医疗健康险整体赔付半壁江山而肿瘤诊疗高度依赖多学科协同方案,诊疗方案的科学性直接决定患者康复质量与生存周期。

 

临床数据证实,接受规范MDT多学科会诊的肿瘤患者,五年生存率可提升15%。但受限于顶级专家稀缺、医院流程限制、地域资源不均等问题,国内高质量MDT服务覆盖率长期偏低。

 

在此背景下,平安推出北大医疗AI-MDT Pro智能会诊系统,依托平安医疗大模型,面向医生团队提供复杂病史自动整理、多学科诊疗方案生成、康复及随访方案辅助等能力。

 

在一份真实的乳腺肿瘤病例中,平安医疗大模型充分考虑患者信息,给出化疗、靶向治疗、放疗、内分泌治疗的全流程建议,并明确用药剂量、周期、顺序(如化疗结束后再放疗、内分泌治疗与化疗不同时)和具体给药方案,针对保乳术后明确放疗靶区与分割模式,做到“一患一策”,具备临床可操作性。

 

目前该系统已落地北大医疗、平安好医生等机构真实场景,AI诊疗方案采纳率达到85%;在乳腺癌等重症领域,AI诊疗方案和主任专家一致性达到92.5%以上。

 

此外,平安计划推出面向患者端的北大医疗AI-MDT Care个人版产品,覆盖病情档案整理、重疾咨询、方案建议与对比、就医路径推荐等功能把稀缺的多学科诊疗能力通过AI产品化下沉,缓解重疾家庭的咨询虑与就医难题。

 

从综合金融走向医疗养老,回应客户全生命周期需求

 

当下,人民健康需求持续升级,保险行业竞争也从单一产品比拼,转向全生命周期健康服务能力的较量。用户需要的不再只是一份风险保障,而是覆盖小病筛查、慢病管理、重症救治、老年康养的一体化解决方案,服务能力正成为核心竞争力。人民的新期待,正在推动金融保险业角色加速转型

 

此次医疗大模型的领先突破,是平安长期科技投入与AI能力建设的集中成果。作为中国金融业数字化转型的先行者,平安坚持深化“综合金融 医疗养老”双轮并行以及科技驱动战略,从“AI in ALL”到“AI for ALL”,深度扎根金融、医疗、养老等核心主业重构业务效率变革服务体验。

 

随着2026年平安全面升级“服务年”,医疗AI成为打通综合金融与医疗养老服务的技术纽带,致力于实现小病早筛、慢病可控、重病优治。其真正价值不在于技术参数的领先,而在于让普通人面对健康与衰老时拥有更多主动权赋能个体在不确定人生中做出更从容的选择。

 

编辑:第三方供稿