
近日,中国平安旗下平安科技联合平安好医生、北大医疗研发的“医疗大模型3.5”,在全球医疗AI权威评测集HealthBench Hard中斩获57.27分,超越百川、Meta、OpenAI等头部企业,位居榜首。此前,平安金融大模型已在CNFinBench评测中位列综合第一。评测方指出,平安在金融、医疗两大专业领域的大模型技术均达世界领先水平。
HealthBench基准由OpenAI发布,由全球262名医生共同构建。其中HealthBench Hard为高难度子集,用于测试模型在复杂、高风险临床场景中的推理能力上限。
区别于通用大模型,平安医疗大模型复刻真实医生临床推理逻辑。结合北大医疗、平安好医生等业务场景,依托全病程服务闭环数据,研发团队设计了由患者数字分身、自适应评估智能体、临床知识图谱组成的动态诊断模拟环境,采用三阶段递进训练及全链路幻觉控制引擎,持续降低模型幻觉率。
平安已推出平安灵眸、健康管家、AI-MDT、AI康复等产品,构建覆盖“筛查—管理—治疗—康复”的完整医疗链路。其中,“平安灵眸”已构建90余种疾病筛查模型,覆盖1500家基层医疗机构,累计完成150万次早筛;“健康管家”通过多智能体协同,服务200万慢病患者,国产精品情侣呻吟对白视频患者依从性提升5倍。
在MDT多学科诊疗领域,平安推出北大医疗AI-MDT Pro智能会诊系统。内部数据显示,AI诊疗方案采纳率达85%,在乳腺癌等重症领域,方案与主任专家一致性超过92.5%。平安首席技术官王晓航表示,目标是将顶级多学科诊疗能力转化为规模化普惠供给。
金融领域方面,2026年3月,平安金融大模型PingAnGPT在CNFinBench榜单综合排名第一,超越DeepSeek-R1、GPT-4o等模型,在金融推理、知识问答、合规风控等指标表现卓越。同年4月,平安升级AI“快捷服务”,为2.52亿客户打造专属金融AI助手,实现“一句话能办事”,涵盖交易、融资、理赔等300余项服务。
中国平安表示,将坚持“综合金融+医疗养老”双轮驱动与科技驱动战略,深度扎根核心主业,持续推动模型迭代与应用落地,不断提升服务人民群众的能力。