近日,海豚智能与牛津大学、剑桥大学与北京航空航天大学等合作伙伴共同发布大模型测评基准U2-Bench。这是专为大模型超声图像理解能力设计的多任务测评基准。U2-Bench 收录了7,241例来自15个解剖部位的病例,覆盖疾病诊断、病灶定位、报告生成等8大任务、50 个临床场景,以此来全面、客观、准确的评估多模态大模型在复杂超声数据上的表现。 在最新测试中,海豚智能的超声大模型Dolphin-V1在U2-Bench上综合得分(U2-Score)为0.4748。其中模型在超声标准切面识别任务上表现优异,对于心脏与胎儿的标准切面识别的准确率超过85%。 “U2-Bench 的诞生离不开海豚智能这群富有创造力的年轻人们的努力。”法国国家技术科学院院士,逸超医疗董事长雅克·苏凯表示,“很高兴看到他们为超声领域带来的改变,这将成为超声AI研究的新篇章。” 英国皇家学会副主席,牛津大学终身教授Alison Noble 院士表示,“公开统一的测评基准对于超声大模型走向临床应用至关重要。” 海豚智能创始人,CEO勒安捷表示:“U2-Bench 不仅填补了医疗超声大模型领域评测的空白,更为大模型在超声领域的应用带来了更多的可能性。 作为一家医学影像大模型公司,海豚智能认为实现技术在医疗场景中的落地至关重要,这也是海豚智能强调要将临床洞见融入到AI模型的研发流程中的关键原因。未来,海豚智能将进一步推进模型的落地,继续与合作伙伴们共建临床上高效、可信的超声大模型。
【责任编辑:孙慧 张允虹】
《消费中国》版权所有 Copyright © 2000-2025 xhwxfzg.com All Rights Reserved.
粤ICP备2025403893号 京公网安备11011502038662号 运维单位:惠州市点晴文化传播有限公司