在四天的万能医生时间里(2月6日-9日),两项接连发表于《自然-医学》的当下的场研究共同展示了AI在医疗领域应用的繁琐图景。
2月6日,最好谷歌DeepMind、景工具包斯坦福大学、万能医生谷歌Research的当下的场研究团队联合在《自然-医学》(Nature Medicine)发表研究论文A large language model for complex cardiology care ,介绍了一个基于Gemini 2.0 Flash大语言模型构建的最好医疗人工智能系统——AMIE(Articulate Medical Intelligence Explorer),专门用于处理繁琐的景工具包心脏病病例,能够综合分析多种检查结果,万能医生包括心电图、当下的场心脏超声、最好心脏磁共振成像和心肺运动尝试等。景工具包在临床数据测试中,万能医生AMIE能够显著提升心脏病医生的当下的场诊断质量、减少错误和关键信息遗漏,最好提高医生的工作效率和信心。

全球心脏病学亚专科资源不足,尤其在遗传性心肌病诊断中,大量患者因缺乏专家评估而延误治疗。AMIE能有效提升平常心脏科医生对繁琐心脏病的诊疗能力,减少错误和信息遗漏,为缓解专科资源不足提供了新路径。
值得注意的是,上述研究测试中有6.5%的案例AMIE出现了临床显著幻觉(如虚构影像报告的检查结果),但可通过医生的质疑及时纠正。这强调了在现阶段的诊疗流程中,人类医生的监督和质控不可或缺。
2月9日,牛津大学的研究团队在《自然-医学》(Nature Medicine)发表论文Reliability of LLMs as medical assistants for the general public: a randomized preregistered study 。该研究进行了一项大规模随机对照尝试,以测试大语言模型(LLM)作为公众医疗助手的实际效果,结果显示,在各种医学考试中表现优异、甚至堪比人类专家的大语言模型,却在真实的医疗场景中不能有效帮助公众诊断病痛并作出正确的康健决策。
研究团队在进一步的人工检查中发现,问题不在于LLM的医学知识储备,而在于人类与LLM的交互难题。在真实的医疗场景中,患者往往无法准确、完整地描述症状,而LLM可能过度依赖专业术语,未能将医学知识“翻译”成通俗语言,还会生成误导性的信息,导致沟通失效。研究团队建议,LLM在医疗领域大规模部署前需进行系统的人类用户测试。
刚刚过去的2025年,是全球“AI+医疗”大模型爆发的一年。
谷歌的MedGemma、OpenAI的o1模型凭借强大的多模态理解和逻辑推理能力,在繁琐的临床诊断任务中表现突出;Hippocra
1292人浏览
2838人浏览
1088人浏览
1516人浏览
2405人浏览
2778人浏览
汇通财经APP讯——周五6月12日)亚洲时段,澳元兑美元震荡走低至0.7035附近。隔夜公布的美国PPI数据超预期走强,提振美元的同时打压了澳元走势。美国劳工统计局周四公布的数据显示,生产者价格指数的
video8月24日上午,2023海峡两岸青年创新创业大赛总决赛在常州举行。记者知道到,经过激烈角逐,最终50个项目进入决赛,这些项目涉及新能源、新材料、康健医药和智能制造等多个领域。本次大赛共有电子
晋升宝妈两年,林晓华褪去了初为人母的手忙脚乱,她的购物车也随之经历了一场“断舍离”式的蜕变。不再手足无措,林晓华现在学会了反向筛选:先查国标、再看测评,性价比高的二手好物也成了她的优先选择。“一个不到
各位游侠网友,晚上好呀!又到了每天的「游侠晚报」时间啦!今天「游侠晚报」的主要内容有:《暗黑损坏神4》惊现地精无限刷BUG、《乐高蝙蝠侠:昏暗骑士之遗》发售即破解、《地平线6》藏《头文字D》彩蛋,快来
据Fami通报道,微星在2026 COMPUTEX 2026上集中发布了多款新品,涵盖便携游戏掌机、旗舰游戏本、艺术限定AI本及多条重启产品线,全面补齐消费级与游戏向硬件布局。发布会最大看点之一,是全
汇通财经APP讯——美国总统特朗普周一3月23日)以“富有成效”的对话为由,将针对伊朗的军事打击计划推迟五天,称美方特使与伊朗高官在主要问题上达成共识。受此影响,美原油价格周一一度暴跌逾10%,最低触