繁简切换

FX168财经网>政经>正文

重大突破！ChatGPT首次通过神经科考试研究人员：正确回答85%问题未来肩负临床病学任务

文 / 小萧 2023-12-12 11:55:19 来源：FX168

FX168财经报社(香港)讯 OpenAI公司旗下最新研发的大型语言模型ChatGPT 4.0已通过临床神经学考试，在概念验证研究中回答了85%的正确答案。研究作者认为，经过一些微调，ChatGPT就可以在临床神经病学中具有“重大应用”。当前，人工智能(AI)已在为阿斯利康寻找癌症治疗方法，还有对抗香港抗生素的过度处方。

这项实验结果由海德堡大学医院和海德堡德国癌症研究中心的一组研究人员于12月7日发布，该测试于5月31日进行，测试对象包括两个大型语言模型，即ChatGPT 3.5及其更高版本ChatGPT 4.0。

(来源:CoinTelegraph)

研究人员使用了美国精神病学和神经病学委员会的神经病学考试题库，以及欧洲神经病学委员会的一小部分问题。

旧版本的ChatGPT得分为66.8%，正确回答了1956个问题中的1306个问题，而较新的版本ChatGPT 4.0得分为85%，正确答案为1662个。

值得关注的是，普通人类平均得分为73.8%。这意味着，ChatGPT 4.0的能力已超越了人类平均。

(来源:JAMA Network)

ChatGPT 4.0在行为、认知和心理相关问题上的表现优于人类用户，并有效“通过”了神经学考试，因为70%的正确答案通常被教育机构视为及格分数。

然而，这两种模型在需要“高阶思维”的任务中的表现，都比仅需要“低阶思维”的问题表现得更弱。

根据进行实验的研究人员小组的说法，这些结果可以作为在一些修改后在临床神经病学中使用ChatGPT的建议。

他们指出：“这些发现表明，通过进一步完善，大型AI语言模型可以在临床神经病学中具有重要的应用。”

研究人员指出，目前仍存在一些保留意见。尽管在文档和决策支持系统中应用ChatGPT有一个明确的前景，但神经学家应该谨慎对待它们在实践中的使用，因为它们在高阶认知任务方面仍然不完善。

该研究的作者之一Varun Venkataramani博士在接受采访时表示：“我们将目前的研究更多地视为对ChatGPT能力的概念验证。”

“AI语言模型仍然需要发展，甚至可能需要进行具体的微调，以使其正确适用于临床神经病学，”他补充道。

实际上，当前AI已经在致力于医疗保健领域的一些重大任务，例如为阿斯利康寻找癌症治疗方法，或是对抗香港抗生素的过度处方。

分享

掌握最新全球资讯，下载FX168财经APP

敬告读者：所有内容不代表FX168财经报社立场，仅供读者参考！FX168提供的交易相关数据及资讯不构成投资决策的依据，由此带来的投资风险和损失由交易者自行承担。

+更多经纪商大全

FX168
官方APP

下载FX168财经APP
FX168
官方微信

FX168官方微信
FX168
官方微博

相关文章

“欧洲火车头”跑不动了？！德国总理顾问大幅下调明年经济增长预测

“欧洲火车头”跑不动了？！德国总理顾问大幅下调明年经济增长预测

2023-11-08 22:29
德国彻底“躺平”！预计2023年经济萎缩，同时下调对明年经济增长预测

德国彻底“躺平”！预计2023年经济萎缩，同时下调对明年经济增长预测

2023-10-12 01:54
每日财经大小事：中德关系“解冻”的重要一步！中德高级别财金对话达25共识 “拒绝与中国脱钩”｜中国恒大集团申请复牌交易

每日财经大小事：中德关系“解冻”的重要一步！中德高级别财金对话达25共识 “拒绝与中国脱钩”｜中国恒大集团申请复牌交易

2023-10-03 17:02
德国终于迎来好消息！CPI数据降至近2年低点，巩固欧洲央行暂停加息预期

德国终于迎来好消息！CPI数据降至近2年低点，巩固欧洲央行暂停加息预期

2023-09-28 20:25
德国“病了”？！经济学家警告：高能源价格不仅导致商业情绪暴跌，还将产生政治影响

德国“病了”？！经济学家警告：高能源价格不仅导致商业情绪暴跌，还将产生政治影响

2023-09-04 20:42

推荐阅读

美国法院“阻止”特朗普解放日关税！比特币10.7万多头回落黄金...

05-29 08:16

48小时/周排行

最热文章

相关百科查看更多

美股监管机构美股指数美股交易市场

火线速递

活动频道

本网站文字内容归FX168财经报社所有，任何单位和个人未经许可，不得擅自转载使用！