Blog

ChatGPT AI在挑戰性醫療案例中表現得相當出色

Blog Image
ChatGPT AI在挑戰性醫療案例中表現得相當出色

July 23, 2023

重點摘要:
一項新的研究將生成式人工智慧,特別是將聊天機器人 GPT-4 的診斷能力付諸考驗,結果令人充滿希望。
 
該研究涉及評估 AI 在處理複雜醫療病例時的診斷準確性,GPT-4 在接近 40% 的情況下正確地識別出最高的診斷,並在 64% 的挑戰性病例中將正確的診斷包含在其可能的診斷清單中。
 
AI 在這項研究中的成功可能為其在臨床設置中的潛在應用提供新的見解。然而,還需要進一步的研究來解決這種技術的好處,最佳使用方法和限制。
 
重點事實:
1.      在涉及 70 個複雜臨床病例的研究中,GPT-4 正確地匹配了最終診斷的 39% 的情況。
2.      在 64% 的病例中,GPT-4 在其差異列表中包含了正確的診斷(根據患者的症狀、病史和臨床發現的可能疾病清單)。
3.      儘管結果樂觀,但研究人員強調進一步調查的重要性,以了解在臨床環境中使用 AI 的最佳用途、好處和限制。
4.       
資料來源:BIDMC


 
在 JAMA 發表的最近的實驗中,Beth Israel Deaconess 醫療中心(BIDMC)的醫生研究員測試了一款眾所周知的公開可用的聊天機器人在處理困難醫療病例時進行準確診斷的能力。
 
團隊發現,生成式 AI,Chat-GPT 4,將正確的診斷選為其首選診斷的情況接近 40%,並在挑戰性病例的三分之二中提供了可能的診斷清單中的正確診斷。
 
生成式 AI 是指一種人工智慧類型,它使用其經過訓練的模式和信息創建新內容,而不僅僅是處理和分析現有數據。
 
最知名的生成式 AI 範例之一就是所謂的聊天機器人,它使用一種稱為自然語言處理(NLP)的人工智慧分支,使電腦能夠理解、解釋並生成人類語言。生成式 AI 聊天機器人是具有革命性的強大工具,可以改變創意產業、教育、客戶服務等領域。
 
然而,我們對於它們在臨床環境中的潛在表現,例如複雜的診斷推理,知之甚少。
 
"人工智慧的最近進展已經導致了具有詳細文本回答能力的生成式 AI 模型,這些回答在標準化醫學考試中得分很高," BIDMC 的媒體與教育傳遞創新(iMED)倡議聯合主任、哈佛醫學院的醫學講師 Adam Rodman 醫學博士、公共衛生碩士說。
 
"我們想知道這樣的生成模型是否能像醫生那樣'思考',所以我們請一個解決用於教育目的的標準化複雜診斷案例。它做得非常非常好。"
 
為了評估聊天機器人的診斷技巧,Rodman 和他的同事們使用了病理學病例討論(CPCs),這是一系列包括相關的臨床和實驗室數據、影像學研究和組織病理學發現的複雜和挑戰性病例,這些病例在《新英格蘭醫學雜誌》上出版,用於教育目的。
 
在評估 70 個 CPC 案例後,人工智慧在 27 個案例中(佔 39%)完全匹配了最終的 CPC 診斷。在 64% 的
 
案例中,最終的 CPC 診斷被包括在 AI 的差異中 - 一個可能解釋患者症狀、病史、臨床發現以及實驗室或影像結果的條件清單。
 
"儘管聊天機器人不能取代訓練有素的醫療專業人員的專業知識和知識,生成式 AI 是診斷中人類認知的有前途的可能輔助工具," 第一作者 Zahir Kanjee 醫學博士、公共衛生碩士說,他是 BIDMC 的醫院醫生和哈佛醫學院的助理教授。
 
"它有潛力幫助醫生理解複雜的醫療數據,擴大或縮小我們的診斷思考。我們需要更多關於這種技術的最佳用途、好處和限制的研究,並且需要解決許多隱私問題,但這些都是對未來診斷和病患照護的振奮人心的發現。"
 
"我們的研究增加了一個日益增長的文獻體,證明了 AI 技術的有前途的能力," 共同作者 Byron Crowe 醫學博士說,他是 BIDMC 的內科醫生和哈佛醫學院的醫學講師。
 
"進一步的調查將幫助我們更好地理解這些新的 AI 模型如何可能改變醫療服務的提供。"
 
這項工作並未獲得單獨的資金或贊助。Kanjee 報告了為 Wolters Kluwer 編輯的書籍的版稅和醫學教育產品的付費顧問委員會的成員身份,以及 Oakstone Publishing 提供的 CME 的榮譽費。Crowe 報告在提交的工作之外受到 Solera Health 的僱用。Rodman 報告沒有利益衝突。


新聞原址: ChatGPT AI Shines in Challenging Medical Cases - Neuroscience News