今天這集我們邀請到了臺灣醫療 AI 權威:李友專教授!

身為醫療科技領域的先行者,他深入參與了 AI 與醫療結合的研究。

在本集訪談中,你將深入了解生成式 AI 近年來在醫療領域的發展歷程,回顧其演進過程與目前的應用範疇。此外,我們也將探討醫療責任與風險相關的議題:隨著醫療 AI 的崛起,醫生是否有被取代的可能?若 AI 發生錯誤診斷,責任應由誰來承擔?這些都是本集將深入討論的重點。

 

訪談中提到的論文: https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2825395#google_vignette

紐約時報以〈A.I. Chatbots Defeated Doctors at Diagnosing Illness〉為標題報導了這篇論文: https://www.nytimes.com/2024/11/17/health/chatgpt-ai-doctors-diagnosis.html

 

▌關於 李友專教授

李友專教授是臺灣醫療 AI 領域的領軍人物,現任臺北醫學大學醫學資訊研究所特聘教授。他擁有豐富的學術與實務經驗,主持過百項醫學資訊相關研究計劃,並在推動臺灣電子病歷交換架構的發展中扮演了關鍵角色。此外,李友專教授更擔任 AI 生醫新創公司的企業導師。

 

以下是我們的對談內容: 

 

開場介紹

Harvey: 大家好,歡迎來到 Dr. Harvey 的頻道。今天很榮幸請到我的博士班老師,也是臺灣的醫療 AI 權威:李友專老師,來跟我們分享一下最近一直被提到的一個話題,就是「AI 是不是真的要取代醫生了?」

這個話題其實從我在博士班的時候就已經被討論過好多次了,但最近又再度浮上檯面,為什麼呢?因為 ChatGPT 的能力大家已經有目共睹,很多以前覺得不可能做到的事情,它都能做出來。前陣子 Stanford ( 史丹佛大學 ) 發表了一篇文章說,AI 在某些疾病診斷上的準確率甚至已經超過醫生。

因此,這個討論又熱了起來。我身邊很多醫學界的朋友也在好奇,這件事情到底會如何影響大家的職涯?如果你現在還在醫學院念書,這樣的技術就已經出現了,那該怎麼辦?要怎麼準備?

我覺得李友專老師應該是全臺灣最適合來分享這個話題的人,所以今天特別邀請老師來談談。老師要不要先簡單介紹一下自己?

 

李友專老師的背景

李友專: 大家好。我 1991 年從臺北醫學大學醫學系畢業,當時我決定先不要做住院醫師,而是去念醫學資訊 ( medical informatics ),其實就是在醫學院裡面念電腦的那種感覺,老師很多都是醫生,但同時也負責醫院的一些系統或是做與醫院應用直接相關的研究。我們不像 computer scientist ( 資訊工程學家 ) 一樣讀很多基礎理論,而是更專注在應用與評估。

我之所以一畢業就去念這個,其實就是為了剛剛 Harvey 提到的議題。但那時候我們的啟發者不是 ChatGPT,而是 Mycin,世界上第一個能用人工智慧做腦膜炎診斷的 AI 系統。因為看到這樣的成果,我就覺得 AI 對醫學非常有潛力。

在醫學教育的過程中,我們常常要背很多東西,七年下來真的很辛苦,而且大部分都會忘光光。當時我有個學長的綽號就叫「忘光光」,因為他在臨床實習時,主治醫師問的問題,他所有答案都是「忘光光」。人類本來就有這種會遺忘的特性,但電腦就可以輔助。我那時候就覺得,醫學生如果能懂電腦,這應該是一個很自然的出路。

 

從專家系統到大語言模型

Harvey: 所以老師等於很早之前就已經開始關注這個主題了。剛剛提到的 Mycin,其實就是所謂的專家系統吧?它在某件特定任務上很厲害,例如腦膜炎診斷。那這樣的專家系統,和現在的 ChatGPT 有什麼核心差異呢?

李友專: 對,這就是我們講的 artificial narrow intelligence ( 狹義人工智慧, ANI ) 。有人會把 AI 分成 narrow ( 狹義 ) 和 general ( 通用 ),narrow 就是只針對特定題目,不管是影像還是文字,它只能回答那個範圍內的問題。

Mycin 確實是 expert system,它只能回答和腦膜炎相關的細菌問題,病毒不行、其他疾病也不行,這就是典型的 narrow AI。但 ChatGPT 這樣的 large language model ( 大語言模型, LLM ),則更接近 artificial general intelligence ( 通用人工智慧, AGI )。起碼在醫學上,它不會被特定領域限縮,問它各種醫學問題,它都能達到一定的水準。

當然,有人對 AGI 的定義很嚴格,必須要「全面超越人類」或「至少在所有領域與人類一樣好」。也許 ChatGPT 還沒完全到達這個程度,但已經非常接近了。這跟過去我們需要先做知識工程,把特定領域知識摘取出來,再建成系統的做法很不一樣。

 

ChatGPT 出現的速度與震撼

Harvey: 老師,ChatGPT 出現的速度,有比你想像的還要快嗎?你發現 ChatGPT 的時候,感覺是什麼?

李友專: 太快、太快了!我想大部分的人第一次用 ChatGPT 的時候,都會覺得很不可思議。因為你說它是機率型的選擇下一個字,可是它生成的一整句話,讓人感覺完全不是這麼回事,它的答案會讓你覺得它根本理解你在講什麼。甚至當你想要騙它的時候,它還能辨別出來。這樣怎麼可能只是機率型的接出下一個字呢?

我還記得 2022 年 11 月 ChatGPT 剛推出時,我就開始關注。在那之前其實有 Google 的 LaMDA,是用 GPT-3 開發的,但並沒有開放。直到 OpenAI 用 GPT-3.5 做了一個簡單的文字介面,才真正引爆熱潮。

現在是 2024 年 11 月,不過短短兩年,我們對人工智慧的認識已經翻了好幾次。以前覺得做不到的事,現在很多都能做到。雖然還沒有達到所謂的「超級智慧」或「神級人工智慧」,但如果你在兩年前問我,我會說起碼還要再十年才可能。結果短短兩年就顛覆了大家的想法。

 

AGI 是否更接近了?

Harvey: 我前陣子做影片有提到,OpenAI 一名前員工說,我們距離所謂的奇異點,也就是 AGI,其實比想像中的更近。不過這是一個需要辯論的題目,有些人認為用 LLM 是不可能達到 AGI 的。但他提到一個有趣的論點:AI 研究的最大瓶頸其實是頂尖 AI 研究人員。所以若 AI 能模擬這些人的思考方式,再讓它們自己去研究,就能突破界線,速度會比預期更快。老師怎麼看?

李友專: 最近剛好曾任 Google 多年的 CEO 的 Eric Schmidt,在一場大會上就提到,他認為在 2 到 5 年內,AI 會開始能夠修改自己的程式。現在的 AI 雖然強大,但程式仍是人類寫好的,它只是讀文章、學習、然後輸出。但若有一天它能自己修改程式,進步就會無限加速。

這有點像 AlphaGo 變成 AlphaGo Zero。到了 Zero 版本,它不再需要人類棋譜,而是完全自己優化自己。當 AI 能自我改進,它就不需要仰賴工程人員了。到時候進步的速度可能就不是我們現在兩年的進展,而是相當於兩百年的進步。

我們很快就會碰到所謂的「奇異點」。奇異點的概念,就是當科技進步快到一個程度,你完全無法預測之後的樣貌,這個點就是 singularity,很多人都認為我們正快速逼近這個時刻。

Harvey: 對大部分人來說,現在的進步速度已經讓人覺得太快了。而且那些還在學校的學生,他們一方面要準備期中考、還是被要求背誦知識;另一方面,卻看到大家只要用 ChatGPT 就能瞬間得到答案。這裡存在一個很深的斷裂:大家心裡明白背誦知識已經沒有太大用處,但為了考試又不得不去背。

我最近和一些很認真、拿過書卷獎的學生聊天,他們其實很緊張。因為他們原本以「記憶力好」為自豪,可以靠背誦在考試拿高分,但這件事已經是人類完全不可能贏過 AI 的領域了。記憶力怎麼可能比 AI 好呢?

 

人類的記憶與理解: 混合、分散與創新路徑

李友專: 我可以先分享一下,人類的「記憶」與「理解」其實是一個混合體,這跟電腦完全不一樣。電腦的記憶就是單純的儲存區,而理解則交由 CPU ( 中央處理器, Central Processing Unit ) 或 GPU ( 圖形處理器, Graphics Processing Unit) 來處理。而人類的神經網絡裡面,並沒有分一個叫記憶區、一個叫理解區,而是全部混在一起。甚至我們的記憶都是有點半分散性的,也就是說有一些記憶是,就算你把腦挖掉一部分,它還是留著一些,而不是說有一塊腦區是記這個,然後你挖掉就不見了,沒有這樣的現象。

所以我還是覺得,如果你已經記了很多東西,還是有利的,你可以拿這些記憶來增加你的理解。但是重點是在理解,不是在記憶。甚至將來重點也不是在理解,而是在創新:你在理解之後,重新組合,能夠產生什麼新的東西。

學習大概可以分成三個階段。第一階段是記一些基本的東西,這一步其實無法跳過,因為如果你什麼都不記得,那根本無法理解任何事情。所以,基礎的記憶還是需要的。但這裡有一個關鍵的差別:你是「為了理解而去記」,而不是「為了考試、為了背誦而記」。

 

舉個例子:你想要理解電車是怎麼運作的,那你就得先了解什麼是電池。為了理解電池,你自然會去探索電池有哪些種類、它們的原理是什麼、材料有什麼差異。這不是死背,而是因為你想搞懂電車這個系統,於是你會自然的記住這些電池的知識。這種記憶是有意義的,因為它是為了幫助你建立理解。

其實很多人都有類似的經驗:當你真的理解了某件事,記起來反而變得容易。因為「記憶」跟「理解」並不是完全分開的,它們是一種混合、互相支撐的過程。

但學習的最終目的,不只是理解,更重要的是在理解之後,能不能再產生新的東西:新的觀點、新的想法,甚至是有價值的創新。這才是人腦真正的價值所在。

當然,現在也有一些研究開始挑戰這個說法。像最近有篇材料科學的論文就指出,用像 ChatGPT 這樣的模型,也能產出大量創新的想法。他們產生了幾千個新想法,結果經過評估,有大約 50% 被認為是新的、而且可行的。這其實蠻驚人的。不過,這些 AI 產出的想法,還是需要人來判斷它們的價值與實用性,至少目前為止,這件事還是人腦比較擅長的。

 

善用 AI:站在它的肩膀上,主動實作與挑戰

李友專: 所以我們能做的就是,訓練自己能夠去判斷 AI 提供的這些創新想法,是不是真的創新、是不是真的有用。未來會怎麼樣我不敢保證,但至少現在,我們應該做的,是站在 AI 的肩膀上,讓自己看得更遠。這代表你要理解目前的發展,不能只是看新聞、聽別人怎麼說,或看影片講一講而已。你要用用看、親自去嘗試,直接打開工具、丟出問題、提出挑戰,實際操作一下,才會真正理解它的潛力與限制。

Harvey: 沒錯。

李友專: 對不對?花個 20 塊錢美金一個月,你挑戰它看看。

Harvey: 我記得 ChatGPT 剛出來的時候,老師就說這個 20 塊真的太便宜了。

李友專: 對啊,太值得了。這個 200 萬美金都做不到的事,今天 20 塊就有了。

 

回到主題:AI 會不會取代醫生?

Harvey: 那我們回到主題,AI 會不會取代醫生這件事情,現在聽起來 ChatGPT 真的是一個比較強的 AI 系統,它可以取代醫生嗎?老師怎麼看?

李友專: 如果你仔細讀這篇文章的話,它事實上是一個沒有發表的文章,它是放在一個網站上,並沒有經過論文同儕審查。不過已經引起蠻大迴響,因為連紐約時報都已經去採訪他們,然後寫了一篇報導。

但是,如果你仔細看就會發現,它仍然面對一個很根本的問題:醫學診斷本身就不是一個明確的定義。舉例來說,發燒算診斷嗎?拉肚子 ( diarrhea ) 呢?皮膚癢算不算?嚴格來說,這些其實都只是症狀,並不是診斷。但是,在醫療體系中,我們經常又會把它們當作診斷處理。像 ICD ( 國際疾病分類系統, International Classification of Diseases ) 裡面,就有一整個分類是 symptom and signs ( 症狀與體徵 ),也都有對應的代碼。所以在實務上,symptom ( 症狀 )、sign ( 體徵 )、intermediate pathological condition ( 中間病理狀態 ) 和 final diagnosis ( 最終診斷 ) 經常是混著用的。

所以當 AI 去學習醫學文獻時,它也會學到這種混用的邏輯。結果就是,它也會把所有這些資訊通通當作「診斷」來理解。這在實際應用上就會產生問題:我們怎麼去評估 AI 的診斷對不對?比方說,一個病人來看皮膚問題,你說他是「皮膚炎」,我說是「間質性皮膚炎」,他說是「脂漏性皮膚炎」。那到底誰對?如果說「皮膚炎」算部分正確,那怎麼算準確率?還是說診斷成「皮膚搔癢」也可以?因為病人確實有癢的症狀。這些答案很難用 0 或 1 去判斷對錯。

醫學診斷常常是根據情境而變動的。有時候你要看重點,有時候根據它的需求、根據情境、根據保險、根據各式各樣的狀況,它會有些不一樣。從古至今,醫學診斷其實都不是一件「標準化」的事情。早在 1970 年代就有研究顯示,即使是面對同樣一批病歷案例,讓多位頂尖醫師來診斷,他們之間的診斷一致性往往都不到 70%。甚至是在他們最擅長的領域裡進行判斷,結果卻仍然出現高度分歧。

這種現象至今仍然存在。就像那篇近期引發討論的文章中提到的,醫生之間的診斷同意率也大約在 70% 左右,而這份診斷結果與所謂「標準答案」的比對,準確度也差不多是這個數字。有趣的是,AI 在某些測試中已經可以達到 90% 左右的準確率,這很驚人。

更進一步來看,目前的 LLM 還有一個特性是:同一題你問它很多次,它的回答可能會有一些變化。以皮膚科為例,我們實測過,如果你問它:「請給我這個症狀的前十大可能診斷」,你問它 300 次或 1000 次,它會給出一個核心清單,其中幾個診斷幾乎每次都會出現,但其他會有些微變動,大約會有 10% 的變異。

這反映了另一個重點,醫學診斷很多時候其實是一種「猜測」,尤其當你手上還沒有完整資訊、還沒有病理報告或實驗數據時。這種情況下,你的判斷就是建立在經驗、直覺與不完整資料上的推測。猜對了,或許只是運氣好;猜錯了,也不是技術不好,而是資訊不足。相反的,如果你提供一份 completely worked up case ( 全面診斷 ),包括病理報告與所有檢查結果,那當然無論是 AI 還是醫生,答案幾乎都會一致。但那時候已經不是「診斷」,而是「確認」了。

用猜的,本來就會有人猜對、有人猜錯啊。所以,我們在評估 AI 是否能「取代醫生」的時候,不能只看準確率這個數字,而要回到根本去思考:醫學診斷的本質,從來就不是一個黑白分明的判斷題。很多人一看到 AI 診斷準確率高的報導,會問:「那醫生是不是快要被取代了?」這個想法實在太簡化了,對醫學診斷的理解也有點誤會。

Harvey: 沒錯。我覺得這個回答很深入。大部分的人看到這種聳動標題的時候,其實是不知道評估標準是什麼的。我們自己在這個領域才會知道說,可能有時候黃金標準都沒有被確定,到底誰對誰錯,不知道。

 

兩個關鍵環節: 資料輸入與醫療授權

Harvey: 我們那時候在看說「有沒有 AI 系統會取代醫生」的時候,有兩個很大的點。

第一個是,總是要有人去輸入這些診斷症狀,還有做問診或觸診這些資訊。沒有醫生的話,你很難 獲取這些資訊。當然大家會說,未來有各種工具可以做這種事情,但至少現在還沒有。

而且其實,醫生最大的權利就是可以簽章開藥。因為你的 AI 系統不管再怎麼厲害,都不可能負這個責。

李友專: 可以從自駕車去看,自駕車有 Level 1 到 Level 5,Level 5 就是完全你可以不管它、你也不用去看、也不用去踩,就是完全車子自己自駕,而責任就是在自駕車的公司;就是如果你出了什麼事情,就是這家自駕車公司要負責。

同樣的道理,如果有人出了一個 AI,說診斷錯誤它負責,而且它也考過了 USMLE ( 美國醫師國考, United States Medical Licensing Examination ),那它確實可以取代一部分的醫師。甚至可以開一家公司,說我用某個 AI 系統來提供醫療服務,我願意對它的結果負責,那你就能做這門生意。你可能就去買個責任險,然後轉嫁這個風險,找保險公司來承擔。

Harvey: 你就會有幾層的風險轉嫁的商業模式出來。

李友專: 沒錯。所以其實也是可以啊,如果你願意承擔 Level 5 風險,你可以宣稱 Level 5,沒有問題啊。

Harvey: 這是蠻好的點。

 

AI 在醫療裡的潛在切入點

Harvey: 另外一個採用上面的門檻,其實是在醫院要採用這種系統的時候,其實是醫生決定要不要。像院長、醫療決策層,很多時候都是資深醫師出身。他們要點頭,系統才有機會進來。但你如果是要來取代醫生,他們自己身為醫生,會不會做這個決策?

李友專: 其實現在大部分的醫院,已經沒有住院醫師可以值班,因為住院醫師現在是勞工法,有工時的限制,所以晚上常常是主治醫師要值班。那主治醫師值班,真的叫來醫院的機會也不是很大,可是你就是不能跑,你就是得心裡掛著說「我現在在值班」。

那為什麼不讓 AI 去值這個班?如果院長說:「你們如果同意買這個 AI,我們晚上都 AI 值班。」所有人一定舉雙手贊成啊!

Harvey: 所以這種錢 AI 公司賺走,其實沒有人會說什麼。

李友專: 還有像偏遠地區也要常常派醫生過去,像我去澎湖望安、將軍去看一次的診,我就要花三個整天,從臺北飛過去,先坐一般的船、再坐小船,然後看個三小時,而且還得過夜,因為船班的關係。

所以這三天的這些費用、時間成本,拿去弄個 AI 不是很好嗎?也少了很多人員旅行的風險。

Harvey: 感謝老師今天跟我們分享這些有趣的觀點。如果大家對醫療 AI 還有什麼相關問題的話,可以告訴我們。

李友專: 謝謝,謝謝 Harvey。

Harvey: 大家拜拜。

訂閱我的 HCC 電子報,為傑出的你解鎖職涯新高度!

和超過 2000 位頂尖人才一起,每週一封精選內容,掌握商業思維、產業趨勢,深化職涯思考

你還可以閱讀

  • 從「實驗室博後」到「國際藥廠法規 VP」,美國職涯實戰分享 【ft. 台美生技協會會長 洪筱玲博士】

  • AI 時代職場翻身術:掌握商業開發 3 大關鍵,讓你升職加薪快人一步!【ft. Yourator 營運長 Disney】

  • 再生醫學商業化真相:外泌體與 IPS 幹細胞的未來機會【ft. 京都大學 IPS 幹細胞研究所博士 Colton】

  • 從「實驗室博後」到「國際藥廠法規 VP」,美國職涯實戰分享 【ft. 台美生技協會會長 洪筱玲博士】

  • AI 時代職場翻身術:掌握商業開發 3 大關鍵,讓你升職加薪快人一步!【ft. Yourator 營運長 Disney】

  • 再生醫學商業化真相:外泌體與 IPS 幹細胞的未來機會【ft. 京都大學 IPS 幹細胞研究所博士 Colton】

  • 前台達能源策略長現身分享:人人都能懂的綠能產業發展與未來就業機會【ft. AGMI Group 永續科技合夥人 曾令佳 Lin-Ga】

  • 從「實驗室博後」到「國際藥廠法規 VP」,美國職涯實戰分享 【ft. 台美生技協會會長 洪筱玲博士】

  • AI 時代職場翻身術:掌握商業開發 3 大關鍵,讓你升職加薪快人一步!【ft. Yourator 營運長 Disney】

  • 再生醫學商業化真相:外泌體與 IPS 幹細胞的未來機會【ft. 京都大學 IPS 幹細胞研究所博士 Colton】