逾百醫院部署DeepSeek… AI醫師來了 靠譜嗎?

在DeepSeek等大模型的推動下,中國醫療行業的智慧化進程在加快,有超過100家醫院完成DeepSeek的本地部署,還有民眾靠DeepSeek隔空把脈抓中藥,但AI醫師真的靠譜嗎?
醫院會診室內,13名北京兒童醫院知名專家圍坐在會議室,神情專注,與這些頂級專家一同會診的,還有中國首位AI兒科醫師。
螢幕上即時展示著一名疑難病例患兒腦部的磁共振成像影像,隨著工作人員將患兒病歷及相關影像資料等輸入電腦,最終,AI給出的建議與現場專家們的會診結果高度吻合。這次會診由北京兒童醫院院長、耳鼻咽喉頭頸外科專家倪鑫主持。他表示,「大家當時看到結果都很驚訝」。如今,每周四,倪鑫都會主持有AI兒科醫師參與的專家會診,對五至十名患兒的病情全位討論。

★醫療AI 加速湧入醫院
DeepSeek的影響力也已蔓延到了門診患者中,AI加速湧入醫院。過去,人們看病前可能會用百度搜索相關資訊,而現在DeepSeek提供了更系統化的建議。復旦大學附屬華山醫院(下稱「華山醫院」)神經內科主任醫師郁金泰表示,DeepSeek可看作是患者自查工具的「升級版」。
如今,醫療AI大模型正如雨後春筍般湧現。幾乎每天都有醫院宣布在DeepSeek基礎上部署AI大模型,或公布與企業合作研發的垂直AI大模型。北京兒童醫院的AI兒科醫師便是後者,該大模型由北京兒童醫院聯合北京百川智慧科技有限公司(下稱「百川智慧」)等共同研發。
王小川第一天創立百川時,就想「造醫師」,即打造具備專業診療能力的AI醫師,在兒科醫師嚴重缺乏的情形下,北京兒童醫院和百川智慧在AI兒科醫師專案一拍即合。
「AI大模型就像在『造人』,它能夠類比人類的思維方式。」百川智慧醫療副總裁李施政表示,最開始百川智慧提及的是要「造醫師助手」。結果,倪鑫主動提出「要造100萬個兒科醫師」。
目前,除了北京兒童醫院、華山醫院,全國多家知名三甲醫院都在積極部署AI大模型。AI已覆蓋科研、臨床等多個應用場景,除了輔助醫師提供診療建議外,還能在醫師接診前自動收集和整理患者病歷。

★AI幻覺 誤判干擾信號
然而,AI的輸出結果主要基於統計資料。更關鍵的問題是:AI幻覺似乎難以避免。所謂幻覺,是指大模型在回答問題時編造資訊。
華中科技大學同濟醫學院附屬同濟醫院感染科副主任醫師郭威表示,臨床使用中,AI偶爾會出現一些令人啼笑皆非的錯誤。他舉例說,影像學的變化非常複雜,有時所看到的可能是無診斷價值的「干擾信號」,而AI有時會將其判斷為病變。
西部某省會城市,一家三甲醫院外科主任醫師趙霖(化名)也經歷了AI幻覺。他在為學生準備外科課程時,讓DeepSeek協助製作PPT,結果發現它開始編造內容,包括杜撰醫學名詞出處、虛構參考文獻等。他由此產生了疑問:如果AI用於醫學輔助決策,如何確保它推薦的方案是基於真實指南,而不是憑空捏造的?
幻覺通常會被AI自信地呈現,使得它們有時難以被察覺。而幻覺的產生,與模型的訓練內容密切相關。郁金泰表示,AI的可靠性取決於輸入資料的準確性和專業性。如果輸入的資訊有誤,輸出的結果同樣會存在偏差。
李施政指出,雖然AI模型出錯較為常見,但在醫療領域,錯誤必須嚴格控制,尤其在用藥建議環節。為確保錯誤率遠低於人類醫師,AI醫師的工作必須嚴格遵循醫學原則,即所有決策都必須基於科學證據,包括權威指南、頂級專家經驗和最新研究成果。

★AI輔助 無法替代醫師
郭威注意到,儘管身邊大多數醫師對AI大模型等新技術持積極態度,但醫師們也會討論哪些科室的醫師可能最先會被AI取代。他認為,涉及診斷影像的醫師可能面臨更大的被替代風險,例如,AI輔助的X光片和胸部CT閱片,能夠發現許多肉眼難以察覺的小結節。隨著AI技術不斷進步,影像科醫師的工作將更多轉向輔助和審查。
「有些人擔心AI醫師的出現,會導致一些醫師失業,這不會發生在兒科醫師中。」倪鑫表示,AI醫師與人類醫師是相互支援的關係,AI更多是輔助醫師,而非取代他們。
不少一線臨床醫師擁抱AI的同時,也保持著冷靜。來自感染科、神經內科、外科等科室的多名臨床醫師透露,目前AI在臨床中的作用主要是輔助,無法替代醫師的決策。北京大學第一醫院神經內科主任醫師孫永安說,儘管AI在分析和整合現有資料方面表現出色,但它缺乏真正的創新能力,無法獨立探索未知領域。而醫學的進步往往來源於突破性的創新。
「無論技術多先進,AI始終難以替代醫師的深度思考和即時應變。」武漢一家部署DeepSeek的三甲醫院急診科醫師魏明(化名)表示,急診科有時也需要對患者進行淋巴結活檢。例如,在頸部進行淋巴結活檢時,影像上顯示的病變可能靠近血管。手術過程中,醫師必須親自觀察並判斷,精細分離淋巴結,同時防止出血。即使AI能標出大致病灶位置,如何避開關鍵結構、確保安全切除,仍須醫師根據病人具體情況作出判斷。醫師仍然是最終的決策者。
郁金泰表示,醫師不僅具備專業背景,還能基於臨床經驗綜合判斷病情,這正是AI無法完全取代醫師的核心所在。
AI在醫療領域的發展,不會停下腳步。「100萬個兒科醫師,這個目標聽起來宏大,但現在已經基本實現了。我們的大模型理論上可以誕生成千上萬的AI兒科醫師。」倪鑫談道,河北當地有150多家基層醫院,希望能成為AI兒科醫師的首批試點。北京兒童醫院和百川智慧計畫先在京津冀地區的醫院進行試點,再將AI兒科醫師推廣到全國各地。
黃虹表示,DeepSeek只是眾多大模型中的一種,而大模型本身並非固定不變。從醫院角度看,未來不僅關注單一模型的應用,而且要思考如何整合多種大模型,以便為不同領域提供精準支援,未來的AI醫療可能是「千模融合」。

●AI中醫無法望聞問切 自行抓藥有風險
中國各大醫院紛紛導入DeepSeek當AI醫療助理,一般民眾也把DeepSeek當成醫療顧問,還有人照著DeepSeek的開的藥方到中藥房配藥吃,但中醫師強調,中醫辯證需要「望聞問切」,聊天機械人只能作輔助,民眾自行抓藥有風險。
BBC報導,在小紅書上,有關「DeepSeek看中醫」的筆記就多達4萬條。有人留言說,自己老婆咳了一個多月,中西醫都沒看好,但吃過四次DeepSeek推薦的藥就好了,形容是「真正老百姓的福音」。
廣州的妙妙媽媽今年34歲,她的女兒去年感染支原體肺炎,身體變得脆弱,嚴重時每個星期都發高燒,又患上過敏性鼻炎。妙妙媽媽連續15天讓DeepSeek診斷女兒的症狀,「稍微有一點著涼,或者大便有點拉稀,我都會問」,她再按照推薦的中藥配給女兒吃。
妙妙媽媽詳細記錄女兒的變化:服藥的第二天,手心熱的女兒溫度恢復正常,大便變得暢通;第三天,食欲增強;第七天,膚色亮起來了,「不像之前一臉黃氣」。她看著女兒身體一點點好起來,感到很興奮,「我覺得它很厲害、很對症」。
可是在評論區中有不少反對聲音,有人批評她太輕率:「膽子上天了,AI離替代中醫大夫還差十萬八千里」;也有人說方子「治標不治本」。但妙妙媽媽說, 「我只看效果」。
事實上,用聊天機器人看病不是新鮮事。在ChatGPT問世之後,國外不少人向它尋求醫療建議,而無論病人或醫師,給出的評價都相當正面。美國和德國都有研究顯示,參與盲測的病人認為GhatGPT的回應更有同理心和更有用。
報導指出,來自湖南的袁莉有兩個孩子,她也覺得AI分析「挺靠譜的」。在中國看西醫,一般會做血常規等檢驗。但袁莉說,即使孩子的指標出現不正常,醫師也不會詳細解釋。以前,她會去百度逐項搜尋各項數據的意義,後來她把檢驗單發給DeepSeek,AI馬上給她分析下診斷,還推薦用藥。袁莉不得由衷讚嘆:「DeepSeek真的很強。」
人們沒有被醫師解決的焦慮,在機器人的耐心下撫平。但是關鍵問題是,ChatGPT在西醫應用成功,DeepSeek能否在中醫上複製?
大語言模型(LLM)主要透過投餵大量資料來進化,而西醫依賴統一的指標、數據整合來斷症,要訓練它,就像是一個「啃指導的過程」,但中醫不是這樣。北京中醫藥大學中醫內科研究生、中國註冊中醫師花貓(化名)分析,中醫各流派沒有統一,「對於同樣一個訊息,大家理解維度不一樣,思路也不一樣。」換句話說,當AI要代入中醫診斷,因為有很多資料參考,得出來的治療方案未必一致。
澳門科技大學中醫藥學院前院長周華說,中醫辯證講求「望聞問切」,每個步驟都是辯證的重要參數,但DeepSeek目前只能「問」,靠病人給它提供的資訊(prompt)斷症,倘若資訊有所缺失,效果也會天差地別。
一名香港註冊中醫師卓健(化名)表示,中藥一向給人溫和不傷身的印象,也正是因為這種錯覺,人們輕視了中藥的危險性。「大家經常覺得是無副作用、是天然的,所以大家會很容易去買一些自己煲來吃,很多時候都煲出事。」在香港,自2008年到2021年的13年間,懷疑服用中藥或中成藥中毒的個案就超過4900宗,更有許多人因為沒有諮詢中醫師自行用藥,導致「烏頭鹼」中毒。
卓健認為,人們用DeepSeek開藥方的趨勢,就像以前電視節目或報紙教煲「保健湯方」—開方者未必十分了解清楚大眾體質,大眾也不確定藥方是否適合自己。他說,如今聊天機器人的出現,只是令過去的現象和風險更普遍。
不過據花貓觀察,DeepSeek目前開的方子還算是保守安全,「你要是怕冷,它可能大概就用附子、桂枝、生薑,要是脾胃不好就白朮、茯苓、人參。」花貓說,它一般都是在常見的名方上修改,藥方沒見用上毒藥,劑量也算安全,就算喝多了,「最多也就是上上火」。
至於會否造成長遠傷害的問題,花貓覺得人會有自控能力,「吃這個玩意不舒服,一般自己就會停(藥)了。」但如果有人真的把它當作權威而吃錯了,也只能怪自己:「怎麼能相信一個機器呢?」
FB留言