來源:工人日報
2019-01-14 10:37:01
最新研究顯示,人工智能可從人臉照片中識別出罕見遺傳綜合征
AI醫生“看臉”就能識疾病
DeepGestalt首先識別患者面部的五官,然后將圖像裁剪成100×100像素大小的區域。接下來,使用深度卷積神經網絡對這些區域進行評估,分析每個綜合征的概率。然后它綜合整個圖像的數據給出一個預測。
Face2Gene手機應用的使用示范
如今,人工智能在各個領域迅猛發展。新的研究表明,在醫療領域,人工智能可以幫助診斷罕見疾病。
約有8%的世界人口受到遺傳綜合征的困擾,此類患者往往具有可識別的面部特征。然而,遺傳綜合征的診斷過程卻出奇陳舊,大多數時候需要醫生手工測量面部特征之間的距離。1月7日,總部位于波士頓的人工智能公司FDNA發布了一項最新研究,他們發現,通過數萬張真實患者面部圖像的訓練,人工智能能夠以較高的準確度從人臉照片中識別出罕見遺傳綜合征。
“這是人們期待已久的醫學遺傳學突破,終于取得了成果,”凱倫·格里普在一份聲明中說,她是一名醫學遺傳學家,也是這篇新論文的合著者。“通過這項研究,我們已經表明,在臨床工作流程中添加一個自動的面部分析系統可以幫助實現早期診斷和治療,有望改善生活質量。”
AI醫生的“診斷”過程
訓練算法
每年全球出生的兒童中約有6%患有嚴重的遺傳綜合征。早期發現這些綜合征有助于治療,但準確診斷往往是個漫長而昂貴的過程。部分問題在于基因綜合征有數百種,其中許多非常非常罕見。正確的診斷和早期治療,常常依賴于醫生的經驗以及他們以前是否遇到過類似案例。但是機器學習可以改變這種情況。
格里普和她的同事們想創造一種人工智能,能夠通過病人面部圖像識別基因綜合征。為此,研究小組建立了一個名為“DeepGestalt”的深度學習算法,它可以分析面部特征,找出特定遺傳綜合征日前發表在《自然醫學》雜志上的新研究報告稱,他們使用了一個包含15萬多名患者的數據集來訓練這種算法。
DeepGestalt算法首先識別患者面部的五官,例如眼睛、鼻子和嘴巴,然后將圖像裁剪成100×100像素大小的區域。接下來,該技術使用深度卷積神經網絡對這些區域進行評估。深度卷積神經網絡是一種機器學習技術,已經成為自動圖像分類的領先模型。對于每個面部區域,DeepGestalt分析每個綜合征的概率,然后它綜合整個圖像的數據給出一個預測。
打敗專家
當格里普和她的同事對DeepGestalt進行診斷測試時,它的表現優于臨床醫生。在一項測試中,他們對DeepGestalt進行了一系列的訓練,給它展示了600多張科妮莉亞德蘭格綜合征(一種導致發育遲緩和生長缺陷的遺傳疾病)患者的圖片,以及大約1100張非患者的圖片。研究人員報告說,DeepGestalt以接近97%的準確率識別出了該綜合征患者。相比之下,65名專家在面對類似的診斷測試時,準確率只有75%。
在另一項測試中,研究人員使用17000多張、涵蓋了200多種不同基因綜合征的患者圖像對這一算法進行了訓練。經過訓練,在一項包含502張新圖像的測試中,DeepGestalt成功地以91%的準確率列出了排名前十的綜合征。
“不斷增強的標準化描述(病人特征)的能力,打開了未來研究和應用的大門,”FDNA公司首席技術官、論文第一作者亞龍·古羅維奇說,“它展示了一個可以成功地應用先進的算法,如深度學習,一個具有挑戰性的領域。”
AI醫生的“培養”過程
發布App收集海量數據
要研發這樣的深度學習算法需要相當大的訓練數據集。FDNA通過出版物和公共數據集收集了這些數據,也通過向臨床醫生發布一個名為“Face2Gene”的應用程序來收集數據。
去年秋天,FDNA首席執行官德克爾·蓋爾布曼是這樣介紹Face2Gene的:這款應用實際上是一個平臺,可以通過移動應用商店和網絡訪問。
使用這款應用,醫生需要拍攝病人的照片,然后將照片上傳到App上。DeepGestalt掃描了這張照片,并從該公司的專有數據庫中為醫生提供了一份兼容診斷的排名表。這款應用還可以幫助醫生解答問題,添加更多特征的表型數據,進一步完善結果。如果可能的話,醫生可以通過增加一個最終診斷來結束這個循環。
醫生輸入的數據,在蓋爾布曼口中所稱的“良性循環中”訓練了深度學習算法。蓋爾布曼說,Face2Gene的使用一直在增長,許多用戶在涉及基因部的臨床數據或病歷時,已經開始依賴該應用程序。
據FDNA公司介紹,他們用了三年的時間在Face2Gene平臺上收集了15萬名患者的面部數據。這次研究的17000多張面部圖像正是出自這個數據庫。
關鍵是要使用幼兒圖片
西奈山伊坎醫學院教授Bruce Gelb博士指出,這篇論文只使用了一組幼兒的圖像,這一選擇可能為算法的成功奠定了基礎。
“面部特征在蹣跚學步的兒童或幼兒身上最為明顯,這種特征在青春期就會逐漸消失——在進入成年期之前。”他說。
不過,他承認,該算法的成功率令人印象深刻,對于那些對特定遺傳特征沒有高度專業知識的臨床醫生尤其有用。
“使用FDNA這樣的工具可以讓臨床醫生知道他們應該讓實驗室檢測哪些基因。”古羅維奇說,“如果你正確地考慮表型,你就能增加診斷的幾率。”
他說,人類做不到這一點。“有些遺傳學家嘗試過這樣做。他們不能,我們可以。”
隱私顧慮
除了令人刮目相看的結果和新的潛在用戶,論文作者還強調了一些注意事項和關注的領域。這些實驗的基本假設都是病人確實患有綜合征,如果是正常人,那應當另外處理。
他們還警告了濫用這項技術的風險。“表型數據是敏感的患者信息,基于此的歧視受到反基因歧視法的限制。與基因組數據不同,面部圖像很容易獲取。減輕濫用的有效監控策略,可包括通過區塊鏈技術向使用DeepGestalt應用程序的用戶添加數字足跡等。”
確實,人臉圖像是敏感且容易獲取的數據,若使用不慎,看臉識疾病的技術將引發歧視等倫理問題。如果面孔能夠揭示基因的細節,那么雇主或保險公司等就可以秘密地利用這些技術,歧視那些可能患有某些疾病的人。
三年前,上海交通大學教授武筱林訓練出了可以看臉識罪犯的人工智能系統,準確率達到86%。當時,這項研究引發了廣泛爭議,也遭受了紛至沓來的批評。不少學者認為該研究充滿了歧視和誤導,將給無辜的人們帶來巨大的麻煩。
也許是因為這樣的前車之鑒,FDNA最新研究的作者指出,應防止DeepGestalt技術的歧視性濫用。古羅維奇說,這個技術只開放給臨床醫生運用。
格里普說,出版論文的重要性在于激發想象力,而非其他。
“最重要的是,這是人工智能如何應用于病人表型的一個例子。這個工具將變得越來越有價值。這個僅是觀察面部特征,但對病人來說還有很多。你可以用類似的工具來觀察X光片或視網膜的照片。”她說,“這只是一個例子。人工智能方法還可以為下一代表型帶來許多其他功能。”
據《信息時報》報道
想爆料?請登錄《陽光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網官方微博(@齊魯網)提供新聞線索。齊魯網廣告熱線0531-81695052,誠邀合作伙伴。