發(fā)布日期:2017-02-22
近兩年來,無論是在語音識別、圖像識別還是文本理解,深度學習在醫(yī)療領域都有超乎想象的突破。
·在語音識別領域,梅奧診所與以色列語音分析公司Beyond Verbal合作的研究發(fā)現(xiàn)13個語音特征和冠心病存在相關性,其中一個語音特征與冠心病存在強相關。
·在自然語言處理領域,IBM的沃森機器人能夠在17秒內,閱讀3469本醫(yī)學專著,248000篇論文,69種治療方案,61540次實驗數(shù)據(jù),106000份臨床報告,并根據(jù)醫(yī)生輸入的病人指標信息,最終提出優(yōu)選的個性化治療方案。
與此同時,伴隨著計算機視覺的技術進步,深度學習技術在醫(yī)療影像領域頻頻取得重大突破,人工智能除了教會機器如何“聽懂”和“讀懂”,更能教會機器“看懂”我們的世界,并在此基礎上協(xié)助醫(yī)生診斷疾病。醫(yī)療數(shù)據(jù)中有超過90%的數(shù)據(jù)來自醫(yī)療影像,醫(yī)療影像領域擁有孕育深度學習的海量數(shù)據(jù),也存在著借助深度學習提高醫(yī)生“看片子”診斷的效率的需求。因此,在醫(yī)療影像領域,深度學習可能率先進入臨床階段。
13萬張圖像的訓練下,深度學習識別皮膚癌的準確率媲美人類醫(yī)生
皮膚癌是人類最常見的惡性腫瘤,雖然它們出現(xiàn)在皮膚表面,但人們往往將其誤認為是自然生長的“痣”,耽誤病情,確診后已為時過晚。奇點糕還記得,電影《非誠勿擾2》里面,孫紅雷飾演的李香山從小就長出來的一顆黑痣轉變成了惡性的黑色素瘤,最終不堪絕癥折磨的他選擇跳海自殺。
早期檢測到的黑色素瘤的 5 年生存率在 97% 左右,如果晚期查出 5 年生存率將會下降 14%,皮膚癌的早期發(fā)現(xiàn)可能會對其結果產(chǎn)生巨大的影響。對于皮膚癌的篩查,主要是通過視覺診斷。一般先進行臨床篩查,之后可能進行皮膚鏡分析、活檢和組織病理學研究。那么有沒有一種更簡單地方法篩查皮膚癌呢?或者說,能不能利用智能手機篩查皮膚癌?
借助深度卷積神經(jīng)網(wǎng)絡(CNN)技術,斯坦福大學的研究者讓這個設想更進一步:研究者們在谷歌用于識別貓和狗算法的基礎上,經(jīng)過13萬張皮膚病變的圖像訓練后,可用于識別皮膚癌。該系統(tǒng)與21位皮膚科醫(yī)生進行的2輪的對比測試:角質細胞癌與良性脂溢性角化病,以及惡性黑色素瘤和普通的痣。第一輪代表最常見的癌癥識別,第二輪代表了最致命的皮膚癌識別。深度卷積神經(jīng)網(wǎng)絡在這兩個任務上的表現(xiàn)都達到了所有接受測試的專家的水平,證明了這一人工智能系統(tǒng)的皮膚癌鑒定水平與皮膚科醫(yī)生相當。這一研究成果發(fā)表在2017年1月份的Nature期刊上?!?】
研究者并不止步于此,他們希望在智能手機上也應用該系統(tǒng)。論文的主要作者之一、Thrun 實驗室的研究生Andre Esteva說:“現(xiàn)在每個人口袋中都有一個超級計算機,上面有大量、包括攝像頭傳在內的感器。如果我們把它用來篩查皮膚癌會怎么樣?或者篩查其他疾???”
Google利用深度學習診斷糖尿病視網(wǎng)膜病變
糖尿病視網(wǎng)膜病變是目前越來越被人們重視的致盲病因,目前全球范圍內有 4.15 億糖尿病患者面臨視網(wǎng)膜病變的風險。若是發(fā)現(xiàn)及時,該病是可以被治愈的,但若是未能及時診斷,則可能導致不可逆轉的失明。
糖尿病視網(wǎng)膜病變患者視網(wǎng)膜基底造影示例。左側圖片采自眼部正常的糖尿病患者;右側圖片采自患有視網(wǎng)膜病變的糖尿病患者,圖中顯示出該病人眼底有出血現(xiàn)象
一般來說,醫(yī)生要通過糖尿病患者的眼底造影圖像來判斷是否視網(wǎng)膜發(fā)生了病變,并通過眼底病變來判斷嚴重程度,例如是否出現(xiàn)了微動脈瘤、眼底出血、硬性滲出等,主要參考出血、液體滲出等病況。這就對醫(yī)生個人水平提出了較高的要求,如果缺乏臨床經(jīng)驗,那么很容易誤診或漏診。
2016年,Google的研究者Varun Gulshan和他的同事利用深度學習創(chuàng)建了一種能夠檢測糖尿病視網(wǎng)膜病變和黃斑水腫的算法,它能夠通過眼部掃描圖像判斷患者的視網(wǎng)膜是否發(fā)生了病變,輔助醫(yī)生在有限的醫(yī)療條件下進行診斷。該研究發(fā)表在2016年11月30日的《美國醫(yī)學會雜志》期刊上?!?】
黑色曲線表示算法性能,彩色點表示八位眼科專家對糖尿病視網(wǎng)膜病變(輕度或重度糖尿病視網(wǎng)膜病變,或由糖尿病引起的視網(wǎng)膜黃斑水腫)的臨床診斷結果。
為了訓練該算法,研究者從EyePACs數(shù)據(jù)庫搜集了128 175例注釋圖片,每張圖片都記錄了 3-7 名眼科醫(yī)師的評估結果。與該團隊合作的眼科醫(yī)師一共 54 名。為了驗證算法的準確度,研究者使用兩個獨立的數(shù)據(jù)集進行驗證,一個9963例圖像一個1748例圖像。與8名眼科醫(yī)生診斷結果對比,谷歌的這款算法甚至超過人類醫(yī)師:算法獲得0.95的F分數(shù)(結合敏感性和特異性指標,取max = 1),相比八位眼科專家的中位數(shù) 0.91分。
本次眼影所用的圖像為2D圖像,谷歌Deepmind已經(jīng)開始將更為精確、全面的3D圖像技術(光學相干斷層掃描(OCT))應用于深度學習中。
中國科學家利用深度學習篩查先天性白內障
先天性白內障是一種罕見病,集合了慢性和急性疾病的特點。它導致失明和視力損傷,多在出生前后即已存在,或在兒童期內罹患,在我國發(fā)病率為0.05%。
受到2015年谷歌DeepMind發(fā)表論文的啟發(fā),中國中山大學中山眼科中心的80后眼科醫(yī)生林浩添和他的同事萌生出想要創(chuàng)建一個人工智能平臺來挖掘他們在先天性白內障的臨床數(shù)據(jù),進而達到篩查和輔助診斷的目的。他們聯(lián)合西安電子科技大學劉西洋教授利用ILSVRC 2014(ImageNet Large Scale Visual Recognition Challenge of 2014)的冠軍模型來建立識別先天性白內障的深度學習模型(該模型被認為在圖像識別領域占主導地位,可用于訓練和分類),取名為CC-Cruiser。本次研究成果于2017年1月30日發(fā)表在Nature Biomedical Engineering期刊上【3】。
訓練CC-Cruiser的圖片集,研究者采用了來自中國衛(wèi)生部兒童白內障計劃(CCPMOH)例行檢查的一部分圖片,包括410幅不同嚴重程度的先天性白內障兒童患者的眼部圖像,476幅正常兒童眼睛圖像。所有圖片均由兩名有經(jīng)驗的眼科醫(yī)師獨立地進行分類和描述,第三名眼科醫(yī)師對分歧案例提供咨詢。這三名人類醫(yī)師是沒有接觸過CC-Cruiser的。
圖為CC-Cruiser與人類醫(yī)師的比較測試
研究者對CC-Cruiser的性能進行了5次測試,結果都非常出色。在和人類眼科醫(yī)師的50例圖像比較測試中, CC-Cruiser找出了所有先天性白內障患者。而三名眼科醫(yī)師在第3例圖片上都犯了錯誤——誤將圖片的高光區(qū)域診斷為先天性白內障。在危險評估和輔助決策中,CC-Cruiser表現(xiàn)也不錯,對所有需要進行手術的患者都給予了正確的治療建議。因此,研究者認為CC-Cruiser可以稱得上是一個“合格的眼科醫(yī)生”。
Atrerys成為首個FDA批準的深度學習臨床應用平臺
4D心臟MRI
2017年,GE健康聯(lián)手舊金山初創(chuàng)公司Arterys顛覆現(xiàn)有的心血管磁共振成像(俗稱心臟MRI),將3D的MRI引入新的時間維度,使其MRI擴展為4D,不僅能夠全方位地展示心臟結構,還能夠顯示血液流動的速度、方向以及流量。
與此同時,Arterys還推出了基于云計算和深度學習技術的Arterys Cardio DL應用,它是第一個獲得FDA批準的深度學習應用,此舉意味著深度學習和云技術將進一步落地在日常醫(yī)療服務。
Arterys Cardio DL可用于治療多種心血管疾病,包括先天性心臟病、主動脈或心臟瓣膜疾病等。它能夠自動采集心室的內外輪廓的數(shù)據(jù),并提供心室功能的準確計算,耗時短,精度高,一份圖像的分析10秒即可完成,遠遠快于臨床醫(yī)生。因此,稱之為基于深度學習的人工智能醫(yī)學影像分析系統(tǒng),它已經(jīng)進行了數(shù)以千計的心臟案例的數(shù)據(jù)驗證,實驗證實,該算法產(chǎn)生的結果與經(jīng)驗豐富的臨床醫(yī)生的分析結果結果是不相上下的。
作為GE健康的合作伙伴,Arterys Cardio DL的功能將整合在GE推出創(chuàng)新成像技術ViosWorks,它可以從7個維度呈現(xiàn)心臟:包括3個空間維度,1個時間維度,3個速度維度。
誠然,深度學習能夠幫助醫(yī)生更加高效、準確的“看片子”,但目前深度學習在醫(yī)療影像領域也存在許多阻礙和缺陷。
首先,就是數(shù)據(jù)量的問題。訓練深度學習需要優(yōu)質的數(shù)據(jù)和大量的數(shù)據(jù),斯坦福大學的研究者開發(fā)的算法之所以能夠如此準確地診斷皮膚癌,原因之一就在于他們使用的訓練數(shù)據(jù)集比此前公布的任何同類方法都要大100倍左右。林浩添和同事們因為所做的訓練圖集較小,有讀者質疑是否經(jīng)過擬合才獲得如此高的準確率。在數(shù)據(jù)量的缺乏是阻礙深度學習發(fā)展的一大障礙,醫(yī)療數(shù)據(jù)被分割在不同的醫(yī)院、部門里,難以發(fā)揮真正的力量。除此之外,數(shù)據(jù)的維度仍然是一大問題。目前,深度學習主要用于2D圖像、3D圖像、4D圖像難以應用。
其次,深度學習是一個“黑箱”,大多數(shù)研究者難以接觸到最底層的算法結構,只是將數(shù)據(jù)喂給深度學習,不可能也沒必要解釋“深度學習”到底怎樣做出判斷的。因此,這個“黑箱”存在欺騙的問題,也就是說在輸入的數(shù)據(jù)中加入小小的改變,就很容易誤導深度學習。
在上圖中,所有左列的圖經(jīng)過中間的變換成右列的圖。對我們人類來說,變換前后圖片幾乎沒有變化,判對左列圖片的深度學習模型卻將右列圖片都判錯了。這說明人類和深度學習模型之間的區(qū)別還有很多。
雖然目前深度學習仍處于“輔助診斷”的階段,真正的決定權仍然在醫(yī)生手中。但特斯拉的自動駕駛已出現(xiàn)致死事件,深度學習在醫(yī)療影像也難以達到100%的準確率。一旦醫(yī)生聽信了深度學習的建議,最終卻導致了誤診或漏診,真正應該負責的到底是醫(yī)生還是機器?深度學習給醫(yī)療領域帶來的,不僅是技術問題,還有人文關懷問題。醫(yī)生和患者之間的互動將是人類智慧的最后一個堡壘。
來源:奇點網(wǎng)