發(fā)布日期:2019-04-10
通過人工智能來預測壽命不再是神話了。這是來自諾丁漢大學科學家的研究所作出的結(jié)論。
相對于專家開發(fā)的標準預測方法,人工智能預測人類的過早死更加精確。這項研究近期發(fā)表在期刊《公共科學圖書館·綜合》(PLoS One)上。作者稱,未來,這些機器學習系統(tǒng)可以應用到患者的個性化醫(yī)療和風險管理的個人定制中來。
50萬人的研究
這是一項針對40歲至69歲年齡段50多萬人的研究,研究人員利用了英國生物樣本庫(UK Biobank)2006年至2010年間收集到的人員健康數(shù)據(jù),并追蹤到了2016年。
諾丁漢大學流行病學和數(shù)據(jù)科學助理教授 Stephen Weng 主持了這項研究,他多年來致力于提高計算機評估健康風險的準確性,此前的風險評估大都針對一種具體的疾病,而這次針對死亡的風險評估就要復雜得多,需要考慮可能影響其死亡風險的環(huán)境因素和個體因素。
他們使用了新的計算機風險預測模型,將人口統(tǒng)計因素、生物因素、臨床和生活方式納入了評估當中,甚至考慮了人們每天對水果、蔬菜和肉類的消耗。在將預測結(jié)果與來自國家統(tǒng)計局、英國癌癥登記以及醫(yī)院事件記錄數(shù)據(jù)比照后發(fā)現(xiàn),相較專家開發(fā)的標準預測方法,用人工智能的機器學習算法來預測死亡更加精確。
機器學習技術(shù)依賴于機器引導的算法,而非人工賦予的數(shù)據(jù),它從數(shù)據(jù)中自動分析獲得規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進行預測,比如人工神經(jīng)網(wǎng)絡可以確定最優(yōu)函數(shù),將預測結(jié)果和真實結(jié)果之間的結(jié)果最小化。該研究中采用了被稱作“隨機森林”和“深度學習”的機器學習技術(shù),研究者舍棄了傳統(tǒng)的基于年齡和性別的Cox回歸模型(比例風險回歸模型)。結(jié)果發(fā)現(xiàn),相較于不夠準確的簡單基于年齡和性別的Cox回歸模型,機器學習系統(tǒng)能夠分別提高9.4%和10.1%的精確率。
研究特色:樣本庫和變量選取
為什么選取英國生物樣本庫數(shù)據(jù)呢?英國生物銀行是一個大型的前瞻性人口群體,該庫通過問卷和護士問詢收集了50萬人的遺傳、身體和健康數(shù)據(jù),包括社會人口統(tǒng)計學、行為、營養(yǎng)、生活方式、藥物治療史和臨床病史,也包括志愿者的血液、唾液和尿液樣本,這些數(shù)據(jù)針對研究人員是開放的。這是一個獨有的研究過早死的機會,因為自2006年開始登記以來,研究對象中所有的死亡都低于英國人口的預期壽命。
在英國生物樣本庫數(shù)據(jù)502625人中,研究者累積隨訪3508454人年,有14418例死亡。隨訪期間死亡案例中,男性(60.7%)多于女性(39.3%),死者的平均年齡為61.3 歲,高于活著的平均年齡56.4歲。死者中白種人少見,更多是那些受教育程度低、慢性病史多、體檢結(jié)果差、生活方式不健康的人,當然貧困人口也更多。
死亡的主要原因是癌癥(65.7%),特別是消化器官的癌癥(19.2%)和呼吸器官的癌癥(12.7%)。第二常見的死亡原因是循環(huán)系統(tǒng)疾病,主要是冠心病和腦血管疾病。
研究者選取了15個變量,包括舒張壓和收縮壓、 BMI(身體質(zhì)量指數(shù))、 FEV1(一秒用力呼氣容積)、吸煙、鍛煉、年齡、性別、種族、教育水平、貧困水平以及癌癥、冠心病、2型糖尿病、慢性阻塞性肺疾病等四種慢性病。
通過 Cox模型與隨機森林、深度學習進行發(fā)現(xiàn),在預測死亡方面最重要的風險變量存在重疊。值得注意的是,三種方法都確定了15個變量中的6個,即年齡、癌癥的先前診斷、性別、吸煙、FEV1和教育水平。
種族和身體鍛煉被 Cox模型納入重要考量指標,而兩種機器學習未納入。隨機森林模型強調(diào)了腰圍、體脂百分比和健康飲食(蔬菜和水果消費),甚至還納入了膚色指標,而深度學習模型強調(diào)了酒精攝入、藥物處方以及住宅空氣污染與職業(yè)危險暴露等環(huán)境因素。
最終,深度學習算法提供了最準確的預測,正確識別了76%在研究期間死亡的受試者,隨機森林模型正確預測了約64%的過早死亡,而Cox模型僅確定了約44%。
這次研究是第一次采用機器學習技術(shù)進行死亡這類復雜因素的研究。不過作者承認,機器學習技術(shù)仍存在限制,比如黑盒子問題,也就是深度學習的決策過程不易解釋,人們只能看到數(shù)據(jù)輸入與決策輸出,但內(nèi)中詳情卻無從知曉。這會讓醫(yī)生、患者以及監(jiān)管部門心存顧慮。
來源:DeepTech深科技