“我們只能像生物學家一樣說明自閉癥等疾病是由什么引起的。在某個方面,一個科學家可以提出10個問題,而同樣在這個方面,機器卻有能力提出一萬億個問題,這就是改變傳統(tǒng)規(guī)則的創(chuàng)新。”(視覺中國/圖)
(本文首發(fā)于2017年8月31日《南方周末》)
人工智能工具正在幫助揭示自閉癥的遺傳因素。
對于遺傳學家來說,攻克自閉癥是一個嚴峻的挑戰(zhàn),而遺傳模式表明其中具有很強的遺傳成分。但是,在自閉癥中發(fā)揮一定作用的數(shù)十種已知基因的變體只能解釋所有病例的大約20%。要想找到可能有助于形成自閉癥的其他變體,就需要在25,000個其他人類基因及其周圍DNA的相關(guān)數(shù)據(jù)中尋找線索——這是調(diào)查人員難以招架的任務。因此,普林斯頓大學的計算生物學家奧爾加·特洛伊安斯卡亞(Olga Troyanskaya)和紐約市西蒙斯基金會得到了人工智能工具的幫助。
紐約基因組中心創(chuàng)始人、主任兼洛克菲勒大學醫(yī)學科學家羅伯特·達內(nèi)爾(Robert Darnell)解釋說:“我們只能像生物學家一樣說明自閉癥等疾病是由什么引起的。在某個方面,一個科學家可以提出10個問題,而同樣在這個方面,機器卻有能力提出一萬億個問題,這就是改變傳統(tǒng)規(guī)則的創(chuàng)新。”
特洛伊安斯卡亞將數(shù)百個數(shù)據(jù)集結(jié)合在一起,其中有的數(shù)據(jù)集關(guān)乎哪些基因在特定的人類細胞中表現(xiàn)出活性,有的關(guān)乎蛋白質(zhì)是如何發(fā)生相互作用的,有的關(guān)乎轉(zhuǎn)錄因子結(jié)合位點和其他關(guān)鍵的基因組特征位于何處。然后,特洛伊安斯卡亞及其研究小組利用機器學習創(chuàng)建了一份基因相互作用圖,將已經(jīng)熟知的少數(shù)自閉癥風險基因的相互作用跟數(shù)千個其他未知基因的相互作用進行對比,尋找其中的類似之處。2016年,他們在《自然-神經(jīng)科學》雜志上報道說:對比表明,另外2500個基因可能跟自閉癥有關(guān)。