科技日報記者 張夢然
《細胞》雜志8日發(fā)表了一項新研究:西班牙基因組調(diào)控中心團隊利用生成式人工智能(AI),設(shè)計出一種合成DNA序列,可作為“基因開關(guān)”,控制哺乳動物特定細胞中的基因表達。這一進展堪稱合成生物學(xué)領(lǐng)域的一個里程碑。
這項技術(shù)可根據(jù)特定需求,從零開始“創(chuàng)作”自然界中不存在的DNA片段。團隊訓(xùn)練AI模型預(yù)測合適的DNA字母組合(A、T、C、G),以實現(xiàn)特定細胞類型中的基因表達模式。例如,可以讓干細胞開啟某個基因,從而發(fā)育成紅細胞而不是血小板。隨后,研究人員將這些約250個字母長度的DNA片段合成出來,并通過病毒載體導(dǎo)入細胞中。
為驗證其有效性,團隊讓AI設(shè)計激活熒光蛋白基因的DNA序列,并將其插入小鼠血細胞基因組的隨機位置。結(jié)果顯示,基因表達完全符合預(yù)期,證明AI設(shè)計的合成增強子功能正常。
在生物醫(yī)學(xué)領(lǐng)域,許多疾病源于特定細胞中基因表達異常,而傳統(tǒng)方法只能依賴自然界已有的DNA調(diào)控元件,如增強子進行干預(yù)。但增強子種類有限,難以滿足復(fù)雜的治療需求。
借助AI,科學(xué)家可以創(chuàng)造出“基因開關(guān)”。這些人工增強子能被精確設(shè)計成只在特定細胞中起作用的“開/關(guān)”模式,從而大幅減少對健康細胞的副作用。這種精準(zhǔn)調(diào)控對于開發(fā)新一代基因療法至關(guān)重要。
不過,要訓(xùn)練這樣的AI模型并不容易,與增強子相關(guān)的高質(zhì)量數(shù)據(jù)一直匱乏。為此,團隊在過去5年中開展了超過64000次實驗,構(gòu)建了迄今為止最大的血細胞合成增強子數(shù)據(jù)庫。他們測試了38種不同轉(zhuǎn)錄因子的結(jié)合位點排列和強度,并追蹤每種增強子在血細胞發(fā)育7個階段中的活性變化。
研究還發(fā)現(xiàn)了一些有趣的現(xiàn)象:雖然大多數(shù)增強子像“音量旋鈕”一樣調(diào)節(jié)基因活性,但也有一些組合表現(xiàn)出“負協(xié)同效應(yīng)”——即原本單獨促進基因表達的兩個因子,共同出現(xiàn)時反而抑制了基因活動。這種非線性關(guān)系為理解基因調(diào)控提供了新視角。
這一成果為未來個性化醫(yī)療和精準(zhǔn)基因治療打開了新的大門。