(資料圖片僅供參考)
北京時間5月2日凌晨,國際頂級學(xué)術(shù)期刊《Nature》正刊發(fā)表了百度與合作單位在生物計算領(lǐng)域的重磅突破性成果——《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》,提出mRNA序列優(yōu)化算法LinearDesign。
這是中國科技企業(yè)首次以第一完成單位的身份在《Nature》雜志發(fā)表論文。鑒于論文對生物醫(yī)學(xué)領(lǐng)域的重要性,Nature雜志在正式排版之前先將預(yù)覽版快車道上線 (accelerated article preview),這也是AI應(yīng)用于mRNA領(lǐng)域的首篇CNS主刊論文。
mRNA疫苗被公認(rèn)為是遏制COVID-19的可行工具, 但mRNA疫苗和藥物仍面臨一些挑戰(zhàn)。其中如何高效設(shè)計出穩(wěn)定、成藥性更好的mRNA序列,是mRNA療法研究領(lǐng)域的難點之一。
百度運用自然語言處理中網(wǎng)格解析(Lattice Parsing)技術(shù),對mRNA疫苗序列進(jìn)行優(yōu)化,提升疫苗穩(wěn)定性和有效性。LinearDesign算法巧妙地將序列設(shè)計的海量計算簡化為自然語言處理中的經(jīng)典問題,讓“大海撈針”變成了“按圖索驥”。
以新冠病毒Spike蛋白為例,若采用遍歷法尋找一條穩(wěn)定序列,需要查看10的632次方個mRNA序列。假如由一臺超級計算機每秒計算一個序列,那么從宇宙誕生到現(xiàn)在的138億年,連潛在mRNA序列的億萬分之一都無法計算完畢,而LinearDesign算法則能在短短11分鐘之內(nèi)找到最穩(wěn)定的候選序列。
實驗數(shù)據(jù)證明,LinearDesign算法設(shè)計序列將有助于生物醫(yī)藥公司快速研發(fā)更有效的mRNA疫苗,縮短研發(fā)周期,降低研發(fā)成本。這一算法的有效性已經(jīng)在新冠mRNA疫苗和帶狀皰疹mRNA疫苗兩種疫苗中得到驗證。與傳統(tǒng)基準(zhǔn)相比,百度的設(shè)計顯著改善了體外 mRNA 半衰期和蛋白質(zhì)表達(dá),使體內(nèi)抗體反應(yīng)增強了高達(dá) 128 倍。
計算 RNA 生物學(xué)家戴夫·莫格 (Dave Mauger) 則認(rèn)為,這種新方法“非常了不起”,他曾在美國Moderna 公司工作,一家 mRNA疫苗制造商。“計算效率確實令人印象深刻,而且比以往任何時候都更加復(fù)雜?!?/p>
截至目前,百度已打造完整的基于飛槳的生物計算平臺-螺旋槳PaddleHelix,涵蓋文心大模型-生物計算大模型,探索AI技術(shù)在小分子、蛋白/多肽、RNA等場景的應(yīng)用。其中生物計算等大模型屬于百度文心大模型家族中的一員。
據(jù)了解,百度文心大模型形成了系統(tǒng)性的大模型技術(shù)體系,包括自然語言處理、視覺、跨模態(tài)、生物計算等,最近火爆的文心一言就是百度自主研發(fā)的知識增強大語言模型。文心一言通過百度智能云對外提供服務(wù),為企業(yè)構(gòu)建自己的模型和應(yīng)用,未來醫(yī)療、工業(yè)、金融等重點領(lǐng)域效率將會大幅提升,快速形成新產(chǎn)業(yè)(300832)空間。
標(biāo)簽:
熱門