中共中央宣傳部委托新華通訊社主辦

蛋白質生成大模型NewOrigin亮相WAIC 許錦波:將滿足蛋白生成全流程需求

2023-07-08 09:41
來源:新華網

7月7日,在2023世界人工智能大會(WAIC)上,首個AI蛋白質生成大模型“NewOrigin”(中文名為“達爾文”)正式亮相。NewOrigin大模型的研發(fā)領軍人許錦波教授表示,AI蛋白質生成大模型瞄準創(chuàng)新藥設計、合成生物學等真實產業(yè)應用需求,將用一個模型滿足蛋白質生成全流程需求,未來大分子藥、新生物材料等蛋白質設計可實現“一鍵定制”。

據介紹,NewOrigin大模型通過學習千億級多模態(tài)大數據,可實現多模態(tài)定向生成,單模型就能滿足序列生成、結構預測、功能預測、從頭設計等蛋白質生成全流程需求,解決產業(yè)應用所需的特定功能蛋白質生成難題,并在真實的產業(yè)環(huán)境中評估效果與價值。

“大模型的出現將大大加速蛋白質生成技術的發(fā)展進程,并推動其在生物醫(yī)藥、合成生物學等領域應用,進而改變生物經濟的格局。”許錦波在演講中表示。當下自然語言大模型的表現,讓各界對大模型機制信心倍增。但在蛋白質生成等專業(yè)垂直領域,通用的自然語言大模型能力十分有限。究其原因,生物領域的復雜數據、專業(yè)知識與應用場景,都與自然語言交互的通用場景相差甚遠,能力要求也更高。

因此,研發(fā)蛋白質生成大模型,除了必備的算法、算力、數據等基礎條件,還需要具備兩大專業(yè)進階能力:一是融合計算機、生物、物理等多學科,熟識AI、分子動力學、量子計算等多種方法,且能在實踐中并行考慮序列與結構、主鏈與側鏈、進化與組學的跨領域融合能力;二是走出實驗室,下沉至真實的產業(yè)環(huán)境,在需求、驗證、落地上貼近真實產業(yè)需求的能力?!熬邆溥@些能力和條件的團隊非常稀缺”,許錦波認為。

許錦波團隊從2019年開始使用預訓練機制研發(fā)蛋白質設計算法,通過整合結構預測、側鏈預測、蛋白-蛋白對接等多種技術,結合多種場景需求,目前已在改造或從頭設計蛋白質上取得了重要的突破。

分子之心使用AI從頭設計的熒光蛋白

在此基礎上,分子之心開發(fā)了融合自然語言和蛋白語言的AI蛋白質生成大模型NewOrigin,它具備5重優(yōu)勢:可以根據特定需求定制化生成蛋白質,比如針對某個靶點生成抗體,或針對某個底物生成特異性的酶等,實現“按需定制”;基于數千億多模態(tài)數據,NewOrigin可以進行多模態(tài)的輸入、輸出,比如生成具備某種特定功能的蛋白質序列,或生成某個蛋白質的三維結構信息等,滿足不同層次的應用所需;同時,為了評估生成效果,NewOrigin融合AI、分子動力學、量子計算等多種方法,形成多維反饋機制,來實現快速驗證和迭代。為了降低交互門檻,NewOrigin使用了融合自然語言交互的蛋白質生成模式,以滿足廣大不具備AI技術背景的生物學家的應用需求。更重要的是,NewOrigin大模型是真正面向產業(yè)需求的AI蛋白大模型,可基于工業(yè)級的應用反饋持續(xù)迭代,解決真實的產業(yè)需求。

為了更好的滿足應用所需,分子之心將在一站式蛋白質預測、優(yōu)化、設計平臺“MoleculeOS”中集成NewOrigin大模型能力,并以NewOrigin為底層基礎,面向藥物設計、合成生物學等應用場景打造產業(yè)級的解決方案,進一步將NewOrigin大模型的能力在藥物設計、生物育種、環(huán)境保護、高性能材料等多個領域廣泛落地,驅動多領域創(chuàng)新。

許錦波表示,AI和生物科技是當下全球科技競爭的重要戰(zhàn)略領域,蛋白質技術作為生物科技的底層技術,與AI融合創(chuàng)新是必由之路。AI蛋白質生成大模型的開發(fā)只是起點,更具價值的是將其真正應用于產業(yè)中,實現可編程、可預測的創(chuàng)新藥設計和生物制品開發(fā),通過底層技術突破驅動生物經濟變革。

責任編輯:孔德明

熱門推薦

精品系列人妻无码,国产综合欧美另类一区二区,国产成人愉拍免费视频,最新看片国产精品