无码日韩人妻性色视频,日本最新免费黄色网站,黄色综合,日韩无套无码中文,www.a在线观看网站,www.www.av黄,美利坚无码av影院

關(guān)注我們
荊楚網(wǎng) > 最新播報(bào)

全球首個(gè)百億級可部署基因組基礎(chǔ)模型誕生

發(fā)布時(shí)間:2025年10月23日14:23 來源: 科技日報(bào)

科技日報(bào)北京10月23日電 (記者張佳星)23日,華大生命科學(xué)研究院與之江實(shí)驗(yàn)室聯(lián)合發(fā)布全球首個(gè)百億參數(shù)可部署的基因組通用基礎(chǔ)模型Genos。該模型支持多達(dá)百萬堿基對的超長上下文分析,并實(shí)現(xiàn)單堿基分辨率的精準(zhǔn)識別。

人類基因組由30億對堿基組成。“人類基因組計(jì)劃”破譯了序列,但序列上堿基的具體功能仍需要精準(zhǔn)識別和解析。

現(xiàn)有模型大多基于1—2個(gè)參考基因組開展訓(xùn)練,難以體現(xiàn)人類遺傳資源的多樣性。而Genos整合了人類泛基因組參考聯(lián)盟(HPRC)、人類基因組結(jié)構(gòu)變異圖譜計(jì)劃(HGSVC)等多個(gè)權(quán)威公開資源,首次將全球范圍內(nèi)636個(gè)“端粒到端?!奔墑e的高質(zhì)量人類基因組作為訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)覆蓋了全球不同人群,有助更全面理解人類遺傳多樣性。

算法架構(gòu)方面,Genos通過“混合專家”架構(gòu),精準(zhǔn)調(diào)度強(qiáng)相關(guān)“專家”算法協(xié)同處理,在匯總百億級龐大參數(shù)時(shí)成功降低推理成本和資源消耗,讓模型既強(qiáng)大、又好用。

測試結(jié)果顯示,Genos在直接面向臨床應(yīng)用的致病性突變解讀任務(wù)中,準(zhǔn)確率達(dá)92%;結(jié)合科學(xué)基礎(chǔ)模型后,準(zhǔn)確率高達(dá)98.3%。多項(xiàng)綜合評測結(jié)果也顯示,Genos超越現(xiàn)有最佳水平模型。

華大生命科學(xué)研究院相關(guān)負(fù)責(zé)人說,Genos模型已在HuggingFace(抱抱臉)、魔搭等平臺全面開源開放,提供12億和100億參數(shù)兩個(gè)版本,滿足不同需求。

【責(zé)任編輯:劉建維】