Google DeepMind 發布 AlphaGenome:預測 DNA 功能的 AI 模型,延續 AlphaFold 諾貝爾獎榮耀
從蛋白質結構到 DNA 功能,DeepMind 的 Alpha 系列正在系統性地解碼生命科學的核心難題。AlphaGenome 的開源發布將加速基因組學研究、藥物發現和精準醫學的發展。
從蛋白質結構到 DNA 功能,DeepMind 的 Alpha 系列正在系統性地解碼生命科學的核心難題。AlphaGenome 的開源發布將加速基因組學研究、藥物發現和精準醫學的發展。
Google DeepMind 於 2026 年 2 月正式發布了 AlphaGenome——一個能夠預測 DNA 序列功能的 AI 模型。這是繼 AlphaFold 在 2024 年獲得諾貝爾化學獎之後,DeepMind 在生命科學 AI 領域的又一里程碑式成果。AlphaGenome 已經開源並免費提供給全球研究者使用,延續了 DeepMind 將基礎科學工具開放共享的傳統。這項突破有望徹底改變我們理解基因組的方式,並在藥物發現、遺傳疾病研究和農業基因組學等領域產生深遠影響。
要理解 AlphaGenome 的重要性,我們需要先回顧 DeepMind 的 Alpha 系列產品如何一步步改變科學研究的格局。2020 年,AlphaFold 在蛋白質結構預測領域取得了突破,解決了困擾生物學界長達 50 年的「蛋白質折疊問題」。2024 年,AlphaFold 的開發者 Demis Hassabis 和 John Jumper 因此獲得諾貝爾化學獎,這是 AI 在基礎科學研究中獲得最高榮譽的歷史性時刻。
此後,DeepMind 持續擴展其 Alpha 系列。2025 年,AlphaEvolve 將大語言模型 Gemini 與進化演算法結合,用於自動設計更優秀的演算法,已在數據中心能效優化和 TPU 晶片設計中取得實際應用。現在,AlphaGenome 則將 AI 的視角從蛋白質結構轉向了更為複雜的領域——DNA 序列的功能預測。
這三個系統構成了一個遞進式的科學研究工具鏈:AlphaFold 告訴我們蛋白質長什麼樣,AlphaGenome 告訴我們 DNA 如何指揮蛋白質的產生和調控,而 AlphaEvolve 則在更廣泛的演算法設計層面加速科學發現的過程。DeepMind 正在系統性地用 AI 攻克生命科學中最困難的問題。
外界可能會認為,既然 AlphaFold 已經解決了蛋白質結構預測問題,那麼 DNA 功能預測只是「下一個類似的問題」。事實遠非如此。DNA 功能預測在本質上比蛋白質結構預測要複雜得多,這也是 AlphaGenome 的發布令科學界如此興奮的原因。
蛋白質結構預測的核心問題是:給定一段氨基酸序列,預測它會折疊成什麼三維形狀。這個問題雖然困難,但至少有一個相對明確的目標——每個蛋白質在正常條件下通常只有一種穩定的折疊構型。
DNA 功能預測則截然不同。人類基因組中約有 30 億個鹼基對,但其中只有約 1.5% 編碼蛋白質。剩餘的 98.5% 曾被稱為「垃圾 DNA」(junk DNA),但現在我們知道,這些非編碼區域中包含了大量的調控元件——啟動子(promoter)、增強子(enhancer)、沉默子(silencer)和絕緣子(insulator)等,它們共同構成了一個極其複雜的基因調控網絡。
AlphaGenome 需要解決的核心問題包括:
這些問題的複雜性在於,DNA 的功能不是靜態的——同一段 DNA 在不同的細胞類型、不同的發育階段、甚至不同的環境條件下可能執行完全不同的功能。AlphaGenome 的突破在於,它能夠整合多層次的基因組數據,在這種動態複雜性中做出準確的功能預測。
雖然 DeepMind 尚未公布 AlphaGenome 的完整技術細節,但根據已發布的信息和相關論文,我們可以了解這個模型的核心技術架構和能力。
AlphaGenome 採用了一種多尺度、多模態的深度學習架構。與只處理蛋白質序列的 AlphaFold 不同,AlphaGenome 需要同時處理多種類型的基因組數據:DNA 序列本身、染色質可及性(chromatin accessibility)數據、轉錄因子結合位點資訊、表觀遺傳修飾圖譜,以及來自數千種人類細胞類型的基因表達數據。
該模型的一個關鍵創新是其處理超長序列的能力。人類基因組中的許多調控元件可以影響距離數十萬甚至數百萬鹼基對之外的基因——這種「遠距離調控」現象要求模型具有處理極長上下文的能力。AlphaGenome 通過結合局部注意力機制和全局壓縮表示,在保持計算效率的同時實現了對超長距離依賴關係的建模。
「AlphaFold 解答了蛋白質的形狀問題,而 AlphaGenome 要解答的是一個更根本的問題:DNA 如何決定生命的運作。這不僅是一個更大的問題,也是一個更複雜的問題,因為 DNA 的功能是高度動態和上下文依賴的。」——DeepMind 研究團隊
與 AlphaFold 一樣,AlphaGenome 的模型權重、訓練代碼和預測數據庫已經全部開源,免費提供給全球研究者使用。這一決定的影響是深遠的。回顧 AlphaFold 的經驗:自 2021 年開源以來,AlphaFold 蛋白質結構數據庫已被超過 200 萬名研究者使用,產生了數以萬計的引用,加速了從新冠病毒藥物靶點識別到塑料降解酶設計等眾多領域的研究。
AlphaGenome 的開源可能帶來同等甚至更大規模的影響。基因組學是一個全球性的研究領域,從大型基因組計畫到小型學術實驗室,所有研究者都需要能夠預測 DNA 功能的工具。此前,這類預測主要依賴昂貴的實驗方法(如 ENCODE 項目中使用的大規模功能基因組學實驗),或者準確率有限的統計方法。AlphaGenome 為全球研究者提供了一個強大且免費的替代方案。
值得注意的是,DeepMind 的開源策略也是其與 Google 母公司 Alphabet 的商業利益之間的一種平衡。通過開源基礎研究工具,DeepMind 建立了巨大的科學社區聲譽和影響力,同時也為 Google Cloud 的生命科學平台吸引了大量用戶——許多研究者選擇在 Google Cloud 上運行 AlphaFold 和 AlphaGenome 的大規模計算任務。
這一開源策略的背景也包括 Google 在 2026 年宣布的 1,850 億美元資本支出計畫。其中相當一部分用於 AI 基礎設施建設,包括數據中心、TPU 晶片和雲計算平台。DeepMind 的科學研究工具——從 AlphaFold 到 AlphaGenome——是這一龐大投資在科學研究領域的具體體現。
AlphaGenome 最直接的應用領域是藥物發現和遺傳疾病研究。目前,全球已知的遺傳疾病超過 7,000 種,但其中大多數沒有有效的治療方法。一個核心瓶頸是:許多遺傳疾病的致病突變位於基因組的非編碼區域,而我們對這些區域的功能理解極為有限。
以罕見遺傳疾病為例:全基因組定序(whole genome sequencing)已經可以以相對低廉的成本獲取患者的完整 DNA 序列,但在識別出的數百萬個遺傳變異中,確定哪一個或哪幾個是致病變異仍然是一個巨大的挑戰。AlphaGenome 能夠對每個變異的功能影響進行預測,從而大幅縮小候選致病變異的範圍,加速診斷過程。
在藥物發現領域,AlphaGenome 的影響同樣深遠。現代藥物開發越來越依賴對疾病遺傳基礎的理解——如果能準確識別導致疾病的基因調控異常,就能設計出精確靶向這些異常的藥物。例如,許多癌症是由增強子區域的突變導致原癌基因異常激活所引起的。AlphaGenome 能夠精確預測這些增強子突變的功能效果,為靶向藥物的設計提供關鍵信息。
DeepMind 近年來也在積極拓展其在生命科學領域的研究能力。除了 AlphaFold 和 AlphaGenome,DeepMind 的研究團隊已發表了數百篇高質量學術論文,涵蓋從組合優化(如近期的「Simplicity and Complexity in Combinatorial Optimization」)到混合神經認知模型等廣泛領域。這種跨學科的研究深度為 AlphaGenome 的開發提供了堅實的技術基礎。
AlphaGenome 的應用遠不止於人類醫學。農業基因組學是另一個可能受到深刻影響的領域。全球糧食安全面臨氣候變化、土地退化和人口增長的多重挑戰,而作物的遺傳改良是應對這些挑戰的關鍵策略之一。
傳統的作物育種主要依賴表型選擇——觀察植物的外在特徵來選擇優良品種。基因組學的發展使得「分子育種」成為可能,但要充分利用基因組信息,我們需要能夠準確預測 DNA 序列變化對作物性狀的影響。AlphaGenome 在跨物種分析方面的能力使其能夠擴展到植物基因組,為作物育種提供前所未有的精確性。
具體應用場景包括:預測特定基因變異對作物抗旱性、抗病性和產量的影響;識別控制重要農藝性狀的調控元件;以及加速從野生近緣種向栽培品種的有益基因轉移。這些應用有望顯著縮短新品種的育種周期,從傳統的 10-15 年縮短到 3-5 年。
此外,AlphaGenome 在環境科學和生物技術領域也有廣泛的潛在應用。例如,理解微生物基因組中的調控元件可以幫助設計更高效的工業微生物——用於生產可持續生物燃料、生物塑料和先進生物材料。在保育生物學中,AlphaGenome 可以幫助研究瀕危物種的遺傳多樣性和適應潛力,為保護策略提供科學依據。
AlphaGenome 的發布需要放在 DeepMind 和整個 AI 行業的更大背景下理解。2025 至 2026 年,DeepMind 進行了一系列重要的收購和戰略佈局:收購了 CSM(音訊 AI 公司)、Hume AI(情感 AI 公司)和 Sakana AI(由前 Google 研究員創立的日本 AI 實驗室)。這些收購擴展了 DeepMind 在多模態 AI 方面的能力,也為其科學研究工具提供了更豐富的技術儲備。
更重要的是,AlphaGenome 代表了「AI 加速科學」(AI-for-Science)這一大趨勢的持續深化。AlphaFold 的成功已經證明,深度學習可以在生命科學中實現變革性的突破。這一成功激勵了整個科學界和 AI 行業對 AI-for-Science 的投入。除了 DeepMind 之外,Meta 的 ESMFold(蛋白質結構預測)、Microsoft 的 BioGPT(生物醫學文本挖掘)、以及眾多創業公司都在這一領域積極佈局。
AI 加速科學的影響已經遠超生物學。在材料科學領域,AI 幫助發現了數以萬計的新材料候選物。在氣候科學中,AI 大幅提高了天氣預報和氣候模型的準確性。在數學領域,AlphaEvolve 等系統正在幫助解決長期未解的數學問題。AlphaGenome 是這一大趨勢中的最新里程碑,但絕不會是最後一個。
「我們正在見證科學研究方法的一次根本性轉變。過去五百年來,科學的核心方法是觀察、假設、實驗、驗證。AI 並沒有改變這個框架,但它正在以前所未有的速度和規模執行這個框架中的每一個步驟。AlphaGenome 就是這種加速的最新例證。」——一位資深基因組學研究者
AlphaGenome 的發布對香港的生物科技生態系統和科研機構有着多方面的重要啟示。香港近年來一直致力於發展成為國際生物科技中心,而 AI 驅動的基因組學研究正是這一戰略的核心組成部分。
首先,在臨床應用方面,香港擁有世界一流的醫療系統和豐富的臨床數據。香港的公立醫院系統每年服務數百萬名患者,積累了大量的基因組和臨床數據。AlphaGenome 為利用這些數據提供了強大的分析工具。例如,香港基因組中心(Hong Kong Genome Institute)正在推進的大規模基因組計畫可以直接受益於 AlphaGenome 的變異功能預測能力,加速罕見遺傳疾病的診斷和新治療方案的開發。
其次,香港的大學在基因組學和 AI 交叉領域已有堅實的研究基礎。香港大學、香港中文大學和香港科技大學的多個研究團隊在計算基因組學、生物信息學和 AI 藥物發現方面具有國際競爭力。AlphaGenome 的開源發布為這些團隊提供了新的研究工具和合作機會——他們可以基於 AlphaGenome 進行下游研究,也可以針對東亞人群的特有遺傳變異開發專門的分析流程。
第三,對香港的生物科技產業而言,AlphaGenome 創造了新的商業機會。香港科技園和數碼港已經孵化了多家 AI 生物科技初創企業。AlphaGenome 的開源可以降低這些企業的技術門檻,使它們能夠更快地將 AI 基因組學技術轉化為臨床產品和服務。特別是在精準醫學領域,結合 AlphaGenome 的預測能力和香港作為大灣區生物科技門戶的地理優勢,香港有機會在 AI 驅動的精準醫學服務方面佔據重要位置。
最後,香港的監管環境也需要及時跟進。隨着 AI 基因組學工具越來越多地進入臨床應用,確保這些工具的準確性、公平性和隱私保護將成為關鍵的監管議題。香港可以借鑒國際最佳實踐,制定前瞻性的 AI 醫療器械監管框架,既促進創新又保護公眾利益。
AlphaGenome 目前的能力主要是「解讀」——預測現有 DNA 序列的功能。但更令人興奮的可能性在於下一步:從解讀走向「編寫」。如果 AI 能夠準確預測 DNA 序列的功能,那麼理論上它也可以反向設計具有特定功能的 DNA 序列——這就是合成生物學的核心願景。
這一前景既令人振奮又令人警惕。從積極的角度看,AI 輔助的 DNA 設計可以用於開發新型基因治療、設計更高效的工業微生物、甚至創造全新的生物材料。但從風險的角度看,這種能力也可能被濫用,例如設計具有增強致病性的病原體。這凸顯了在 AI 生物科學領域建立強有力的安全框架和國際合作機制的緊迫性。
從更宏觀的角度看,AlphaGenome 代表了人類理解自身生物學的又一大步。如果說 Human Genome Project(人類基因組計畫,2003 年完成)為我們提供了基因組的「字母表」,那麼 ENCODE 項目為我們提供了部分的「語法」,而 AlphaGenome 則有望讓我們首次真正「閱讀」和「理解」基因組這本「生命之書」的大部分內容。
DeepMind 的 Alpha 系列——從 AlphaGo 到 AlphaFold,從 AlphaEvolve 到 AlphaGenome——展示了一條清晰的發展軌跡:AI 不再只是一種通用的數據處理工具,而是正在成為人類科學研究中不可或缺的夥伴。隨着更多的 Alpha 系列產品問世,我們有理由期待,AI 將在未來十年內幫助人類解開更多自然界的根本奧秘。