日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

GNN for Science: 騰訊AI Lab、清華共同發文綜述等變圖神經網絡

來源: 責編: 時間:2023-08-07 16:30:05 229觀看
導讀 近年來,越來越多的人工智能方法在解決傳統自然科學等問題上大放異彩, 在一些重要的學科問題(例如蛋白質結構預測)上取得了令人矚目的進展。在物理領域的研究中,非常多的物理問題

近年來,越來越多的人工智能方法在解決傳統自然科學等問題上大放異彩, 在一些重要的學科問題(例如蛋白質結構預測)上取得了令人矚目的進展。在物理領域的研究中,非常多的物理問題都會涉及建模物體的的一些幾何特征,例如空間位置,速度,加速度等。這種特征往往可以使用幾何圖這一形式來表示。不同于一般的圖數據,幾何圖一個非常重要的特征是額外包含旋轉,平移,翻轉對稱性。這些對稱性往往反應了某些物理問題的本質。因此,最近以來,大量工作利用了幾何圖中的對稱性,基于經典圖神網絡設計了很多具有等變性質的模型去解決對幾何圖建模問題。盡管在這一領域,等變圖神經網絡模型取得了長足的發展,但是還缺乏一個系統性的對這一領域的調研。為此,騰訊 AI Lab, 清華 AIR & 計算機系在綜述:《Geometrically Equivariant Graph Neural Networks: A Survey》中,對等變圖神經網絡的結構和相關任務進行了一個系統梳理。opz28資訊網——每日最新資訊28at.com

opz28資訊網——每日最新資訊28at.com

綜述論文鏈接:https://arxiv.org/abs/2202.07230opz28資訊網——每日最新資訊28at.com

在物理和化學領域,很多問題需要去處理帶有幾何特征的圖。例如,化學小分子和蛋白質都可以建模成一個有原子和其化學鍵關系組成的幾何圖。在這個圖中,除了包含原子的一些內在特征以外,我們還需要考慮到每個原子在空間的三維坐標這一幾何特征。而在物理學的多體問題中,每個粒子的幾何特征則包括坐標,速度,旋轉等。不同于一般特征,這些幾何特征往往都具備著一些對稱性和等變性。正因為如此,基于對對稱性的建模,大量基于圖神經網絡的改進模型在近年來被提出。這一類模型,因為克服了傳統圖神經網絡無法很好處理這類具有等變對稱性質的特征的缺點,被統稱為等變圖神經網絡。opz28資訊網——每日最新資訊28at.com

在這篇綜述里面,我們系統性的梳理了近年等變圖神經網絡的發展脈絡,并且提供了一個簡潔的視角幫助讀者能夠很快的理解這類網絡的內涵。基于消息傳播和聚合函數的不同,我們將現有的等變圖神經網絡分為三類。與此同時,我們還詳盡闡釋了當前的挑戰和未來的可能方向。opz28資訊網——每日最新資訊28at.com

等變圖神經網絡基礎框架在實際應用中,我們需要處理的圖不僅包含拓撲連接和節點特征,同時也會包含一些幾何特征。在使用圖神經網絡處理這些數據的時候,不同的特征需要滿足不同的性質。例如,在預測分子的能量時,我們需要這個預測對于輸入的幾何特征是不變的,而在分子動力學應用中,我們則需要預測的結果和輸入的幾何特征是等變的。為了達到這樣的目的,我們提出了一個等變圖神經網絡的通用框架:opz28資訊網——每日最新資訊28at.com

opz28資訊網——每日最新資訊28at.com

在這個框架中,代表輸入圖的幾何特征,而h_i,h_j 代表非幾何特征。分別代表在邊(x,j)上的幾何和非幾何的消息。分別是針對幾何和非幾何消息的聚合函數。除此以外, 針對非幾何信息的消息函數是對于輸入來說 G - 不變的。而針對幾何信息的消息函數則是對于輸入來說 G - 等變的。下圖展示了這一通用框架的操作:opz28資訊網——每日最新資訊28at.com

opz28資訊網——每日最新資訊28at.com

基于以上的通用框架,我們在下表總結了當前主流的等變圖神經網絡模型。與此同時,基于消息表示的類別不同,我們將現有的等變圖神經網絡模型分為三大類:不可約表示(Irreducible Representation),正則表示(Regular Representation) 和標量化(Scalarization ).opz28資訊網——每日最新資訊28at.com

基于不可約表示信息的模型這類模型基于表示論中關于緊群的線性表示可以拆解為一系列的不可約表示的直積這一理論。從而在 SE(3) 群中構建滿足等變性質的消息模型。例如,在 TFN 中:opz28資訊網——每日最新資訊28at.com

opz28資訊網——每日最新資訊28at.com

TFN 層利用 Clebsch-Gordan 系數的性質構造了一個對于任意旋轉參數,對于任意屬于 SO(3)的旋轉操作都等變。有大量的工作基于 TFN 結構做了相應的擴展,例如加入 Attention 機制, 引入非線性的 Clebsch-Gordan 系數等。但是這類方法計算復雜度都較高,且不可約表示僅僅適用于特定的群。這約束了這類模型的表達能力。opz28資訊網——每日最新資訊28at.com

基于正則表示信息的模型另一類的工作嘗試利用群的正則表示來構造群卷積操作。這里的代表性工作李卷積(LieConv)通過 Lifting 操作將輸入映射到群中的元素,然后利用 PointConv 完成群卷積的離散化計算。在我們的符號約定下,李卷積可以表示為:opz28資訊網——每日最新資訊28at.com

opz28資訊網——每日最新資訊28at.com

其中在群中的映射元素,log 將群元映射到對應的李代數,是一個 MLP。通過這種構造,李卷積中對于h_i的更新實現了對于任意李群以及其離散子群的不變性。LieTransformer 基于此思想,引入了自注意力機制來進一步提高模型的性能。基于李群正則表示的模型在群的選取上更加靈活,但是由于要進行離散化和采樣,需要在效率和性能之間做出權衡。同時,以上的更新只考慮了標量信息 h,但難以直接推廣到對幾何信息 x 的更新,除非綜合哈密頓網絡等工作中的更新方法。opz28資訊網——每日最新資訊28at.com

標量化去基于群表示論的途徑外,很多工作采用了一種基于標量化的建模等變性質的方法。這類標量化的方法先將幾何特征轉化為一些不變的標量,然后利用 MLP 等網絡結構來得到一個標量變化,最后將這個變化加回到原有的幾何特征上從而得到等變性。這種標量化的方法最早是由 SchNet 和 DimNet 提出,不過僅僅考慮了模型不變的部分。SphereNet 在之前工作的基礎上進一步考慮了在消息傳播網絡上扭轉角的變化。EGNN 作為在標量化里面一個重要的工作,提出了一個非常靈活的框架:opz28資訊網——每日最新資訊28at.com

opz28資訊網——每日最新資訊28at.com

其中,是對幾何特征的標量化,函數為不同的 MLP,通過將幾何信息和非幾何信息消息進行關聯, EGNN 可以同時保證非幾何特征和幾何特征傳播過程中的等變性。這個構造結合了物理知識,可以看成是對兩個粒子的庫倫力 / 重力的計算的建模。在 EGNN 基礎上,GMN 擴展了模型可以描述的幾何特征維度,在建模坐標信息的同時也可以同時引入更多的幾何信息(如速度、加速度、角速度等)并保證等變性。GemNet 則在 DimeNet 基礎上通過這一通用的表示將一些更豐富的幾何特征,例如二面角等,結合到消息傳播的過程中。此外,還存在一類標量化的方法,其基于不變的標量和等變的向量的乘積仍然是等變的向量這一觀察來構造等變的消息傳播。例如, PaiNN 和 Equivariant Transformer 在不變的 SchNet 上通過徑向基函數建模原子的距離將等變的性質擴展到 SchNet 上。 opz28資訊網——每日最新資訊28at.com

以下是對等變圖神經網絡模型的一個總結梳理:opz28資訊網——每日最新資訊28at.com

opz28資訊網——每日最新資訊28at.com

等變圖神經網絡應用因為可以更好的建模幾何信息,等變圖神經網絡在從物理系統到化學物質的各種類型的現實世界幾何數據中具有廣泛的應用。這篇綜述簡單介紹其在物理系統,分子數據和點云數據上的應用。下表總結了現有的等變神經網絡的應用方向和數據集:opz28資訊網——每日最新資訊28at.com

opz28資訊網——每日最新資訊28at.com

對復雜物理系統的建模長期以來,對復雜物理系統的動力學進行建模一直是一個具有挑戰性的話題。在物理系統中,有像帶電粒子這樣的物體,它們通過基于物理定律的力進行相互作用產生運動軌跡。在 NRI 這篇工作中最早引入 n-body 模擬的問題。n-body 中系統包含多個帶電粒子,這些粒子由相互之間的庫倫力驅動。n-body 問題的目標是給定系統的初始條件(坐標,速度和電荷量)的情況下預測這些粒子的動力學軌跡。這一任務是 E(3)等變的。SE(3)-Transformer 和 EGNN 都展示了等變圖神經網絡在這個任務上的潛力。GMN 中進一步提出了一個更有挑戰性的問題 -- 帶約束的 n-body 問題,即如何在粒子之間有約束,例如連桿或者鉸鏈的情況下對粒子運動軌跡做出有效的預測。除了微觀方向的數據外,NRI 和 GMN 也采用了人體運動捕捉的宏觀數據驗證了模型的有效性。 opz28資訊網——每日最新資訊28at.com

對分子的建模等變圖神經網絡另一個重要的應用方向是對分子數據的建模。在分子數據中,原子的相互作用是有一系列復雜的化學物理機制所決定的。對于典型的分子數據,原子非幾何特征往往包含原子本身的一些特征,而幾何特征則是原子的空間坐標,速度等。原子之間的邊則由化學鍵或者根據實際距離做截斷來構造。經典的在分子上的應用包括,分子預測和分子生成。 分子預測:具體來說,分子預測包含對分子的屬性和結構的一些預測任務。在分子預測這一領域,包含以下經典數據集。在小分子方面:QM9 是一個包含 12 個量子特征預測任務的經典小分子數據集。M17 則是一個在 8 個小分子上得到的動態軌跡的數據集,其中還包含了對應狀態的能量和相互力作用等信息。ISO17 則是一個類似的分子動態軌跡數據集,其包含了 129 個同分異構體的軌跡信息。The Open Catalyst 2020 (OC20) 則包含了催化劑和底物的催化過程的狀態信息,其目標是給定初始狀態預測目標結構和對應狀態的能量。在大分子方面:MDAnalysis 是一個較為完備的關于蛋白質級別的分子動力學模擬的數據。Atom3D 是一個綜合數據集,包含 8 個具有幾何信息的分子預測任務,范圍從小分子到 RNA 和蛋白質。分子生成:在分子生成領域,等變圖神經網絡往往用于和分子構象相關的生成。ConfGF 和 DSGM 基于旋轉 - 平移不變 GNN 來參數化打分函數并且構造了基于打分的構象生成模型。GeoDiff 則借助去噪擴散概率模型 (Denoising Diffusion Probabilistic Model) 并且基于具有等變保證的 GNN 來構造模型。等變流(Equivariant Flow)驗證了基于等變核的標準化流(Normalizing Flow)的可行性。 opz28資訊網——每日最新資訊28at.com

對于點云的建模點云是對象的一種表示格式,它通過一組分配有坐標的點來描述形狀。在對點云建模這一領域,包含一些經典的數據和任務。ModelNet40 和 ScanObjectNN 是兩個經典的點云數據集,其任務是做物品分類。因為在點云數據里面不存在顯式的點和點的鏈接,在等變圖神經網絡建模點云的時候,往往會以一個距離 d 作為閾值來構造點和點之間的邊。TFN 和 SE(3)-Transformer 都在點云數據取得了相對于傳統方法具有競爭力的性能。  未來展望 在對現有等變圖神經網絡的方法和應用進行了系統性總結后。本綜述也對這一領域未來潛在發展方向進行了一些討論:理論的完備性:不同于經典圖神經網絡,等變神經網絡還缺乏一系列的關于表達能力和泛化性的理論分析框架。現有的一些工作主要集中在討論消息傳播機制中存在的通用表達。但是對于模型的整體性質依然不夠清晰。如何構造一個完備的理論框架以指導模型的設計是未來十分有趣的方向。opz28資訊網——每日最新資訊28at.com

大規模等變圖神經網絡,在前面已經提到,基于群表示理論的方法都具有計算復雜度太高這一缺點,這限制了等變圖神經網絡在大規模數據上的應用。尤其是在結合一些更復雜的結構,例注意力機制的時候,這一問題會更加嚴重。如何有效的精簡現有模型并且加速計算,使得現有的等變圖神經網絡可以適用于大規模數據,是一個重要方向。opz28資訊網——每日最新資訊28at.com

對多層次結構的建模:許多現實世界的系統都表現出復雜層次結構。例如,有機分子由多個官能團組成,蛋白質由氨基酸組成。通過利用這些結構,我們可以設計出對多粒度多層次結構的系統進行建模。與現有的只有單層結構的消息傳遞范式相比。這種層次結構的等變模型可能可以更好的刻畫這種層次結構信息,提高模型的性能和泛化性。opz28資訊網——每日最新資訊28at.com

新的應用和數據:現有的等變圖神經網絡模型大多數只是在規模和復雜性優先的系統上進行性能評估,例如模擬的 N-body 系統和小分子 MD 數據。未來,我們需要在一些更具有挑戰性的任務上評估等變圖神經網絡的有效性,這些挑戰包括:更多數量的對象,更復雜的交互,更多樣化的約束等等。近期以來,在蛋白質建模上的工作是一些有益的嘗試。但是由于數據收集的困難和數據質量的限制,尚未有一個全面的可以評估各種方法的數據集出現。在未來如何將等變神經網絡擴展到更多,更復雜的領域,去解決現實問題是一個很有意義的方向。opz28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2239-0.htmlGNN for Science: 騰訊AI Lab、清華共同發文綜述等變圖神經網絡

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 韓國計劃未來3年向AI數據及網絡投資20萬億韓元 并給予其他支持

下一篇: 云計算開發:Python3-List reverse()方法詳解

標簽:
  • 熱門焦點
  • Find N3入網:最高支持16+1TB

    OPPO將于近期登場的Find N3折疊屏目前已經正式入網,型號為PHN110。本次Find N3在外觀方面相比前兩代有很大的變化,不再是小號的橫向折疊屏,而是跟別的廠商一樣采用了較為常見的
  • K60 Pro官方停產 第三方瞬間漲價

    雖然沒有官方宣布,但Redmi的一些高管也已經透露了,Redmi K60 Pro已經停產且不會補貨,這一切都是為了即將到來的K60 Ultra鋪路,屬于廠家的正常操作。但有意思的是該機在停產之后
  • SpringBoot中使用Cache提升接口性能詳解

    環境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架從 3.1 開始,對 Spring 應用程序提供了透明式添加緩存的支持。和事務支持一樣,抽象緩存允許一致地使用各
  • 如何使用JavaScript創建一只圖像放大鏡?

    譯者 | 布加迪審校 | 重樓如果您曾經瀏覽過購物網站,可能遇到過圖像放大功能。它可以讓您放大圖像的特定區域,以便瀏覽。結合這個小小的重要功能可以大大改善您網站的用戶體驗
  • 深度探索 Elasticsearch 8.X:function_score 參數解讀與實戰案例分析

    在 Elasticsearch 中,function_score 可以讓我們在查詢的同時對搜索結果進行自定義評分。function_score 提供了一系列的參數和函數讓我們可以根據需求靈活地進行設置。近期
  • 每天一道面試題-CPU偽共享

    前言:了不起:又到了每天一到面試題的時候了!學弟,最近學習的怎么樣啊 了不起學弟:最近學習的還不錯,每天都在學習,每天都在進步! 了不起:那你最近學習的什么呢? 了不起學弟:最近在學習C
  • 騰訊VS網易,最卷游戲暑期檔,誰能笑到最后?

    作者:無銹缽來源:財經無忌7月16日晚,上海1862時尚藝術中心。伴隨著幻象的精準命中,碩大的熒幕之上,比分被定格在了14:12,被寄予厚望的EDG戰隊以絕對的優勢戰勝了BLG戰隊,拿下了總決
  • 認真聊聊東方甄選:如何告別低垂的果實

    來源:山核桃作者:財經無忌爆火一年后,俞敏洪和他的東方甄選依舊是頗受外界關心的“網紅”。7月5日至9日,為期5天的東方甄選“甘肅行”首次在自有App內直播,
  • 到手價3099元起!iQOO Neo8 Pro今日首銷:安卓性能最強旗艦

    5月23日,iQOO如期舉行了新品發布會,全新的iQOO Neo8系列也正式與大家見面,包含iQOO Neo8和iQOO Neo8 Pro兩個版本,其中標準版搭載高通驍龍8+,而Pro版更
Top 主站蜘蛛池模板: 章丘市| 青州市| 绵阳市| 桂林市| 大名县| 陵水| 永年县| 青神县| 新丰县| 广东省| 济南市| 贵州省| 祁阳县| 文水县| 石棉县| 乌审旗| 青川县| 临洮县| 白沙| 望奎县| 中牟县| 香格里拉县| 微山县| 枣阳市| 宜宾市| 岳池县| 阳朔县| 乾安县| 太原市| 卓资县| 彰化市| 油尖旺区| 察雅县| 屏山县| 平湖市| 玉田县| 威海市| 和平区| 潮州市| 扶沟县| 泉州市|