當前位置：首頁 > 元宇宙 > AI

谷歌 AI 推出 CardBench 評估框架：含 20 個真實數據庫，更全面評估基數估計模型

來源：責編：時間：2024-09-05 16:20:27 118觀看

導讀 9 月 3 日消息，谷歌 AI 研究人員最新推出了 CardBench 基準，主要為學習型基數估計（cardinality estimation）滿足系統評估框架需求。CardBench 基準是個綜合評估框架，包含 20 個不同真實數據庫中的數千次查詢，大大超

9 月 3 日消息，谷歌 AI 研究人員最新推出了 CardBench 基準，主要為學習型基數估計（cardinality estimation）滿足系統評估框架需求。

CardBench 基準是個綜合評估框架，包含 20 個不同真實數據庫中的數千次查詢，大大超過了以往的任何基準。

項目背景

基數估計（cardinality estimation，簡稱 CE）是優化關系數據庫查詢性能的關鍵，涉及預測數據庫查詢將返回的中間結果數量，直接影響查詢優化器對執行計劃的選擇。

對于選擇高效的連接順序、決定是否使用索引以及選擇最佳連接方法來說，準確的卡入度估計至關重要。

這些決策會對查詢執行時間和數據庫整體性能產生重大影響。不準確的估計會導致糟糕的執行計劃，從而大大降低性能，有時甚至會降低幾個數量級。

現代數據庫系統中廣泛使用的基數估計技術，依賴于啟發式（Heuristic）方法和簡化模型，例如假設數據統一和列獨立。

這些方法雖然計算效率高，但往往需要準確預測基數，在涉及多個表和過濾器的復雜查詢中表現尤為明顯。

最新的數據驅動方法試圖在不執行查詢的情況下，對表內和表間的數據分布進行建模，從而減少了一些開銷，但在數據發生變化時仍需要重新訓練。

盡管取得了這些進步，但由于缺乏全面的基準，因此很難對不同的模型進行比較，也很難評估它們在不同數據集上的通用性。

CardBench

CardBench 能在各種條件下對學習到的基數模型進行更全面的評估。該基準支持三種關鍵設置：

基于實例的模型，即在單個數據集上進行訓練；

零點模型，即在多個數據集上進行預訓練，然后在一個未見數據集上進行測試；

微調模型，即進行預訓練，然后使用目標數據集的少量數據進行微調。

該基準測試提供兩組訓練數據：一組用于具有多個篩選條件謂詞的單個表查詢，另一組用于涉及兩個表的二進制聯接查詢。

該基準測試包括 9125 個單表查詢和 8454 個二進制連接查詢，適用于其中一個較小的數據集，從而確保為模型評估提供強大且具有挑戰性的環境。

例如，微調圖神經網絡（GNN）模型在二進制連接查詢中的 q-error 中位數為 1.32，第 95 百分位數為 120，明顯優于零點模型。結果表明，即使是 500 次查詢，對預訓練模型進行微調也能大幅提高其性能。這使它們在訓練數據有限的實際應用中變得可行。

總之，CardBench 代表了在學習的基數估計方面的重大進步。研究人員可以通過提供全面、多樣的基準，系統地評估和比較不同的 CE 模型，從而促進這一關鍵領域的進一步創新。該基準能夠支持需要較少數據和訓練時間的微調模型，為訓練新模型成本過高的實際應用提供了切實可行的解決方案。

附上參考地址

CardBench: A Benchmark for Learned Cardinality Estimation in Relational Databases

Google AI Introduces CardBench: A Comprehensive Benchmark Featuring Over 20 Real-World Databases and Thousands of Queries to Revolutionize Learned Cardinality Estimation

本文鏈接：http://www.www897cc.com/showinfo-45-6704-0.html谷歌 AI 推出 CardBench 評估框架：含 20 個真實數據庫，更全面評估基數估計模型

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：阿里云通義千問 Qwen2-VL 第二代視覺語言模型開源

下一篇： Meta 公布 Llama AI 模型家族下載量數據：全球超 3.5 億、3.1-405B 模型最受歡迎

標簽：

熱門焦點

元宇宙終究沒火過兩年

來源：傳播體操在ChatGPT快速破圈的同時，元宇宙的熱度卻一瀉千里。雖然互聯網大廠們都沒有否認元宇宙的長期想象力，但在行動上卻都紛紛表示了對元宇宙短期前景的悲觀。號稱改變
元宇宙步入暗夜

撰文 | 文燁豪元宇宙的故事，似乎講不通了。當下，刮起元宇宙熱潮的Roblox股價已跌去大半，帶頭大哥Meta也正因元宇宙虧損深陷泥潭。再看國內，從字節“派對島&
在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

撰文/ 蔥鮪魚本屆世界杯可能不是最精彩的一屆，卻絕對是看點十足的一屆：后疫情時代的首屆世界杯、耗資2200億美元打造的“史上最貴”世界杯、足壇黃金
一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

當數字人成為一種生意，我們更關心的是，他們如何賺到錢，以及這意味著什么？01#“柳夜熙”爆火之后不知道大家還記不記得，去年10月31日萬圣節，有一位虛擬美妝
游戲玩家才是最“元宇宙”的

01元宇宙的概念，最早由科幻作家尼爾·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一個脫胎于現實世界，又與現實世界平行、相互影響，并且始終在線的虛擬世
超跑與NFT的首次結合，蘭博基尼能否破局？

蘭博基尼公司近日稱即將推出它的首款NFT，并且將加速進軍區塊鏈領域。這家聞名遐邇的意大利汽車廠商野心勃勃地將目光投向混合動力和電動跑車，并宣布將拍賣與瑞士
2022年的Web3：定義概念并開創新范式

Web3 是關于加密和區塊鏈應該如何使用的概念，因為它是加密圈的一個離散子領域。社區機會將呈指數級增長，擴大這些子行業的人口統計范圍。追求 Web3 項目的組織仍
a16z：元宇宙辦公會取代實體辦公室嗎？

6位不同的專家對未來的工作發表看法----元宇宙--沉浸式的、基于區塊鏈的虛擬世界，大多數日常活動最終會在這里發生--但仍然只是一個概念。但它是一個擁有寶貴不
美國單曲排行榜Billboard和World of Women合作推出NFT雜志封面

今天，Billboard宣布與流行的NFT頭像集World of Women（WoW）建立新的伙伴關系，向NFT生態系統又邁進了一步。在這次合作中，WoW的創建者Yam Karkai將幫助這個音樂行業巨

猜你喜歡

SQL Error: select * from ***_ecms_news13 where id in(26,124,80,23,118,) limit 6

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

谷歌 AI 推出 CardBench 評估框架：含 20 個真實數據庫，更全面評估基數估計模型

元宇宙終究沒火過兩年

元宇宙步入暗夜

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

游戲玩家才是最“元宇宙”的

超跑與NFT的首次結合，蘭博基尼能否破局？

2022年的Web3：定義概念并開創新范式

a16z：元宇宙辦公會取代實體辦公室嗎？

美國單曲排行榜Billboard和World of Women合作推出NFT雜志封面

最新推薦

【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

NFT的未來：傳統企業與去中心化機構之間的競賽

Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

NFT教育要從娃娃抓起！這些青少年藝術家已經賺取了幾千萬美金

美國單曲排行榜Billboard和World of Women合作推出NFT雜志封面

大廠打造元宇宙平臺的業務重心是什么？

猜你喜歡

熱門推薦

相關資訊