AI時代,如何用好大模型是當前各行各業矚目的焦點。向量數據庫作為大模型“記憶體”,不僅能夠為其提供數據存儲,而且能通過數據檢索、分析讓大模型進行知識增強,成為生成式AI應用開發新范式的重要組成部分。
用圖片搜索圖片或者文本搜索文本時,在數據庫中存儲和對比的并不是圖片和視頻片段,而是通過深度學習等算法將其提取出來的“特征”,“特征”提取的過程稱為Embedding,提取出的“特征”用數學中的向量來表示。向量化的目的是為了通過向量相似來進行非結構化數據的檢索,向量化后的數據才能夠被AI模型更好的理解使用。向量數據庫就是用于生產、存儲、索引和分析來自機器學習模型產生的海量向量數據的數據庫系統。其典型應用場景比如:基于大語言模型的智能客服、基于企業知識庫的問答以及Chatdoc等工具應用。
火山引擎向量數據庫技術演進之路
● 存算分離的分布式架構搭建
在抖音集團內部,早期的向量化檢索引擎是圍繞搜索、推薦、廣告業務來構建的,由于這些業務天然具有極大的數據規模,因此從一開始,就需要思考如何在向量索引中支持百億數據的檢索需求,比如圖蟲擁有幾億圖片素材,數量規模早已超出單機內存的極限,舉個例子,對于1億條128維的Float向量,不考慮任何輔助結構,就需要100000000* 128 * 4 bytes 也就是約48GB的服務器內存。
研發團隊設計了一套存算分離的分布式系統架構,來進行向量數據的分片和分布式編排,通過向量存儲、批式構建和實時在線檢索,解決一份向量多個索引、支持多個場景的問題,同時,還能夠節省索引構建資源,加快索引構建,使在線檢索服務穩定性得到明顯提升。對于用戶來講,在抖音上搜索內容則會又快又準。
本文鏈接:http://www.www897cc.com/showinfo-45-1997-0.html抖音大規模實踐,火山引擎向量數據庫對外開放服務
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com