自 2016 年始,中國的 AI 視覺創業俯拾皆是。
他們因 AI 而齊聚,從最頂尖的學術象牙塔中走出,希望用 AI 之鑰,革新傳統產業塵封已久的商業模式。
然而,回看這場探夢之旅,絕大部分高調入場者,最終都黯然收場,只有寥寥數家企業沖破封鎖,其中佼佼者成為人們口中的“AI 四小龍”。
最初的高光過后,外界對 AI 公司高融資、高研發、高虧損的質疑不斷升溫。
在有關四小龍失速的討論中,技術光環褪去,資本熱情消散,政策風險提高,是最人盡皆知的原因。
從同一 CV 戰線,到分頭走向不同道路,事到如今又面對同樣一個問題 —— 哪里才有新的生機?
市場的轉機,往往發生在技術演進的剎那。
在被定義為中國“大模型元年”的 2023 年,命運的齒輪又開始重新轉動。
藉由 AIGC 的風口,AI 賽道一改頹勢,重新占據各類熱門話題的榜首。
在重新拉開的新賽事中,AI 的老玩家們必然不會缺席。
說“安防 + AI”過時,言之尚早
2016 年,當阿爾法狗在棋盤游戲上奪走人類最后的榮光,AI 賽道的投融資開始熱得發燙。
起初幾年,初創公司們備受風險投資的寵愛,資本爭搶著上前買單,企業只需醉心實驗室研發,便能坐看估值升高。
然而幾年過去,眼看著企業在融資、研發、虧損的泥沼中沒完沒了,商業化落地又遲遲難以大規模鋪開,資本逐漸板起面孔,不再愿意聽著故事為虧損買單。
理想中,技術帶來的饋贈之下,這是一場“眾人拾柴火焰高”的合作共贏,但事實上,大家合力助推的不僅僅是浪涌,同時還有盛大的泡沫。
隨之而來的,是市場關于 AI 商業模式的探討,能否驗證自身商業化能力,成為評判一家 AI 企業新的考核標準。
短短幾年,風向急速扭轉,原因在于 AI 這一極具顛覆性技術帶來的暢想,掩蓋了新技術在價值轉化過程中會遇到的困難。
安防是 AI 最早落地的場景之一,通過人臉識別、行為分析等技術,監控系統得以提高效能。但同時,安防行業的碎片化特點,讓標準化、通用化難以實現,導致 AI 企業在追求算法和精度的過程中,陷入高度定制化的盈利困局。
尤其隨著雪亮工程建設尾期結束,安防行業也遇到發展瓶頸,于是有人問,問題是不是出在安防行業,換一個行業,問題是不是會迎刃而解?
一個事實是:AI 確實遇到了商業化落地難題,但安防是 AI 應用落地的起點,大模型時代的開啟,安防仍然是一個不錯的起點。
在智能化的視角下,智能本質上解決機器學習人類的認知、視覺、運動、意識、記憶五個方面。人工智能的核心技術包括語言智能、視覺智能、運動智能。
而視覺智能最大的應用場景就在公安,也即狹義的安防市場。
一直以來,AI 視覺的落地都在經歷同一個過程,從公安起步,到政府,再到企業,大模型的落地也不會例外。
在依圖科技副總裁許焰看來,智能化的每一次進展,都脫離不了以安防為起點,“在政府各部門中,公安部門的信息化一直做得非常超前,對視頻數據的利用在業務上存在剛需,對技術理解最深刻,最愿意用新技術解決面臨的問題。”
以往問題的癥結在于,AI 原有技術路線始終難以突破成本瓶頸;如今以大模型為代表的新一輪 AI 風口的出現,相當于為價值和成本的兼顧難題提供一個極佳的解法。
大模型的到來,也為處在轉型迷茫期,重新思考自身價值和出路的 AI 企業,帶來了新的生機。
早期成立的 AI 公司有客戶基礎,拿依圖來說,公安行業大部分都是其老客戶,一旦依圖有新技術,落地轉化將非常快。
更重要的,上一波 AI 公司在商業化上吃過苦,早已不再只談技術領先,他們明白,只有將領先的技術與業務場景相結合,并做到低成本,才是真正解決用戶痛點。
大模型時代,安防行業做好準備了嗎?
大模型時代到來,安防行業做好準備了嗎?
如果用一句話總結,可以說是:安防市場的需求與技術浪潮撞了個滿懷。
在這一輪新的 AI 風口上,四小龍都紛紛趕考多模態大模型:商湯發布了“日日新大模型”,云從發布了“從容大模型”,曠視也發布了輕量級 LLM 模型推理框架... 今天,依圖的“天問”多模態大模型雖正式發布較晚,但事實上已經得到了客戶的積極認可,目前在已在 30 多個項目中部署應用,落地進程更進一步。
這些 AI 的老玩家們,從上一輪廝殺中,頑強活了下來,如今藉由此前積累的數據和行業認知,從視覺切入多模態大模型,是一次水到渠成的向外拓展。
近兩年,安防行業發展進入瓶頸期,增長乏力,放眼安防行業的主要參與者們,無人不渴望變化,紛紛在廣度、深度兩個方向尋求破局之道。
廣度上,狹義上的安防市場,從以抓逃布控為主體的公共安全業務,走向更綜合的城市治理類業務;與此同時,泛安防市場借助視覺智能化技術,向前進入更大的 ToB 企業市場,同時增加非視頻投入,通過擴充產品線,尋求更大的增長空間。
深度上,企業仍以視頻為核心,在智能技術上進一步投入感知智能、認知智能,部屬大模型能力。
這兩個方向的開掘,都與視頻的智能化緊密結合。
從早期“看得見 ",到“看得清",再到今天大模型賦能下的“看得懂 ",視頻智能化經歷了 L1-L5 五個階段的進化:
--從圖片的結構化標簽到視頻的語義理解;
--從眾多的判別式任務模型到視覺為基礎的多模態大模型;
--從端側攝像頭 AI 算力到云邊側集中式服務器 AI 算力;
--從人、車的識別到長尾物體的識別;
--從標簽式篩選交互到基于語義的人機多模態交互。
在 L5 階段,大家基本達成一個重要共識:以 Transformer 為基礎的大模型統一了視頻和大數據的底層框架,也開啟了視頻智能化情境理解的新時代。
意味著面對同一個指令,整個流程將從割裂的兩個步驟簡化成一個步驟,并且由于省略了中間過程,預測準確性將極大提升。
以統計 A 路口過去十天的擁堵狀況為例,以往的做法是,先通過攝像頭做解析產生大量結構化數據,再到數據庫環節匹配結果;而視覺和大數據的融合,將非結構化的視頻和結構化的數據庫做了融合,變成用一個模型統一解決,具體到操作,只需語音指揮即可,“過去 10 天 A 路口特別擁堵,請將該路口的攝像頭調取出來”。
換言之,大模型時代,當數據從一端流入,結果就會從另一端直接流出。
于公安行業,將是一場警務信息化系統的大改造。
首先,大模型將帶來視頻智能化建設的重大轉變。
視頻智能化建設分兩種模式:一是圖片流,前端相機直接做智能化,然后把圖片回傳后端做進一步分析,缺點是大量信息被丟失;一是視頻流,前端攝像頭負責捕捉,后端進行視頻分析,雖然保留了視頻中的所有語義,行為能被完整刻畫,但由于沒有大模型的加持,視頻完整語義的價值并沒有被完全挖掘和使用。
走視頻流的智能化路線,是對客戶更加負責的選擇,“圖片流只能做人臉識別,隨著業務需求增長,圖片流建設模式就會變成斷頭路,只能換新相機;而視頻流對前端建設有利舊保護,只需后端升級算法即可。”
考慮到大模型只能部署在后端,未來視頻流智能化或將成為主流。
其次,是 IT 基礎設施的重大變化。
前面已經提到,傳統的信息化技術,通過前端攝像機會產生大量結構化數據,結構化數據存在數據庫里,數據庫則存在硬盤里。
大模型時代,所有數據經過模型處理,會生成蘊含對視頻語義完整理解的特征向量,特征向量存在向量數據庫里,向量數據庫存在顯存里。
在從傳統數據庫變到向量數據庫的過程中,基礎設施層面,也將從過去建 CPU 為主的數據庫系統,到建設 GPU 為主的向量搜索系統。
基于這一認知,依圖在 2022 年發布了求實服務器。
對于這款服務器的誕生,許焰如此解釋:“進入到向量時代,超融合架構的服務器威力非常大,依圖求實服務器有一個最大的特點,內存即顯存,因為即便英偉達的 A100 也只有 40G 的顯存,但求實服務器內存可以到 512G,甚至 1T。”
再者,從生產過程講,有了預訓練大模型,用戶需求端到端的時間以及成本會被極大壓縮。
一方面,用大模型技術替代過去小模型,可以極大壓縮生產過程周期,降低算法研發成本,讓客戶更快享受到技術的紅利。
比如,當用戶要做一個“騎電瓶車不戴頭盔”的需求時,AI 公司需要先收集數據做訓練,需求提出到滿足,至少一到兩個月。
有了預訓練大模型后,只需輸入“騎電瓶車不帶頭盔”的指令,就能生成算法,一周時間即可達到之前一兩個月才有的效果,并且時間越長,模型精度越高。
另一方面,通過算法和算力的端到端的整合,也會帶來成本最小化。
許焰對雷峰網舉例,“過去做 1 萬路視頻智能化,得用 16 個機柜,現在算法和算力實現端到端整合后,只用一個機柜就可以解決所有問題,但整體成本下降了 80%。”
最后,從業務層面講,傳統的指揮中心、移動警務、偵查破案等都會發生重大變化。
比如指揮中心可以直接通過語音調取攝像頭,如“幫我調取所有公園的視頻”、“幫我調取所有現在擁堵路段的視頻”;移動警務也將變成,民警在路上巡邏上時,不再需要在執法儀上打字,而可以高效率地通過語音輸入指令,如“請查詢前方戴黑色帽子的人的身份。”
“新安防、真智能”,安防的下一個十年屬于智能
“依圖一直堅信安防市場會從監控走向智能。”
如果說依圖有什么明顯區別于其他公司的地方,就在于其始終認可安防市場的價值,并用十年時間堅守安防市場。
談到依圖對安防市場的貢獻,許焰滿是自豪:
“自 2012 年成立至今,在安防智能化發展的各個階段,依圖都代表業界最前沿水平。依圖之所以堅信安防是個好市場,一個原因也在于依圖在安防市場做到了盈利,持續為客戶創造價值。”
這種價值具體表現為,時至今日,依圖是安防行業第一個推出可實戰可商用的多模態大模型的公司。
“第一個”寫起來雖然簡單,但對于依圖而言,背后是沉甸甸的付出。
2018 年,依圖提出“新安防,真智能”的口號,至今未變。
彼時,視覺智能化快速發展,人臉識別開始進入規模化落地階段。依圖的“新安防”口號,為公安業務流程的變革而發;“真智能”口號的提出,則強調了“真正的智能”給安防行業帶來的差異化的用戶價值。
進入大模型時代,公安的業務流程、智能化程度躍遷到了新的階段,但依圖這句口號的內核依然沒有變化。
真正讓人動容之處在于,依圖并沒有淪為“口號專家”,而是將口號掛在了實際行動上。
一直以來,客戶看似不合理的追求六個字:高價值、低成本。
滿足這個需求并不容易,尤其在 AI 這一有著極高技術和渠道門檻的賽道。
但依圖對這句話的信奉和踐行,是 AI 公司中難得一見的扎實。
支撐依圖“安防是好市場”背后的商業邏輯正是,追求價值最大化、成本最小化。
依圖 2017 年開始布局芯片板塊,2019 年 5 月 9 日發布首款云端 AI 芯片“求索”,用于視覺推理領域。
當時的發布會現場,依圖通過四塊“求索”芯片,實時比對現場觀眾,演示十分鐘內,無一起誤報。
依圖之所以向上做芯片,在于看到了算法性能高速發展和機器算力提升緩慢的矛盾,這一矛盾導致 AI 公司們要么犧牲算法性能,削足適履;要么沒有先進算法,空耗資源。
而隨著中美科技競爭的加劇,美國對中國芯片的封鎖制裁力度持續升級,國產化具有高性價比的芯片產品在此刻顯得尤為重要,依圖的選擇似乎又更具有前瞻性:做硬件和算法的端到端的整合,可以給用戶最高性價比的后端智能化產品。
如果說,以前因為缺乏統一的模型結構導致芯片和算法公司難以匹配,在一定程度上說明人工智能芯片還不太成立,那么到今天,這個阻礙已經消失了。
2019 年,依圖開始投入以 Transformer 為基礎的大模型技術,如今回看這一決定,其意義在于,選對了公司未來幾年的發展路徑。
當企業選擇的方向更準確,研發的效率就會更高效,成本更低,對客戶而言就是更高的性價比,最終實現雙贏。
“到今天,依圖的多模態大模型已經在全國 30 多個項目中部署應用。”據許焰向雷峰網介紹,依圖“天問”多模態大模型,有以下三大特點:
其一,視頻語義搜索能力,支持用自然語言搜索各類視頻。
類似“堵塞消防通道的車”、”積水的路面“、”無人看管的紅色行李箱“等表達都可以快速找出對應的視頻。
其二,零樣本、冷啟動。
比如要創建一個騎車不戴頭盔的算法,只需輸入“騎車不戴頭盔”,就能生成算法,并且算法一旦上線,便能在線上做分鐘級的訓練,越用精度越高。
其三,內置了大量凝結依圖對行業認知的算法。
通過針對性的將特定數據放入訓練模型中,如大客流、重點區域防控等典型算法,來提高模型性能。
今年以來,依圖的天問大模型收到不少令許焰印象深刻的反饋。
某城市交通事故頻發,該市客戶找到依圖做城市路口的常規違章和不文明行為判定,要求用天問大模型賦能利舊的前端攝像頭。
依圖做了闖紅燈、超速、不禮讓行人、騎車不戴安全帽、違法掉頭、壓實線等各種各樣的算法,系統上線第一天,準確度只有 60%-70%,一周結束后精度基本達到 100%,并且成本比以往的建設成本下降了 60%-70%。
在許焰的回憶中,“當時這個客戶特別興奮,因為依圖用一周時間,解決了該城市交通治理極大的痛點。”
除了大型項目,多模態大模型的意義還在于解鎖長尾算法。
以往,大量中小型客戶,由于支付能力不強,此前對 AI 沒有剛需,未來借助大模型的遷移和通用能力,可以降低成本門檻,這些用戶也能用上用好大模型。
結語
路漫漫其修遠兮,吾將上下而求索。
2019 年,依圖發布第一款 AI 芯片,從屈原的《楚辭》中找到“求索”一名,表達了對人工智能技術、人工智能產業落地探索的熱情。
與此同時,依圖也開啟了將 Transformer 技術用于視覺領域的研究,并同樣從《楚辭》中找到“天問”一名,賦予彼時還尚出世的視覺多模態大模型。
時至今日,依圖在國產化算力上有了“求索”和“求實”,在大模型算法上有了“天問”。十年 AI 路,依圖所打造的“全棧 AI 技術”和 " 一站式 AI 解決方案提供商“的形象也越發清晰,完整。
在大模型時代,依圖對安防智能化依然信心滿滿,秉持著為”價值最大化,成本最低化“的運營理念,投入堅決。隨著視覺多模態大模型產品的商用推出和規模化部署,依圖又一次站在了 AI 新時代的浪尖。
大模型時代必然會產生新的商業模式和應用場景,在依圖的第二個十年,我們期待它能再一次引領行業,再一次把“新安防,真智能”的口號變成現實。
本文鏈接:http://www.www897cc.com/showinfo-26-52093-0.html安防進入大模型時代, 依圖「求索」新十年
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 先進存力!曙光存儲位列國內第一陣營