日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

Sora爆火96小時國內大模型進場-專家認為,國內企業想彎道超車難度不小

來源: 責編: 時間:2024-02-29 14:33:11 223觀看
導讀 OpenAI“文字生成視頻”大模型Sora根據提示詞“紐約市像亞特蘭蒂斯一樣被淹沒。魚、鯨魚、海龜和鯊魚在紐約的街道上游弋”生成的20秒視頻。視頻截圖(1/1)■Sora不僅可以理解用戶的需求,還知道這些事物在現實

 gxY28資訊網——每日最新資訊28at.com

gxY28資訊網——每日最新資訊28at.com

OpenAI“文字生成視頻”大模型Sora根據提示詞“紐約市像亞特蘭蒂斯一樣被淹沒。魚、鯨魚、海龜和鯊魚在紐約的街道上游弋”生成的20秒視頻。視頻截圖gxY28資訊網——每日最新資訊28at.com

(1/1)gxY28資訊網——每日最新資訊28at.com

■Sora不僅可以理解用戶的需求,還知道這些事物在現實世界如何存在gxY28資訊網——每日最新資訊28at.com

■視頻生成需要處理和預測長時間跨度內的動作和場景變化,增加了模型復雜度gxY28資訊網——每日最新資訊28at.com

■Sora的角色更多是賦能創作者,而不是替代他們提供實現創意愿景的新途徑gxY28資訊網——每日最新資訊28at.com

本報記者查睿gxY28資訊網——每日最新資訊28at.com

春節期間,大洋彼岸又放出大招——美國人工智能團隊OpenAI發布“文字生成視頻”大模型Sora,特別是官方公布的長達60秒未經修改的AI視頻,引發業界極大的震撼,網友驚呼“現實不存在了”。gxY28資訊網——每日最新資訊28at.com

發布短短96個小時內,國內已有AI團隊緊急上線相關“文字生成視頻”大模型,但與國外主流AI視頻模型能力相仿,均無法超越Sora的水平。gxY28資訊網——每日最新資訊28at.com

“Sora能力超乎預期,但仍未達到顛覆行業的水平。”專家指出,AI生成視頻技術仍有門檻,國內企業想彎道超車面臨不小的難度。gxY28資訊網——每日最新資訊28at.com

碾壓同行gxY28資訊網——每日最新資訊28at.com

2月16日,谷歌發布新一代多模態大模型Gemini 1.5 Pro,在性能上超越OpenAI的GPT-4 Turbo,堪稱業界最強大模型。然而,OpenAI在同一日發布Sora大模型,風頭直接蓋過谷歌,僅需通過文本即可自動生成視頻,這也是繼文本模型ChatGPT和圖片模型Dall-E之后,又一極具顛覆性的大模型產品。gxY28資訊網——每日最新資訊28at.com

Sora并非首個文本生成視頻的大模型。據不完全統計,截至去年年底,全球能實現文本生成視頻的大模型包括Runway、Pika、Stable Video Diffusion等20多個產品。Sora的誕生仍給業界帶來不小的震撼,它所展現出來的能力幾乎可用“碾壓”來形容。gxY28資訊網——每日最新資訊28at.com

用戶僅需輸入簡短一句話,Sora就可生成一段長達60秒的視頻,遠遠超過市面上同類型級別的AI視頻生成時長。在此之前,AI視頻模型生成時長幾乎在10秒以內,而“明星模型”Runway和Pika等也僅有3到4秒。gxY28資訊網——每日最新資訊28at.com

60秒的視頻時長,已超過抖音等短視頻平臺的平均視頻時長,Sora的誕生也為以后短視頻平臺的內容生產提供了更大的可能性。gxY28資訊網——每日最新資訊28at.com

Sora保證視頻時長的同時,也加強了視頻質量的穩定性。記者體驗此前的AI生成視頻時發現,即便是幾秒鐘的視頻也并不連貫,有較強的拼湊感。而Sora幾乎能做到60秒視頻一鏡到底,OpenAI的演示視頻顯示,一名時尚女性走過喧鬧繁華的東京街頭,無論是背景建筑和街道以及人像的逼真程度,都保持一致性,哪怕是各種鏡頭的蒙太奇,都沒有出現明顯的失真情況。gxY28資訊網——每日最新資訊28at.com

OpenAI在官方博客中寫道,Sora不僅可以理解用戶的需求,還知道這些事物在現實世界如何存在。這離不開OpenAI在文本和圖像方面的長期積累。gxY28資訊網——每日最新資訊28at.com

上海市人工智能行業協會秘書長鐘俊浩解釋,Sora的訓練依賴于大量帶有文本標題的視頻數據。OpenAI利用Dall-E 3中的標題生成技術,為視頻生成高質量的文本標題,以此提高文本和視頻數據之間的對齊度。在大規模訓練過程中,Sora展示了一些“涌現的模擬能力”,如三維一致性、長距離連貫性、物體持久性以及與世界互動的能力等。這些能力表明Sora能夠在一定程度上模擬物理世界和數字世界的人物、動物和環境。gxY28資訊網——每日最新資訊28at.com

用嗶哩嗶哩科技Up主“Git源寶”的話來說,OpenAI先拆解大量的視頻素材,并將文字與視頻做匹配對應,之后又進行密集訓練,使Sora擁有自主生成視頻的能力。gxY28資訊網——每日最新資訊28at.com

挑戰不少gxY28資訊網——每日最新資訊28at.com

雖然技術令人驚艷,但Sora的視頻生成能力并不完美。已披露的視頻顯示,不少素材仍會“一眼假”,不符合物理學規律等AI生成的Bug(漏洞)不少。gxY28資訊網——每日最新資訊28at.com

以“幼狼玩耍”視頻為例,Sora生成的內容中出現漏洞:在嬉戲打鬧中,幼狼的數量從3只到5只來回變換,雖然動作連貫,但戲法般的效果讓人摸不到頭腦。另外在“一個老人吹蠟燭”的指令下,Sora生成的視頻卻顯示,老人對著生日蛋糕的蠟燭吹氣,卻沒有一根蠟燭熄滅;在呈現“紅酒杯在桌上摔碎”的鏡頭中,杯子摔碎前,紅酒已灑滿桌子,“先摔碎后灑酒”的邏輯,Sora也沒有理解。gxY28資訊網——每日最新資訊28at.com

或許是考慮到性能、安全等問題,Sora并未向公眾開放,目前處于安全測試階段。據外媒預測,GPT-4經過6個月的測試后正式向公眾開放,預計Sora將于8月向公眾開放。gxY28資訊網——每日最新資訊28at.com

在鐘俊浩眼中,Sora面臨的技術挑戰仍不少,特別是與文本對話和圖片生成相比,訓練成本高昂、高質量數據集的缺乏以及視頻描述的模糊性都將是Sora需要跨越的門檻。gxY28資訊網——每日最新資訊28at.com

“視頻生成需要處理和預測長時間跨度內的動作和場景變化,這增加了模型的復雜度和訓練的計算需求。”他認為,與文本和圖像相比,適用于視頻生成的多模態高質量數據集相對較少,這限制了模型學習復雜動作語義的能力,不僅如此,描述視頻內容比描述靜態圖像復雜,因為它需要包括時間上的變化、動作以及可能的情感或故事線索。gxY28資訊網——每日最新資訊28at.com

值得一提的是,在Sora發布的同時,OpenAI宣布一項要約售股交易,由此OpenAI整體估值高達800億美元,一年內飆升兩倍多。根據調研公司CB Insights統計,OpenAI已成為全球估值最高的創業公司之一,僅次于字節跳動和SpaceX。gxY28資訊網——每日最新資訊28at.com

難言顛覆gxY28資訊網——每日最新資訊28at.com

Sora的橫空出世引爆學界、業界和投資界的討論熱度。gxY28資訊網——每日最新資訊28at.com

短短4天內,中信建投、國泰君安、申萬宏源、招商證券等10家券商在研報中均表示,Sora是人工智能發展進程中的里程碑,預示AGI(人工通用智能)將加速到來,眾多行業將迎來顛覆式變革。gxY28資訊網——每日最新資訊28at.com

天風證券認為,內容創作工作流有望被顛覆,下一個億級用戶的互聯網平臺雛形出現。2000億美元的短視頻創作生態有望率先被顛覆,生成式AI在視頻創作和世界模型的大踏步進步將實現對視頻、3D、游戲等下游應用場景的滲透。gxY28資訊網——每日最新資訊28at.com

中信證券從投資角度判斷,Sora背后的涌現能力為自動駕駛、設計等需要現實世界建模的行業提供了明確方向,硬件端的需求必然會隨著多模態的技術進步不斷提高,因此AI算力持續看好。gxY28資訊網——每日最新資訊28at.com

“Sora讓人震驚,很大原因是AI的發展速度遠超預期。但不意味著短時間能形成生產力。”鐘俊浩認為,Sora現在能力還不足以顛覆行業,特別是影視行業和游戲行業高度依賴創意、情感投入和人類故事講述的領域。AI視頻生成技術可以提供幫助,比如降低制作成本、加速內容生成,甚至在某些情境下提供創意靈感,但目前還不能完全替代人類在創作過程中的獨特視角和情感深度。“Sora的角色更多是賦能創作者,而不是替代他們提供實現創意愿景的新途徑。”gxY28資訊網——每日最新資訊28at.com

根據觀察,Sora的文本到視頻生成技術難以進行精細的局部調整。如果用戶希望修改視頻中的某個具體細節,可能需要進行復雜的手工編輯,不僅工作量大,而且也要求用戶具備一定的視頻編輯技能。同時,Sora每次生成的視頻內容有較大變化,難以保持一致的敘事風格或視覺風格。“即便是60秒超長視頻,也無法滿足大部分影視作品需求,將多個短視頻片段拼接起來,在轉場的協調和連貫性上也是額外挑戰。”鐘俊浩說。gxY28資訊網——每日最新資訊28at.com

游戲開始gxY28資訊網——每日最新資訊28at.com

Sora出手即“王炸”,AI生成視頻創業公司無疑將面臨巨大壓力。Runway CEO瓦倫祖拉在社交媒體寫道“Game On(游戲開始了)”,Stability CEO莫斯塔克由衷夸贊“奧特曼(OpenAI CEO)真是個魔術師”。而由華人郭文景創立的Pika Labs也感受到巨大沖擊力,去年11月發布Pika,能夠生成和編輯3D動畫、動漫、卡通和電影,是一款零門檻的視頻生成器,她向媒體透露,團隊如今正準備招人,直接對標Sora。gxY28資訊網——每日最新資訊28at.com

今年1月,字節跳動也發布了MagicVideo-V2文生視頻模型,通過文生圖大模型先生成一張符合當前輸入文本的圖片,然后使用圖片與文本描述利用圖生成視頻模型生成簡單的視頻,并使用視頻到視頻模型,對當前的視頻進行超分辨率技術合成,讓視頻更清晰細膩。gxY28資訊網——每日最新資訊28at.com

前幾日,阿里云旗下魔搭社區(ModelScope)上線文本生成視頻大模型。記者從阿里云方面了解到,這是第三方創作者上傳的作品,目前由文本特征提取、文本特征到視頻隱空間擴散模型、視頻隱空間到視頻視覺空間這3個子網絡組成,整體模型參數約17億,僅支持英文輸入。文本生成視頻大模型已面向公眾開放,與Sora類似可直接輸入文字即可看到生成的視頻效果,目前已公布9個官方案例。比如“A panda eating bamboo on a rock”,將出現2秒鐘“大熊貓在石頭上吃竹子”的視頻。gxY28資訊網——每日最新資訊28at.com

不過這一大模型并不成熟,記者以類似的“A panda dancing(跳舞的大熊貓)”為例,生成2秒鐘的視頻耗時長達32分鐘,且輸出的視頻與“吃竹子的大熊貓”沒有太大區別。gxY28資訊網——每日最新資訊28at.com

北京社會科學院副研究員王鵬告訴記者,盡管國內大模型近年來取得顯著進展,但與OpenAI、谷歌、英偉達等國際大公司相比,仍存在技術差距。這些國際大公司在深度學習、自然語言處理、計算機視覺等領域擁有更深厚的技術積累和研發實力,在AIGC領域具有更強的競爭力。gxY28資訊網——每日最新資訊28at.com

“國內企業要迎頭趕上,需要在技術研發、人才培養和市場洞察上下功夫,同時還要考慮到國內外市場的差異性和合規性問題。”人工智能行業天使投資人郭濤認為,國內AI企業不妨與成熟技術團隊建立戰略合作,共享技術資源,針對國內市場需求,進行產品和應用創新,實現彎道超車。gxY28資訊網——每日最新資訊28at.com

上海機會gxY28資訊網——每日最新資訊28at.com

“現在上海有些公司正在進行‘從一張圖到另一張圖生成中間視頻’的大模型產品研發,比如上海人工智能企業重點孵化器‘AI驛站’中的小冰公司、筆墨AI等企業。”鐘俊浩說,上海在技術研發、人才培養、數據資源、算力資源等方面與國際大公司存在不小差距。“追上Sora的能力需要時間,這不僅取決于技術投入和研發速度,還需要考慮行業生態的建設。”gxY28資訊網——每日最新資訊28at.com

他認為,OpenAI目前在競爭力上一騎絕塵,中國要在AI領域追趕,首先依然靠人才,鼓勵行業高密度聚集,避免人才分散,也避免智能算力等稀缺資源分散。上海應發揮全產業鏈生態優勢,鼓勵行業結合,尤其在智能制造、機器人等領域,整合不同行業的技術和市場資源。同時,鼓勵相關企業、研究機構和教育機構在特定區域聚集,以促進知識共享、人才流動和資源高效利用。通過政策引導和資源配置,集中力量攻克關鍵技術難題。gxY28資訊網——每日最新資訊28at.com

上海在大模型領域的發展正迅速推進,目前已成為國內在人工智能和大模型研發上的重鎮。根據《上海市推動人工智能大模型創新發展若干措施(2023—2025年)》,上海將加快打造世界級人工智能產業集群,這些措施包括支持大模型的創新能力、提升創新要素供給能級、推進大模型的創新應用,以及營造一流的創新環境。gxY28資訊網——每日最新資訊28at.com

目前,徐匯區建立了全國首個以大模型、產業生態集聚發展為功能定位的產業生態空間。全國首批備案通過的8個大模型中,上海占三席,徐匯區集聚了全國近25%的大模型企業和項目,在全國大模型領域處于領先水平。gxY28資訊網——每日最新資訊28at.com

 gxY28資訊網——每日最新資訊28at.com

 gxY28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-3511-0.htmlSora爆火96小時國內大模型進場-專家認為,國內企業想彎道超車難度不小

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 人工智能搶走美國大廠員工“飯碗”

下一篇: 小米汽車工廠調研文件曝光,預計明年3月上市并4月交付

標簽:
  • 熱門焦點
  • 歐盟人工智能法案:四種AI系統風險類型的劃分及監管措施

    作者:趙志東 蔡佳雯來源:區塊鏈日報該法案采用風險分級的規制路徑,將人工智能系統的風險劃分成不可接受的風險、高風險、有限風險和輕微風險四種類型,并針對不同類型施加了不同
  • B端難做:留給魔琺科技的時間不多了

    來源:零態LT元宇宙泡沫正在碎裂,進入2023年后這一賽道熱度一直在遞減。今年2月,微軟解散了成立僅四個月的工業元宇宙部門;今年3月,該公司2017年收購的虛擬現實社交平臺AltspaceVR
  • 游戲玩家才是最“元宇宙”的

    01元宇宙的概念,最早由科幻作家尼爾·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一個脫胎于現實世界,又與現實世界平行、相互影響,并且始終在線的虛擬世
  • 避坑指南:遠離具有這些特性的NFT

    關于NFT,在我們的文章中一直以來都是常駐嘉賓,不止因為NFT背后隱藏的潛力,更因為在這個NFT世界里冥冥之中仿佛有一雙幕后的手,OpenSea、庫里、ERC115、視覺中國、
  • 中國區塊鏈產業生態地圖報告(2021)

    區塊鏈是技術整合創新、金融創新、組織方式創新、產業應用創新的多維度創新,以服務實體經濟、政務民生以及公共服務等領域為落腳點,以期實現整個地區和產業的資
  • 智能人機交互技術的春晚大考

    1月初的一個早晨,京東智能客戶服務產品部緊急開會,進行關于尚未對外公布的“X項目”的初討論。1月5日,這個神秘的X項目對外公布,京東成為央視2022年春晚獨家互動合
  • 2022年最具關注的9個頭像NFT項目

    什么是 PFP NFT 項目?PFP NFT (個人資料圖片NFT)是一組獨特的數字收藏品,人們用來在互聯網平臺上代表自己。這些數字藝術作品通常是一系列可作為頭像的角色,在 Twit
  • 以太坊倫敦升級后,隨之生效的以太坊EIP-1559是什么?

    作者:三黎過去的一年里,除了 BTC 一如既往穩坐王位,DEFI 則是貫穿一整年的狂歡熱點。 DeFi 在讓 ETH 實現價值增長的同時,也使得其網絡日漸擁堵、交易費用增高,成為
  • 初探元宇宙

    2021年可以被稱為“元宇宙”元年。繼2021年3月沙盒游戲平臺Roblox將“元宇宙”概念放入招股書中,被稱為“元宇宙”第一股后,Facebook更名為Meta, 引發全球范圍內
Top 主站蜘蛛池模板: 鹿泉市| 中宁县| 锡林郭勒盟| 灯塔市| 封开县| 乐业县| 舟曲县| 尉犁县| 扶风县| 永城市| 新巴尔虎左旗| 湖南省| 建阳市| 子洲县| 庆云县| 盈江县| 长治市| 永新县| 青川县| 万山特区| 连江县| 岑巩县| 工布江达县| 柳江县| 威远县| 濮阳市| 祁阳县| 许昌县| 汾西县| 广平县| 河北省| 浪卡子县| 海南省| 安庆市| 陈巴尔虎旗| 五莲县| 道真| 恩平市| 芮城县| 沙坪坝区| 朝阳市|