這段時間,巴黎奧運會的熱度可以說是拉滿了,編輯部小伙伴們天天圍在一起看比賽,甚至還有半夜組局的。
而每當看到世界冠軍們打出好球、射出高分環時。。。世超腦子里總會冒出個念頭: “ 我當年要是也練個一兩手,現在高低也是個世界冠軍吧 ” 。
但,真要現在的我去玩兩把,立馬就又菜鳥顯形了,活脫脫一個人菜癮大。
所以,咱心里還是有數的,這些個奧運選手,肉身走到全世界面前參加比賽,哪個不是在背后流了三船五車的汗,世超這輩子估計是沒什么機會了。
但就在網上沖浪的時候,咱發現這次巴黎奧運會,一堆明星、運動員和觀眾們,都在曬自己玩其它運動項目。
比如游泳運動員劉湘打上了排球。
前 NBA 總冠軍托尼 · 帕克,也在秀自己的排球爆扣。
一查才發現,原來這是咱們中國科技在法國露大臉了,名字叫阿里云奧運智影時刻 ( Cloud Memento ) 。
簡單來說,阿里云在巴黎埃菲爾鐵塔、榮軍院和戰神廣場三個地標場所,分別設立了一個體驗點。
在這 3 個體驗點,任何人只需要花上 3 秒鐘,拍幾張照片,就能通過 AI 科技,生成一個奧運參賽運動視頻。
恐怕你都想象不到這玩意兒在奧運場館有多火,現場排隊的老外,我估摸著能從西直門排到八達嶺了。
而且近這段時間,巴黎是時而下雨、時而暴曬的冰火兩重天。
但觀眾們愣是從風雨交加,排到了艷陽高照。
說什么也得體驗體驗,來自遙遠東方的神秘 AI 科技。
別的不說,光看現場排隊的情況,你說這是哪個奧運冠軍在簽名我都信。
而在現場,體驗的觀眾就有意思了。
這邊剛來了個哥們,還挺樂呵的,露出了一口潔白的牙齒。
那邊又來了個 “ 鳴人 ” ,放著 “ 薩斯給 ” 不管,反而來現場,放了個影分身練起了柔道。
參與的觀眾們雖然膚色各異、年齡不同、性別不同,但主打就是全民參與,各個都想體驗科技的魅力。
大家一個個上臺,簡單花幾秒擺出個 “A 字形 ” 姿勢站好,采集就結束了。
他們只需要在臺下稍等片刻,就能在手機里看到自己成為了帥氣的運動高手。
一聲聲 “ Cool ” 的贊美聲,也不斷從人群中傳來,甚至有些體驗者,當場就把生成的奧運時刻分享到了社交平臺,秀一波。
而在這些隊伍中,我們也看到了一些 “ 特殊 ” 的體驗者。
一名坐輪椅的中東設計師,來到了現場后,在工作人員的攙扶下完成了采集。
很多年沒運動過的她,成功利用這個技術過了一把柔道運動員的癮。
甚至在現場,我們還逮到了 TikTok 頂流男巫 Zach King 。
這哥們這次又是跑來巴黎玩花活,把整個巴黎跟變戲法一樣變成了他的排球賽場。
結果一個不小心,逛到阿里云奧運智影時刻的體驗點,直接被硬控住了,當場生成了自己的排球秀。
而在這次爆火的現場背后,差評君也發現,雖然它看起來一點也不簡單,實際上也確實有些東西。
因為阿里云奧運智影時刻 Cloud Memento ,和如今大火的生成式 AI 大大滴不一樣。
大伙們也都知道,目前生成式 AI 的通病是,生成出的東西,主打一手隨心所欲,你要個“ 陽光彩虹小白馬 ”,它能給你生成個 “ 陽光 ” “ 彩虹 ” 和 “ 小白馬 ” 。
不能說毫無關系,但也是牛頭不對馬嘴。
所以,為了實現更好的效果,阿里云巴黎奧運智影時刻,不是讓AI 直接生成視頻,而是選擇利用 “ 靜態人物照片生成指定體育運動視頻 ” 。
根據幾張簡單的照片,經過 AI 計算,就能精準捕捉還原,并且生成新動作。
這么一來,視頻的主體基本就差不離了。
但這種做法也還是會有不少毛病,因為讓圖片動起來,很容易出現失真、模糊、幀率抖動等情況。
特別是當用某些真人照片當模板的時候,咱起碼的要求就是:生成的得像照片本人吧。
像下面這樣給幾個小姑娘整上了鬼片特效,我估摸著也只有伽椰子看了能說好。
那阿里云是怎么解決這個難題的,我們也去翻了翻論文,發現他們直接搗鼓出了一套名叫 Animate Anyone ( 讓所有人動起來 )的算法,而這套算法里,可有著不少黑科技。
簡單舉個例子:
讓一張圖片動起來的步驟里,困難的就是讓 AI 根據已有的圖片, “ 腦補 ” 它該怎么動。
大家都知道,視頻里人物動作是一幀幀過渡實現的,就像我們小時候畫的火柴人,通過快速翻動,卡了人眼的 “ 視覺暫留 ” 的 bug ,讓大腦以為人動起來了。
但要實現這種絲滑連招,那畫火柴人的時候,我們就得想好火柴人的動作怎么銜接下去,一張張畫。
可對 AI 來說: “ 這題目太難了,我不會做! ”
很多時候, AI 會搞成身子動了手飛出去了,頭往前走了屁股卻還在后面拖著,反正看著就是一眼假。
為了保證人物的穩定性和前后形象一致,阿里云往里面加了個 “ 參考圖像網絡 ReferenceNet ” 。
這玩意兒相當于一個活字印刷板,它能一口氣把圖片里的空間細節信息全提取出來。
然后把去噪 U-Net 接入進來,這個 U-Net 就相當于精準的印刷機,它能把前面捕捉到的信息精準分割,清晰地 get 出各種圖像元素。
這么一來, U-Net 就能夠理解生成目標圖像時,該在哪些位置生成哪些細節,從而實現人物形象一致性。
不至于給了海王做原圖,輸出了一個徐錦江老師。
在解決畫面細節問題后,剩下的挑戰,就是處理動作和姿態了。
阿里云 AI 團隊也不多逼逼,直接設計了一個姿態引導器 Pose Guider 。
說白了,這個姿勢引導器就相當于咱小時候練字的字帖,跟著字帖來寫字,那效果肯定是杠杠的。
于是,模型生成視頻時有了方向,就會讓生成的圖像動作穩定住,不給跑偏的機會。
再加上其他的一些 “ 法術 ” ,后,阿里云的工程師們終于練成了一套九陽神功 Animate Anyone 算法。
用這套功法,可以輕松地把靜態的人物圖像轉化成動畫視頻,甚至還能通過輸入姿勢的順序,精準調控視頻中的人物動作。
可這是在實驗室的理想狀態,等到了巴黎奧運現場,阿里云奧運智影時刻還上了一層 buff 。
比如一會大晴天一會大雨天,就這光線的變化就夠 AI 喝一壺,而奧運比賽有著復雜運鏡,相當于拿著放大鏡看手腳的動作、觀察臉上的表情,這也給 AI 帶來了新挑戰。
阿里云 AI 團隊就又根據實際情況,整出了些新點子。
比如在前面的實驗室里,生成圖像全是 2D 圖片來生成的 “ 純電模式 ” ,到了巴黎現場,改成了 2D+3D 的混動模式,更精準地捕捉動作和表情。
然后再把前面 “2D+3D” 采集完的數據,用上了云端智能渲染技術,直接對環境光場進行快速解析。
得到的數據,又與云端實施的光線追蹤技術無縫融合,約等于讓真實的陽光曬進虛擬的場景。
就是這些技術上的努力,后就有了阿里云奧運智影時刻在奧運場的爆火。
可以這么說,這次阿里云完全就是活該他火。
當然了,在這屆巴黎奧運會上,除了阿里云奧運智影時刻外,阿里云還發了大力。
尤其在助力奧運會轉播的道路,有著重大歷史意義。
要知道,在此前的奧運會里,衛星轉播從來都是全球轉播的大主力。
而今年,阿里云帶隊成功實現了反超,有 11000 小時的賽事直播畫面在云上向全球分發,超過三分之二的全球信號是通過云上傳播的,這是 1964 年東京奧運會開始衛星電視轉播以來,又一次重大技術進步。
此外,阿里云帶來的, AI 增強全新轉播技術,也擁有了獨特的高自由度回放系統。
比如可以在關鍵時刻進行定格,然后 “ 子彈時間 ” 般的回放。
比如在男子百米決賽上,終差距只有 0.005 秒,還得是靠阿里云這套 “ 云上高自由度回放 ” 技術,幾乎在直播瞬間,就讓全世界觀眾,一眼看出冠軍是誰。
這種技術,大大增強了觀賽體驗,獲得了大家一致好評。
阿里云甚至還出手,幫忙修復了 100 年前巴黎奧運珍貴影像。
這一系列動作,引得國際奧委會主席巴赫,直接公開感謝阿里云的工作。
所以在本屆奧運會上,阿里云憑借著深厚的技術實力,在為這個已經有 120 余年歷史的國際盛事,注入了科技的力量,插上了云計算 AI 的翅膀。
可以說在技術上,無論是在助力奧運會云轉播還是給觀眾塑造體驗上,阿里云顯然把這次奧運會當成了科技的賽場。
但在整個環節中,我們似乎并沒有 “ 他們純純就是在炫技、秀肌肉 ” 的感覺。
他們很好地把技術和人結合在了一起:
要么為辦賽人員提供技術支持;
要么為現場奧運迷豐富賽場活動;
要么為全世界各地的觀眾們升級觀賽體驗;
。。。
總之,一切的一切,其實都反映著阿里云的態度:科技是手段, “ 人 ” 才是目的。
正如喬布斯當年說過的: “ 光有科技是不夠的,科技要與人文和人性結合,才能產生讓我們的心為之歌唱的結果 ” 。
無疑,阿里云就是這么干的。
本文鏈接:http://www.www897cc.com/showinfo-17-106584-0.html別再吹巴黎的松弛感了 他們正擱那排隊呢
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com