不管是現實之中,還是虛擬世界,搬家從來都是勞神耗力的大工程。不過,隨著技術的發展,系統搬家正在告別兵荒馬亂的時代。
這一觀點并非空穴來風。就在上個月,操作系統大會 & openEuler Summit 2023 在京召開,咪咕視訊斬獲 2023 年度 openEuler 領先商業實踐獎。獲獎項目正是公司規模浩大的操作系統遷移實踐。
作為體育內容服務商,咪咕視訊旗下“咪咕視頻”、“移動高清”等產品已經實現了全場景覆蓋。一直以來,也因其出色音視頻能力,深受用戶認可。面對操作系統遷移的巨大工程,咪咕視訊依舊延續了高畫質、高音效、高安全、低時延的穩定用戶體驗,更是通過了亞運會直播的重大考驗。
如此絲滑的云搬家到底是靠什么實現的?openEuler 便是背后的“神秘武器”。
顛覆“船大難掉頭”
要理解 openEuler 的強大,就要先了解咪咕視訊“搬家”的難度。
咪咕視訊成立于 2014 年,是中國移動咪咕公司旗下唯一聚焦于視頻運營的實體單位。經過 9 年多的發展,咪咕已經成為視頻內容領域和體育賽事內容領域的企業,也是國內首個聚齊足籃排“三大球”頂級賽事、國內唯一聚齊歐洲足球五大聯賽的體育內容平臺。
這意味著系統不光要承受高強度的直播和內容傳輸,還要應對重大賽事帶來的突發數據沖擊。以 2022 年卡塔爾世界杯為例,咪咕視頻作為持權轉播商,實現了僅 11 月用戶規模同比增長就高達 103.55%。在劇烈的數據波動下,保證平穩運行已經很有挑戰,要同步實現系統遷移更是難上加難。
特別值得一提的是,臨近年底,多個互聯網頭部平臺出現崩潰,成熟系統的運行中尚且有如此意外,對于咪咕視頻這種巨無霸量級的項目,搬家更是如履薄冰,稍有差錯可能就會造成無法挽回的事故。
既然有風險,咪咕視頻為何還要搬遷系統?據了解,咪咕視頻現網服務器主要使用的是 CentOS / RHEL 操作系統,而該系統已于 2021 年 12 月 31 日停服,嚴重威脅到咪咕視頻系統的連續性。為保障現網業務的穩定與安全,替換操作系統迫在眉睫。
與此同時,由于咪咕視頻資源池使用多年,總體資源可分配余量已無法滿足新項目需求。而且現有資源利用率較低,通過管理手段也難以扭轉,咪咕視頻迫切需要通過平臺技術革新來全面提升資源整體利用率。操作系統搬遷疊加系統升級的需求,似乎不可完成。
方法總比困難多。面對難但必須做的項目,前沿技術給出了可行方案,讓充滿兇險的系統遷移之路變得更加平穩。針對操作系統遷移,咪咕視訊團隊從自主創新考慮,鎖定了國內開源社區的操作系統 openEuler(歐拉)。
公開資料顯示,openEuler 是面向數字基礎設施的全場景開源操作系統,基于 Linux 穩定系統內核,以高可靠、高安全以及高保障著稱。在功能和性能上,咪咕團隊分別對歐拉進行專項測試驗證,證明 openEuler 可替換 CentOS,從而決定遷移至 openEuler。
與 openEuler 社區團隊充分交流后,咪咕視頻采用了 x2openEuler 與原地升級技術的遷移解決方案。同時,咪咕視頻結合特有的雙機房、雙活及容災系統優勢,形成了不停服敏捷部署方案。利用多系統多團隊并發任務有序推進的項目管理方式,團隊從技術、方案和項目管理多管齊下,實現了系統遷移和用戶體驗不降級的“雙達成”。
“船大難掉頭”正在被技術顛覆,咪咕視頻的“搬家”效率驚人。截止 2023 年底,已經累計遷移上量 2.2 萬套 openEuler 系統。業務系統覆蓋咪咕視頻(包括超高清直播、多屏互動等)各類關鍵業務系統,并經歷 2023 年亞運會直播、錄播等重大活動,覆蓋海內外 3.6 億用戶。
遷移升級降本“一箭三雕”
平穩遷移只是 openEuler 方案的一個側面,系統升級和降本增效同樣引人注目。
在 openEuler 操作系統替換過程中,咪咕視訊聯合歐拉社區,定制了針對咪咕視訊業務的操作系統一鍵式升級工具,有效提升了咪咕視頻的操作系統替換效率。據統計,咪咕視頻通過遷移和新應用系統部署,其業務的性能部分提升超 10%。
值得一提的是,該方案選擇了云原生混合部署方案,以提升集群應用密度與資源利用率,從而實現降本增效。首批選擇了針對在線業務視頻門戶與離線任務點播轉碼,在 Ocean 平臺開展混合部署。系統還引入混合部署引擎 rubik,該引擎可以減少資源爭搶,做到資源隔離保證業務之間無影響,在保證業務正常運行的情況下,讓資源得到充分復用。
同時在集群調度層面,咪咕視訊還開發了統一調度器 CA(Cluster Autoscaler)來滿足業務的混合部署,增強集群調度能力。該調度器根據業務負載情況、以及自研算法來完成混合部署,達到資源的復用。現網運行效果顯示,預計可為企業節省服務器數百臺、降低服務器采購成本數百萬。
咪咕視頻項目負責人表示,除了日常的生產環境的運行維護,降本增效一直是后端運維部門的重點工作。通過自研的全局混合調度器 CA,與 openEuler 社區容器混合部署引擎 Rubik 的緊密結合,咪咕視頻實現了視頻門戶和視頻轉碼在離線業務的混合部署,成功將本地資源的 CPU 利用率提升到 50% 以上,且關鍵業務效果還不受影響。
例如在 2023 年亞運會保障中,該方案表現優異,平臺穩定,性能可靠,期間平臺無任何故障發生。結合 openEuler 在咪咕視頻內部的操作系統遷移實踐,預估在 2025 年前,咪咕視頻就能夠完成現有業務的全量系統遷移。
在大型賽事保障中的優異表現,不僅證明了在互聯網視頻場景下,openEuler 操作系統具備規模化推廣上線的能力,同時也展現了“多效合一”的應用邏輯。大多數時間里,一個業務動作只能實現一個效果。而在咪咕視頻系統遷移的項目中,系統升級、降本增效與系統遷移同步完成,實現了“一箭三雕”。
在 openEuler 技術框架下,“一舉多得”成為標配,引領了數字基建的新趨勢。
“值得信賴”的濾震器
安全遷移的背后,運維服務是關鍵。
聯合創新意味著新的突破和嘗試,如何將這些變化控制在安全范圍內是門技術活。以咪咕視頻遷移系統到 openEuler 為例,出現問題是不可避免的。重要的是系統運維力量能否將問題扼殺在產生傷害之前,及時將遷移的震動過濾掉。
目前,咪咕視頻完成了全部業務跟 openEuler 的適配,并且超 50% 的系統也已遷移部署到 openEuler 上運行。在這個實踐過程中,專項組發現問題的第一時間,就跟社區團隊即時反饋。并通過與社區 x2openEuler 技術團隊的聯合創新,共同構建了咪咕視訊內部使用的業務遷移解決方案,并生成了可復用的輔助升級工具。
針對系統遷移項目,openEuler 跨基礎架構運維和應用運維團隊抽調一線運維技術骨干工程師成立專項團隊,分別按業務系統、分批適時遷移。正是因為運維服務能力的協助,系統整體遷移過程才能平滑進行,未造成任何生產故障,業務側零感知、零投訴。
對于項目最具價值的收獲,非方法論莫屬。在咪咕視頻系統遷移項目的運維過程中,專項團隊還將實踐經驗、發現問題系統總結,并將對應的遷移方案和解決方法匯總,形成咪咕視訊自己的經驗知識庫和方法論儲備。
大眾往往在系統的創新上投注了過多的注意,反而忽視了全周期內的運維服務能力的重要性。在咪咕視頻系統遷移的項目中,openEuler 創新之外,“穩”的能力同樣突出,值得合作伙伴信賴。
咪咕視頻攜手 openEuler,實現絲滑“搬家”不過是行業脈動的一個縮影。從更宏觀的視角審視行業,遷移升級降本“三位一體”也只是道開胃菜。在未來,共創共贏模式驅動之下,一切皆有可能。
本文鏈接:http://www.www897cc.com/showinfo-26-63957-0.html咪咕視訊“搬家”啟示錄:openEuler 或成數字基建最優解
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com