站得高才能夠看得遠(yuǎn),作為“藍(lán)色巨人”,IBM數(shù)據(jù)存儲(chǔ)領(lǐng)域擁有足夠多的積累和榮耀,無(wú)論何時(shí)何地, IBM對(duì)存儲(chǔ)的洞察都應(yīng)該引起我們高度關(guān)注。不僅如此,IBM存儲(chǔ)產(chǎn)品和解決方案也總會(huì)帶來(lái)意想不到的驚喜和收獲。
2023存儲(chǔ)峰會(huì)(FMW)期間,存儲(chǔ)在線總編宋家雨特邀IBM副總裁、大中華區(qū)存儲(chǔ)及中國(guó)區(qū)Power業(yè)務(wù)總經(jīng)理候淼結(jié)合閃存技術(shù)市場(chǎng)的熱點(diǎn)進(jìn)行了專訪。
存儲(chǔ)在線總編宋家雨(左一)與IBM副總裁、大中華區(qū)存儲(chǔ)及中國(guó)區(qū)Power業(yè)務(wù)總經(jīng)理候淼(右一)新聞會(huì)客廳訪談
宋家雨:最近IBM存儲(chǔ)在品牌方面有些調(diào)整,把原來(lái)IBM Spectrum調(diào)整為IBM Storage,這個(gè)動(dòng)作的背后是怎樣的一個(gè)戰(zhàn)略布局?
侯淼:IBM存儲(chǔ)剛剛調(diào)整了整個(gè)產(chǎn)品線命名,從IBM Spectrum調(diào)整為IBM Storage,精簡(jiǎn)了。IBM存儲(chǔ)產(chǎn)品線比以前更加專注了,通過(guò)命名的改變,希望能夠使品牌更加突出,突出IBM+Storage。因?yàn)槲覀兛吹剑瑪?shù)據(jù)增長(zhǎng)變得越來(lái)越快,數(shù)據(jù)量越來(lái)越大,IBM Storage業(yè)務(wù)會(huì)成為重要的業(yè)務(wù)發(fā)展領(lǐng)域。
IBM存儲(chǔ)品牌戰(zhàn)略調(diào)整,跟IBM公司整體戰(zhàn)略是分不開(kāi)的。
IBM在2019年收購(gòu)了Red Hat,今年我們剛剛發(fā)布了watsonx, IBM整個(gè)公司戰(zhàn)略圍繞兩大主線來(lái)展開(kāi),一個(gè)代表混合云,一個(gè)代表人工智能。
混合云主要是圍繞紅帽O(jiān)penShift底座,為客戶打造一個(gè)端到端的混合云策略,上可以支持微服務(wù),對(duì)下可以支持容器,這樣把客戶的硬件、軟件資源統(tǒng)一結(jié)合起來(lái),這是IBM很重要的策略。
針對(duì)人工智能,特別是今年7月份IBM剛剛推出的watsonx,它分為watsonx.ai、watsonx.data和watsonx.governance。其中,watsonx.ai主要是作為AI開(kāi)發(fā)平臺(tái),為客戶生成模型提供相關(guān)的底座和支持,包括模型的訓(xùn)練、驗(yàn)證、調(diào)優(yōu)和部署。watsonx.data是湖倉(cāng)一體的結(jié)構(gòu),跟存儲(chǔ)也是緊密相關(guān)的。watsonx.governance為整個(gè)人工智能應(yīng)用提供監(jiān)管,包括管理的平臺(tái)。這三個(gè)產(chǎn)品會(huì)支撐IBM戰(zhàn)略的另外一個(gè)主線,也就是人工智能。
IBM現(xiàn)在有基礎(chǔ)架構(gòu)和軟件業(yè)務(wù),還有企業(yè)咨詢服務(wù),所有這些部門的產(chǎn)品和解決方案都是圍繞以上兩個(gè)主線來(lái)展開(kāi),我們會(huì)比以前更加專注。圍繞這個(gè)主線,IBM對(duì)存儲(chǔ)整個(gè)產(chǎn)品線進(jìn)行了調(diào)整,以前我們是以盤(閃盤)、帶(磁帶)、閃存這樣的語(yǔ)言進(jìn)行描述,未來(lái)我們的產(chǎn)品線會(huì)圍繞三塊: 第一塊是人工智能存儲(chǔ);第二塊是混合云存儲(chǔ);第三塊是數(shù)據(jù)保護(hù)存儲(chǔ)。我們實(shí)際上把硬件、軟件結(jié)合,首先會(huì)有一個(gè)軟件的平臺(tái)和引擎作為關(guān)鍵的組成部分;然后是相關(guān)硬件,包括盤和帶,為客戶提供針對(duì)AI場(chǎng)景、混合云場(chǎng)景以及數(shù)據(jù)保護(hù)場(chǎng)景的解決方案。
宋家雨:您能否結(jié)合這兩個(gè)場(chǎng)景,介紹一下IBM存儲(chǔ)的一些獨(dú)特思考?
侯淼:如果把數(shù)據(jù)源的數(shù)據(jù)分成兩類,一類是結(jié)構(gòu)化的,一類是非結(jié)構(gòu)化的,實(shí)際上你會(huì)發(fā)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)增長(zhǎng)是非常快的,這里包括像文件、對(duì)象、聲音、圖像等數(shù)據(jù),對(duì)此,我們投入技術(shù)、研發(fā)力量幫助客戶去尋找這種這種非結(jié)構(gòu)化數(shù)據(jù)的價(jià)值,提供相應(yīng)的管理方案。
人工智能處理的數(shù)據(jù)大部分(80%-90%)都是非結(jié)構(gòu)化數(shù)據(jù),針對(duì)這些數(shù)據(jù)的管理和應(yīng)用,IBM存儲(chǔ)的一個(gè)主要解決方案就是IBM Storage Scale的產(chǎn)品家族,來(lái)優(yōu)化和簡(jiǎn)化數(shù)據(jù)的訪問(wèn)和存儲(chǔ)。
還有一個(gè)角度是幫助客戶去實(shí)現(xiàn)數(shù)據(jù)的云化,這里最核心的就是容器化。所以我們的混合云存儲(chǔ),特別是我們推出的閃存產(chǎn)品,針對(duì)容器化去支持紅帽O(jiān)penShift混合云平臺(tái),滿足客戶在混合云和私有云構(gòu)建。
現(xiàn)在混合云應(yīng)用有一個(gè)比較大的變化,就是很多客戶開(kāi)始逐漸將應(yīng)用容器化,對(duì)于硬件來(lái)講,容器化的好處在于能夠大幅度地去提高硬件的利用率,因?yàn)橐郧耙粋€(gè)機(jī)器支持幾百個(gè)虛機(jī)就可以了,但是容器化能支持上千規(guī)模,使利用率能夠大幅度提高,減少客戶在硬件上的購(gòu)買成本,這是它的重要價(jià)值。
隨著軟件應(yīng)用變得更加敏捷,部署也能夠越來(lái)越快,不需要花很多周期和時(shí)間。圍繞這樣一個(gè)改變,很多客戶使用容器化軟件去實(shí)現(xiàn)生產(chǎn)系統(tǒng)。對(duì)于生產(chǎn)系統(tǒng),不可避免會(huì)談到備份、容災(zāi),包括恢復(fù)的功能,而這也是IBM最強(qiáng)的部分。
通過(guò)我們的軟件跟OpenShift相結(jié)合,能夠支持客戶實(shí)現(xiàn)生產(chǎn)系統(tǒng)的容器化,然后做容災(zāi)備份一整套解決方案。換句話來(lái)講,我們是為企業(yè)客戶在做混合云時(shí),提供端到端的架構(gòu),使它能夠不單單能滿足容器化帶來(lái)的好處,而且也能滿足生產(chǎn)系統(tǒng)所具有的可靠性、穩(wěn)定性和安全性的要求。
宋家雨:圍繞watsonx,在AIGC領(lǐng)域,IBM存儲(chǔ)有哪些獨(dú)特的優(yōu)勢(shì)和思考,能不能分享一下?
侯淼:實(shí)際上人工智能這幾年是一個(gè)高潮,GPU 被大量在 AI中使用。IBM在人工智能方面,倡導(dǎo)從+AI到AI+,就是以前是在原有系統(tǒng)上加一些人工智能的功能,今天要做的是用人工智能去替代原有的系統(tǒng),使它更加自動(dòng)化。
我們有一個(gè)基本的框架,這個(gè)框架就是數(shù)據(jù)、模型、算力和存力。針對(duì)基礎(chǔ)構(gòu)架去支持大模型,通過(guò)生成式的大模型,支持?jǐn)?shù)據(jù)的分析和提煉,其中基礎(chǔ)架構(gòu)是最主要的平臺(tái)。它有兩個(gè)關(guān)鍵支柱,一個(gè)是算力,一個(gè)是存力,我覺(jué)得這個(gè)說(shuō)法可能只在中國(guó)有,因?yàn)樵趪?guó)外都叫做computing、Storage,中國(guó)語(yǔ)言則體現(xiàn)出一個(gè)“力”。
存力包括兩部分:一是要有一個(gè)存儲(chǔ)平臺(tái),是能夠進(jìn)行數(shù)據(jù)的存取;二是“力”,代表一種能力,這個(gè)能力能夠支持人工智能的模型和算力能力的發(fā)揮,所以在人工智能存力里,對(duì)存儲(chǔ)有不一樣的要求。一方面是要求高性能,因?yàn)楝F(xiàn)在GPU會(huì)越來(lái)越快,而且GPU對(duì)存儲(chǔ)的要求是吞吐量越來(lái)越大,想要數(shù)據(jù)的話能及時(shí)提供 I/O。GPU資源越來(lái)越貴,存儲(chǔ)的價(jià)值就在于怎么能夠減少GPU的等待時(shí)間,減少GPU等待帶來(lái)的浪費(fèi),這很關(guān)鍵,所以人工智能存儲(chǔ)第一個(gè)特點(diǎn)就是要高性能。為了做到高性能,這類存儲(chǔ)要支持英偉達(dá)的GPU直連,通過(guò)支持DGS協(xié)議,使企業(yè)的數(shù)據(jù)和性能能夠提升一倍以上,這是第一個(gè)高性能。
第二個(gè)就能夠進(jìn)行線性水平擴(kuò)展,你很難能夠去預(yù)測(cè)未來(lái)的增長(zhǎng),所以所有這類系統(tǒng)都是分布式的。要求存儲(chǔ)也要是分布式,能夠線性擴(kuò)展,但是分布式跟線性擴(kuò)展是兩個(gè)概念。分布式是能夠擴(kuò)展到上百、上千個(gè)節(jié)點(diǎn),但是當(dāng)你擴(kuò)展到上百、上千個(gè)節(jié)點(diǎn)時(shí),它的性能是否能跟得上?IBM Storage Scale軟件能解決分布式存儲(chǔ)擴(kuò)展時(shí)的性能問(wèn)題,實(shí)現(xiàn)線性水平擴(kuò)展。
安全性、備份、可靠性則是第三個(gè)需求。我覺(jué)得這三個(gè)結(jié)合起來(lái),這個(gè)存力就能夠支持企業(yè)在人工智能領(lǐng)域所需要的基礎(chǔ)存儲(chǔ)要求了。
宋家雨:您能不能具體介紹一下IBM存儲(chǔ)和英偉達(dá)算力解決方案的合作?
侯淼:IBM跟英偉達(dá)公司的合作由來(lái)已久,就在近幾年,2018年IBM和英偉達(dá)一起聯(lián)合支持美國(guó)能源部的項(xiàng)目,當(dāng)時(shí)是用IBM的Power CPU,采用英偉達(dá)NVLink總線進(jìn)行互聯(lián),英偉達(dá)選中了Tesla GPU加IBM Storage Scale System(下文簡(jiǎn)稱為 SSS,原ESS)產(chǎn)品,這三款產(chǎn)品結(jié)合在一起。因?yàn)槿斯ぶ悄苡?jì)算跟高性能計(jì)算是類似,都需要很強(qiáng)的算法,無(wú)論是浮點(diǎn)(運(yùn)算)還是整型(運(yùn)算)。英偉達(dá)在它的一些方案,包括DGX SuperPOD都是采用IBM的SSS產(chǎn)品作為存儲(chǔ)的存力。
IBM現(xiàn)在所發(fā)布的SSS產(chǎn)品也拿到了英偉達(dá)的官方認(rèn)證,支持DGX SuperPOD的GPU直連,而且有完整的測(cè)試,從兩個(gè)節(jié)點(diǎn),到4~8個(gè)節(jié)點(diǎn),我們推薦不同類型的產(chǎn)品組合。IBM單模塊能夠去支持125 GB/s的帶寬傳輸能力,這是現(xiàn)在業(yè)內(nèi)最快的。同時(shí)我們能夠?qū)崿F(xiàn)上百、上千個(gè)模塊的水平線性擴(kuò)展,所以這個(gè)方案能滿足英偉達(dá)GPU對(duì)數(shù)據(jù)存儲(chǔ)的需要。
回到剛才我談三個(gè)能力,有一個(gè)是高性能,包括剛才我談到支持GPU直連,包括最快速的單模塊125 GB/s傳輸能力。另外一個(gè)能力是線性擴(kuò)展,IBM現(xiàn)在的一個(gè)主要解決方案是IBM Storage Scale存儲(chǔ)軟件,以前叫GPFS,這個(gè)軟件是分布式文件系統(tǒng),客戶比較多,它的特點(diǎn)在于:第一,它是全域命名管理,能夠支持不同存儲(chǔ)協(xié)議的數(shù)據(jù)能夠交互,包括像云原生S3、NFS等,它有特殊的本地緩存的算法,能夠在你訪問(wèn)遠(yuǎn)程之前提前去預(yù)測(cè)這個(gè)數(shù)據(jù)是不是在遠(yuǎn)程,能夠先拿到數(shù)據(jù)。通過(guò)這種方式,即使水平擴(kuò)展上百個(gè)節(jié)點(diǎn)、上千個(gè),它能夠通過(guò)預(yù)測(cè)提高性能,盡可能少衰減,這也是它非常大的優(yōu)勢(shì),也是國(guó)內(nèi)包括國(guó)外很多分布式存儲(chǔ)用它作為核心數(shù)據(jù)底座的原因。
第三,很多客戶用人工智能進(jìn)行訓(xùn)練之后,特別是進(jìn)行推理和使用,數(shù)據(jù)會(huì)越增長(zhǎng)越快。這些增長(zhǎng)的數(shù)據(jù),要考慮歸檔和備份的問(wèn)題。IBM較其他存儲(chǔ)的廠家,我們有比較深的、完整的一個(gè)存儲(chǔ)產(chǎn)品解決方案,我們通過(guò)IBM SSS 3500產(chǎn)品作為一級(jí)存儲(chǔ),去跟英偉達(dá)的DGX 服務(wù)器配合使用。
同時(shí),當(dāng)數(shù)據(jù)變得越來(lái)越多,很多數(shù)據(jù)使用頻度降低時(shí),數(shù)據(jù)開(kāi)始從熱數(shù)據(jù)變成溫?cái)?shù)據(jù)和冷數(shù)據(jù),我們就開(kāi)始考慮后面的歸檔,包括備份方案,這里包括文件歸檔、目標(biāo)存儲(chǔ)的歸檔,還有系統(tǒng)通過(guò)自帶歸檔,我們有一整套的方案去滿足客戶對(duì)人工智能存力的要求。
宋家雨:在未來(lái)IBM存儲(chǔ)的規(guī)劃之中,生成式AI部分會(huì)更加依賴于Watson嗎?
侯淼:我覺(jué)得您說(shuō)了一個(gè)很好的題目,Watson這個(gè)名稱來(lái)自IBM的創(chuàng)始人老沃森,后來(lái)也成為了IBM研發(fā)實(shí)驗(yàn)室的名稱——IBM Watson實(shí)驗(yàn)室。今天,Watson已經(jīng)成為IBM人工智能的統(tǒng)一品牌。
現(xiàn)在我們提出叫watsonx,之所以是X的話,是希望我們有各種不同的場(chǎng)景,不同的方案,能解決客戶更多的問(wèn)題。圍繞watsonx它的三個(gè)組成部分,第一個(gè)是支持生成式AI的開(kāi)發(fā)平臺(tái),叫watsonx.ai,第二個(gè)是watsonx.data,把數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù),湖倉(cāng)一體來(lái)結(jié)合。第三個(gè)是watsonx.governance,跟整個(gè)監(jiān)管包括合規(guī)相關(guān)的。
跟存儲(chǔ)有比較大關(guān)系的是watsonx.data,這里牽扯到不單單是要解決人工智能對(duì)存儲(chǔ)的要求,而且也要解決數(shù)據(jù)的管理,數(shù)據(jù)的訪問(wèn),整套解決方案。圍繞這塊,用到了不單單是人工智能存儲(chǔ),也會(huì)用到云,用到數(shù)據(jù)備份、數(shù)據(jù)保護(hù)。IBM watsonx希望針對(duì)企業(yè)級(jí)的人工智能應(yīng)用提供端到端的技術(shù)支持和行業(yè)專長(zhǎng)。
現(xiàn)在市面上有一些工具可能只是工具,用在企業(yè)的話,會(huì)有很多問(wèn)題。包括這些工具的使用,數(shù)據(jù)的產(chǎn)生,數(shù)據(jù)的保護(hù),包括維護(hù)以及監(jiān)管的要求。
IBM的理念是,我們提供watsonx產(chǎn)品家族是滿足端到端的需要,特別是企業(yè)客戶,當(dāng)你不具備那么強(qiáng)AI的研發(fā)能力,通過(guò)IBM產(chǎn)品組合,能夠從生成式的AI模型,到最后滿足監(jiān)管的要求以及數(shù)據(jù)被保護(hù)等各個(gè)方面,這是我們提出watsonx整個(gè)的想法。
watsonx是7月初剛剛開(kāi)始上市的產(chǎn)品,國(guó)內(nèi)現(xiàn)在在推廣階段,現(xiàn)在有一些國(guó)外的案例,主要是客戶通過(guò)生成式AI模型解決行業(yè)一些問(wèn)題。比如:制造業(yè)生產(chǎn)線中缺陷的判別,醫(yī)療影像的識(shí)別,呼叫中心對(duì)客戶訴求的自動(dòng)化應(yīng)對(duì)和回復(fù)。我們現(xiàn)在看到針對(duì)這類行業(yè)應(yīng)用,所有模型都有它的行業(yè)特點(diǎn),發(fā)生很多交互關(guān)系,往往要跟客戶業(yè)務(wù)緊密結(jié)合,去產(chǎn)生一個(gè)合理、可落地的一個(gè)模型。
關(guān)于數(shù)據(jù),我們發(fā)現(xiàn),不單單是企業(yè)對(duì)AI的使用要求,這些客戶本身的海量數(shù)據(jù),比如,一個(gè)銀行的呼叫中心可能也有銀行帳戶的信息,包括信用的信息,而這些信息往往存在數(shù)據(jù)庫(kù)里,所以IBM watsonx.data面對(duì)的數(shù)據(jù)對(duì)象不單單是非結(jié)構(gòu)化的,還有一些結(jié)構(gòu)化的,對(duì)數(shù)據(jù)的保護(hù)要求也不一樣,可能你跟客戶的通話本身是敏感的,要保護(hù)。但是跟客戶銀行帳戶的信息相比,可能這里要求的保護(hù)級(jí)別更高。怎么樣把這些結(jié)合在一起,就變得非常重要了。
我們現(xiàn)在看到watsonx.data對(duì)存儲(chǔ)的要求,會(huì)比單一的系統(tǒng)來(lái)得要復(fù)雜,因?yàn)槌藸砍兜侥P退a(chǎn)生的,跟GPU配合所需要的存儲(chǔ)結(jié)構(gòu)以外,還需要后臺(tái)其他的存儲(chǔ)連接,包括跟它的數(shù)據(jù)庫(kù)存儲(chǔ),包括怎么樣整體上為客戶去做備份,做數(shù)據(jù)保護(hù),所以我們針對(duì)人工智能AI的核心軟件Storage Scale,后臺(tái)既可以接閃存,也可以接對(duì)象存儲(chǔ),也可以接磁帶,這樣跟客戶整個(gè)系統(tǒng)相結(jié)合,不單單是提供AI存儲(chǔ)的本身,而且提供湖倉(cāng)一體的存儲(chǔ)架構(gòu)。
宋家雨:最后一個(gè)問(wèn)題想問(wèn)一下侯總,除了目前我們講的混合云、AI存儲(chǔ)之外,安全也是一個(gè)特別需要關(guān)注的話題。IBM Storage也有一個(gè)產(chǎn)品叫Defender,這樣一個(gè)產(chǎn)品是不是能夠抵御勒索病毒攻擊呢?
侯淼:IBM有一類產(chǎn)品,我們叫它數(shù)據(jù)彈性存儲(chǔ),這里核心軟件就是IBM Storage Defender。實(shí)際上是兩個(gè)層面的事情,一個(gè)叫做數(shù)據(jù)安全,一個(gè)叫數(shù)據(jù)保護(hù),這兩個(gè)是不一樣的。
本文鏈接:http://www.www897cc.com/showinfo-27-9515-0.html相信“藍(lán)色巨人”,IBM存儲(chǔ)永遠(yuǎn)在線
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com