69精品免费视频c|欧美五月丁香五月|开心激情五月天亚洲|婷婷综合久久中文|色另类小说综合网|国产一级毛片a午夜一级|国产高清在线观看自|91精品久久蜜桃|日韩无码视频播放|蜜桃久久一区二区三区

  1. 首頁
  2. 人物聚焦

新基建需要以數(shù)據(jù)為核心的“新存儲”

杉巖數(shù)據(jù)CEO陳堅

國家發(fā)改委對“新基建”的定義是:新型基礎設施是以新發(fā)展理念為引領,以技術創(chuàng)新為驅動,以信息網(wǎng)絡為基礎,面向高質量發(fā)展需要,提供數(shù)字轉型、智能升級、融合創(chuàng)新等服務的基礎設施體系。

新基建涵蓋了眾多的數(shù)字化基礎設施:云計算、人工智能、工業(yè)互聯(lián)網(wǎng)、5G、物聯(lián)網(wǎng)、數(shù)據(jù)中心、智能計算中心等信息基礎設施,以智能交通、智慧能源為代表的融合基礎設施。可以看出,新基建技術中最核心的資產便是數(shù)據(jù)。物聯(lián)網(wǎng)讓采集的數(shù)據(jù)種類和數(shù)量越來越多,5G讓數(shù)據(jù)傳輸?shù)乃俾试絹碓娇欤朴嬎阍诓粩嗟貙?shù)據(jù)進行計算處理,AI在不斷地挖掘數(shù)據(jù)的價值,這些技術連接的關鍵紐帶便是存儲。在新基建推動的當下,存儲可以說是推動產業(yè)向高端化發(fā)展的剛需。

根據(jù)國際咨詢機構IDC的預測,到2025年智能終端數(shù)量將達到400億個,全球數(shù)據(jù)總量也將從2020年的44ZB躍升到180ZB,其中30%屬于實時數(shù)據(jù),75%來自邊緣和終端,而這些數(shù)據(jù)中,將會有80%的數(shù)據(jù)是非結構化數(shù)據(jù)。

數(shù)據(jù)不僅總量巨大,增長速度也十分驚人。舉個例子,一個大型三甲醫(yī)院每天生成數(shù)TB數(shù)據(jù);一個智能質檢的生產線每天生成數(shù)百TB數(shù)據(jù);一座智慧城市每天產生的數(shù)據(jù)量更是高達數(shù)百PB?;诖?,IT技術人員不得不重新考慮存儲的效率以及架構問題,“新基建”需要以數(shù)據(jù)為核心的“新存儲”。

 

新存儲特質之一 ——海量數(shù)據(jù)的可持續(xù)高效存儲

面對如此龐大的數(shù)據(jù)存儲量以及可預見性的數(shù)據(jù)增長量,新的存儲架構必須要考慮的第一個點就是如何以更高擴展性、更高吞吐/低時延以及更高性價比實現(xiàn)容量管理。首先要有高擴展性,滿足因為業(yè)務量、數(shù)據(jù)精細度提升導致的數(shù)據(jù)量增加的隨時擴容需求;其次要有高吞吐/低時延,保障在海量數(shù)據(jù)、海量小文件場景下,數(shù)據(jù)可以快速地讀取和調用;當然用戶也很看重整體方案的性價比。

數(shù)據(jù)存儲到公有云是一種可選解決方案,租用公有云廠商的存儲空間節(jié)省自建存儲的硬件采購成本,根據(jù)數(shù)據(jù)存儲量采購相應存儲空間。不過,數(shù)據(jù)調用的成本也在隨著數(shù)據(jù)量的增加而增加,數(shù)據(jù)使用成本甚至超過了原有的硬件采購成本,比如美國國家航天局(NASA)也不得不因為每個月上百萬美元的數(shù)據(jù)訪問費用,而開始考慮將數(shù)據(jù)從亞馬遜云平臺遷回自建數(shù)據(jù)中心。

以分布式技術為核心架構的新存儲,擺脫了傳統(tǒng)存儲數(shù)據(jù)共享困難、擴容受控制器性能限制等問題,通過將軟件部署于通用服務器,用去中心化架構支持彈性擴展和高并發(fā)訪問,消除了容量和性能的約束,實現(xiàn)更優(yōu)秀的存儲能力,可以輕松支撐EB級存儲規(guī)模;千萬級IOPS和TB級聚合帶寬能夠滿足高并發(fā)訪問需求,加之部署簡單、靈活擴展的特點,為當下日益增長的海量數(shù)據(jù)提供極致容量、極致性能、極致可靠和極致性價比的存儲系統(tǒng)底層支撐。

 

新存儲特質之二 ——海量數(shù)據(jù)的高效管理

僅解決了數(shù)據(jù)存儲的問題,對于新基建的需求來說遠遠不夠,還要進一步解決存儲數(shù)據(jù)的管理問題。

數(shù)據(jù)就像我們人一樣,也有著它的生命周期,從產生到消亡,有很多個階段。舉個例子:一個病人去醫(yī)院就診拍攝X光片,剛產生的結果數(shù)據(jù)我們稱之為熱數(shù)據(jù),這類數(shù)據(jù)對于數(shù)據(jù)的讀寫效率和即時性有很高的要求。就診結束之后的一至兩年內,病人會進行復診,診斷數(shù)據(jù)不需要實時讀取但也需要能夠快速獲得,這類數(shù)據(jù)稱之為溫數(shù)據(jù);病人康復后,根據(jù)醫(yī)療行業(yè)就診數(shù)據(jù)需要至少保存20年的要求,就診數(shù)據(jù)可以保存到成本相對較低的存儲介質中,待有需要時再調取,這類數(shù)據(jù)我們稱之為冷數(shù)據(jù)。因此,新基建所需的新存儲系統(tǒng)需要具備數(shù)據(jù)生命周期管理的能力。

另外不得不提的一個數(shù)據(jù)管理場景便是邊緣計算和中心計算,云邊協(xié)同的數(shù)據(jù)管理能力對存儲系統(tǒng)支撐數(shù)據(jù)中心與邊緣之間的數(shù)據(jù)匯聚和分發(fā)至關重要。特別是5G的發(fā)展,工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)技術的應用,數(shù)據(jù)更多會從攝像頭、傳感器、移動設備等不同的邊緣端產生,而傳統(tǒng)的SAN/NAS存儲只能在局域網(wǎng)內訪問,無法提供云邊協(xié)同統(tǒng)一的數(shù)據(jù)管理能力。新存儲需要打破傳統(tǒng)存儲訪問協(xié)議的限制,能夠基于互聯(lián)網(wǎng)協(xié)議實現(xiàn)數(shù)據(jù)跨網(wǎng)絡的統(tǒng)一管理和訪問,從而能夠直接與數(shù)據(jù)中心之外的物聯(lián)網(wǎng)設備、智能終端直接交互數(shù)據(jù),滿足當前和未來數(shù)據(jù)交互的需求。

當下應用度較高的混合云場景數(shù)據(jù)也需要進行數(shù)據(jù)管理。眾多公有云大廠都已經(jīng)推出了相應的部署模式,出于安全和成本的考量,部分企業(yè)選擇將互聯(lián)網(wǎng)相關業(yè)務部署在公有云,同時將重要數(shù)據(jù)存放在私有云,以兼顧業(yè)務靈活和數(shù)據(jù)安全。企業(yè)私有云存儲需要和公有云存儲結合起來,實現(xiàn)業(yè)務無感知的數(shù)據(jù)上云、下云的融合和流動。在這樣的發(fā)展趨勢下,需要新存儲能夠提供與公有云存儲相兼容的協(xié)議,以及可跨互聯(lián)網(wǎng)數(shù)據(jù)傳輸?shù)哪芰?。將公有云存儲與私有云存儲打通,形成混合云存儲的共同底座來構建企業(yè)數(shù)據(jù)湖,這也是發(fā)展的必然。

任何技術的變革都需要一個過渡階段,新存儲的部署越來越多,傳統(tǒng)存儲也還會長期存在并在其生命周期中繼續(xù)發(fā)揮作用。因此,通過對異構存儲的整合實現(xiàn)數(shù)據(jù)統(tǒng)一管理,不僅有效保護客戶既有投資,也應該是新基建趨勢下對新存儲系統(tǒng)的要求。

 

新存儲特質之三 ——海量數(shù)據(jù)的價值挖掘

數(shù)據(jù)最終的價值呈現(xiàn)一定是為應用服務的,人工智能和大數(shù)據(jù)分析技術的發(fā)展,驅動數(shù)據(jù)產生更多的應用價值。所以在數(shù)據(jù)的價值挖掘,我認為新存儲系統(tǒng)的終極需求必須能夠更好地利用人工智能、服務于人工智能,賦能大數(shù)據(jù)價值挖掘。

在利用人工智能方面,傳統(tǒng)SAN/NAS系統(tǒng)因為受限于訪問協(xié)議的限制,無法感知數(shù)據(jù),只能在存儲底層利用數(shù)據(jù)訪問IO分類、使用容量統(tǒng)計、存儲硬件錯誤碼等信息進行統(tǒng)計分析,來實現(xiàn)存儲系統(tǒng)自動化運維與管理等維度,以存儲系統(tǒng)自身管理效率改進為目標的 “基礎智能”。

而真正的智能存儲,我認為最重要的核心價值應該是基于數(shù)據(jù)感知,能夠對數(shù)據(jù)進行加工和處理,進而賦能應用對數(shù)據(jù)的價值挖掘和價值呈現(xiàn)。所以新存儲系統(tǒng)需要能夠預集成一些通用的、面向業(yè)務場景的數(shù)據(jù)預處理功能和算法(如亞馬遜的S3 Select),然后通過與業(yè)務系統(tǒng)進行數(shù)據(jù)感知,充分利用存儲系統(tǒng)閑置的計算能力,實現(xiàn)某種程度上的數(shù)據(jù)處理功能卸載和垂直優(yōu)化,降低業(yè)務對存儲的訪問壓力,從而大幅提升應用系統(tǒng)數(shù)據(jù)處理和分析效率。

另外,基于海量非結構化數(shù)據(jù)的價值挖掘分析,基本都要依賴機器學習、深度學習等人工智能技術。在人工智能場景中,數(shù)據(jù)要經(jīng)歷采集、清洗、訓練、推理、歸檔等過程。人工智能各個階段對存儲系統(tǒng)要求差異非常大,比如在采集階段,需要存儲系統(tǒng)支持互聯(lián)網(wǎng)遠程訪問協(xié)議、吞吐量要大;在數(shù)據(jù)清洗階段,需要存儲系統(tǒng)支持基于標簽的檢索,最好能支持視頻自動抽幀等能力;而在訓練階段,則要求存儲系統(tǒng)具備高并發(fā)低時延的高性能能力;最后在歸檔階段,則需要低成本的存儲系統(tǒng)。如果采用傳統(tǒng)存儲產品,一般需要不同類型存儲系統(tǒng)來搭配使用,以滿足成本、性能、檢索等多方面要求,但這又勢必造成數(shù)據(jù)在不同存儲系統(tǒng)之間的孤島。因此,新智能存儲應該具有基于標簽的數(shù)據(jù)檢索、多種訪問協(xié)議接口互通能力、滿足高性能、低延時,以及低成本歸檔能力,從而實現(xiàn)機器學習不同AI管道階段數(shù)據(jù)的統(tǒng)一存儲,避免產生數(shù)據(jù)孤島,并且提高數(shù)據(jù)在各個AI管道的流轉效率。

總而言之,新基建為中國的產業(yè)升級清晰地指明了方向,數(shù)字化基礎設施的廣泛建設以及隨之產生的新型應用需求將帶來數(shù)據(jù)爆發(fā)式的增長。海量數(shù)據(jù)蘊含巨大的價值,存儲必將是新基建堅實的底座。更多樣化的數(shù)據(jù)模式、日益復雜的數(shù)據(jù)管理以及高效的數(shù)據(jù)利用對存儲提出了更高的要求,無論是對于傳統(tǒng)存儲廠商還是創(chuàng)新型存儲廠商,是挑戰(zhàn),更是機遇。

 


責編/楊鑫

手機體驗


  • 微信公眾號


  • 微信小程序


  • 手機版


  • 微分享