6月21日消息,賽迪顧問數據顯示,2020年中國DPU產業市場規模為3.9億元,預計到2025年中國DPU產業市場規模將超過565.9億元,年復合增長率高達170.6%,全球DPU產業市場規模將超過245.3億美元,年復合增長率為51.73%。
DPU,即Data Processing Unit,是以數據為核心的專用處理器,被稱為是數據中心中CPU、GPU之后的第三顆主力芯片。
那么,在AI催生下算力與數據爆發的新階段,DPU對更強勁的算力意味著什么?在AI時代該如何重新定義?

“搶灘”DPU
當前,DPU的產業價值已成共識。2023年10月,工信部等六部門聯合印發的《算力基礎設施高質量發展行動計劃》強調,DPU在提升算力效率、優化算力質量、促進綠色低碳算力發展等方面的關鍵作用。這一政策的出臺,標志著DPU在國家戰略中的地位得到了正式確認。
清華大學教授、中國工程院院士鄭緯民在中科馭數2024產品發布會致辭中表示,芯片是算力的核心,是算力提升的關鍵所在。DPU芯片被稱為數據中心中繼CPU、GPU之后第三顆主力芯片,它作為數據處理器承擔著數據網絡傳輸、存儲、計算、安全等任務,是重要的新型算力基礎設施。
中科馭數CEO鄢貴海表示,如果把CPU比做大腦、那么GPU就好比是肌肉、而DPU就是神經中樞。CPU承載了應用生態,決定了計算系統是否可以通用;GPU提供了高密度各類精度的算力,決定了系統是否有足夠的“力量”;DPU負責數據在各種CPU和GPU之間高效流通,決定了系統是否能協同工作。“三U一體”(CPU、GPU、DPU)成為主流算力節點發展趨勢。

在國際上,英偉達、英特爾、AMD、微軟等廠商都已經積極布局DPU。NVIDIA收購Mellanox后,憑借原有的ConnectX系列高速網卡技術,推出其BlueFicld系列DPU,成為DPU賽道的標桿。AMD相繼收購算法加速芯片頭部廠商的Xilinx和Pensando的目的更明顯。繼Intel收購Xilinx的競爭對手Altera后,在通用處理器的基礎上,進一步完善硬件加速能力,Intel 2021年6月新發布的IPU產品(可以被視為Intel版本的DPU),將FPGA與Xeon D系列處理器集成,成為了DPU賽道有力的競爭者。幾乎同一時間,Marvell發布了OCTEON10 DPU產品,不僅具備強大的轉發能力,還具有突出的AI處理能力。
國內GPU廠商在加速攻堅之際,國內DPU賽道也站滿了各路玩家,如移動云、天翼云、華為等通信企業,阿里云、騰訊、百度、字節跳動等互聯網巨頭,以及一些DPU創業公司中科馭數、星云智聯、云脈芯聯、云豹、大禹智芯、益思芯、芯啟源等均在各展神通。

毋庸置疑,DPU產業已經成為國內外競爭的新焦點,在未來數據中心、智算中心等高帶寬、低延遲、高吞吐率產品都將發揮重要作用,為“東數西算”、算力網絡等重要新型算力基礎設施建設提供核心組件。
重新定義DPU
DPU是當下算力基礎設施的核心創新之一,被寄予了數據中心三大支柱芯片之一的定位,戴上了“PU”的王冠。好比數據網絡的高鐵時代,已經不僅僅是連通城市問題,而是徹底重構了地理位置的邏輯距離。
從國內來看,中科馭數是率先完成三代DPU芯片研發迭代,并成功實現規模化商用的DPU廠商。中科馭數的目標是為算力基礎設施提供一流的DPU產品,解決算力資源的彈性擴展、高效互連、加速計算、統一運維等關鍵問題,打通數據中心算力的“堰塞湖”。
其中,6月19日,正式發布的國內首顆量產全功能DPU算力芯片——中科馭數第三代DPU芯片K2-Pro DPU芯片,是專為破解大規模數據中心性能瓶頸而生的高效能數據處理芯片,采用自主研發的KPU架構,集網絡、存儲、安全及計算等多業務卸載功能于一體,包處理速率翻倍至80Mpps,最高支持200G網絡帶寬,具備高度可編程性,確保了系統的靈活擴展性,為數據中心的業務增長和算力擴容提供堅實基礎。在處理復雜任務時,K2-Pro相比上一代芯片能耗降低30%。作為一款純國產的高性能解決方案,K2-Pro適用于云計算、智能計算、及高性能計算等領域,助力數據中心應對日益增長的規模和性能需求。

此外,在2025年,中科馭數將完成K3芯片的發布,采用最新KPU架構以及KISA 2.0指令集,集成RISC-V輕量級控制核,處理帶寬將是K2-Pro的四倍,達到800G,延遲低于1微秒,功耗比K2-Pro下降40%。中科馭數還將在算力基礎設施領域布局“芯云計劃”。
基于此,中科馭數已經不單單將DPU視為單一芯片,而是從三個維度重新定義其價值。第一,架構決勝,用最先進的芯片架構來重新定義DPU芯片架構。第二,軟件護城,用最高兼容性來重新定義DPU的軟件系統。第三,平臺上門,用最低的成本讓客戶接入DPU規模化部署與業務驗證。
歷時六年,立志成為有信念、有追求、有敬畏、有技術的“四有新人”的中科馭數清晰地知道,趨勢并不能確保中科馭數的成功,時代只會給真正創新的企業以回報,只會給效率至上的企業生存空間。馭數人有一個執念,就是不僅要把DPU做成一個產品,更要把“馭數”做成一個品牌,做成一個在數字時代助力數字中國的品牌,成為這個時代趁勢而上的企業。
“革命性的產品,絕不僅僅是指標升級,而是深度契合了技術趨勢的發展。”鄢貴海表示,希望人們以后像記住Intel=CPU,NVIDIA=GPU一樣,記得馭數=DPU。

DPU產業應用落地開花
目前,DPU系列產品高效賦能各行各業,已成功為金融、通信、交通、數據中心等眾多領域提供算力底座支持,DPU產業已經到了應用落地開花的關鍵階段。
首先,在云計算方面。頭部云廠商紛紛啟動自研芯片計劃,而且研發重點都是面向數據處理器的高性能專用處理器芯片,希望以此改善云端的服務器成本結構,提高單位能耗的性能水平。數據研究預測,DPU在云計算市場的應用需求最大,且市場規模隨著云計算數據中心的迭代而增長,到2025年,僅中國的市場容量都將達到40億美元的規模。
其次,在智算中心領域。以AIGC應用來看,DPU在智算中心中的關鍵作用與價值主要有支持超大規模組網算力互連、支持100G+超高帶寬、通過使用RDMA來提供模型訓練所需超低時延和抖動、其NVMe- oF技術可提供更高效的存儲讀取和處理能力等四方面。
再次,在5G通信領域。在5G通信網絡快速發展的過程中,算力和網絡融合發展需要更加綠色高效的數據處理硬件加速技術,亟待DPU提升系統性能。DPU將在高性能數據處理、低延遲數據傳輸、網絡管理、存儲,以及安全等基礎設施底層建設發揮關鍵作用。DPU通過接手CPU不擅長的網絡協議處理、數據加解密等數據處理任務,不僅可以提高網絡傳輸效率,而且釋放了CPU算力資源。在新型算力DPU的加持下,能夠提供靈活高效的硬件加速服務,支持云基礎設施層功能卸載,云邊協同、云網一體都將逐步實現。
最后,在金融行業。金融信創已步入深水區,由“邊緣替代”邁向“核心替代”。核心交易系統對網絡時延的需求從毫秒級提升到微秒甚至納秒,低時延網絡領域的核心設備長期被國外廠商Solarflare與Mellanox壟斷,時延和安全問題成了制約銀行、證券、期貨等行業發展的難點之一。而自主研發的低時延網絡DPU卡構建超低時延網絡,可支撐金融交易核心鏈路從底層硬件到上層應用系統具備超低時延、低抖動、完全自主可控等特性,在超低時延網絡領域真正打破壟斷,實現國產升級替代。
值得一提的是,DPU的潛在市場非常巨大。雖然國內廠商在芯片產品化的環節還相比國外一線廠商還有差距,但是在DPU架構的理解上還是有獨到見解的,而且我國目前在數據中心領域,無論是市場規模還是增速,特別是用戶數量,相較于國外都有巨大的優勢。國內廠商有望充分利用這一“應用勢能”,加快發展步伐,在DPU這個賽道與國外廠商逐鹿中原。