
算力是驅(qū)動經(jīng)濟社會數(shù)字化轉(zhuǎn)型的新引擎,是新時代的核心生產(chǎn)力。很長一段時間,CPU主導了整個數(shù)據(jù)中心,虛擬化算力成為云計算的重點。伴隨數(shù)字經(jīng)濟的推進,每年各行業(yè)產(chǎn)生的數(shù)據(jù)量以30%的速度向上增長,網(wǎng)絡(luò)帶寬也從10G向20G、100G,甚至400G邁進,然而影響算力的關(guān)鍵硬件CPU性能的增長速度每年卻不足3%。當CPU再無力解決數(shù)據(jù)中心基礎(chǔ)設(shè)施遇到的瓶頸時,新一代DPU芯片出現(xiàn)了。DPU是Data Processing Unit(數(shù)據(jù)處理單元)的簡稱,是最新發(fā)展起來的專用處理器的一個大類,被業(yè)界認為是繼CPU、GPU之后,數(shù)據(jù)中心場景中的第三顆重要的算力芯片,為高帶寬、低延遲、數(shù)據(jù)密集的計算場景供給計算引擎。DPU 可以重新分配算力和優(yōu)化算力資源,帶來新的數(shù)據(jù)中心創(chuàng)新范式,因而被認為是未來幾年行業(yè)內(nèi)最重要的創(chuàng)新。

DPU 是在目前算力困境、摩爾定律放緩的大背景下產(chǎn)生的。隨著單一服務器的網(wǎng)絡(luò)端口的速度達到 200G 或以上,原來的網(wǎng)絡(luò)、存儲、虛擬化、安全等基礎(chǔ)設(shè)施多方面任務,已經(jīng)無法有效率地由CPU承載,而將這一類基礎(chǔ)設(shè)施任務轉(zhuǎn)移到新的計算單元DPU上。DPU也因此從處理網(wǎng)絡(luò)負載和卸載CPU任務的智能網(wǎng)卡,演變成新一代數(shù)據(jù)中心算力和服務的核心。作為新型數(shù)據(jù)專用處理器,DPU針對基礎(chǔ)設(shè)施層的計算負載,通過創(chuàng)新專用DPU計算架構(gòu)等方式,解決CPU處理效率低下以及任務負載無法處理等問題,是未來算力網(wǎng)絡(luò)的核心基礎(chǔ)設(shè)施。國際芯片巨頭如因英偉達、英特爾、AMD等廠商都已積極開展DPU芯片研發(fā)工作,預計到2025年,全球及國內(nèi)市場有望分別達到245.3億美元與565.9億元,可見DPU芯片發(fā)展勢頭不容忽視。
首顆國產(chǎn)DPU芯片,填補國內(nèi)市場空白目前我國DPU領(lǐng)域還處于起步階段,在國家大力推進數(shù)字經(jīng)濟的背景下,國內(nèi)DPU廠商面對全新賽道,正奮起直追,在機遇與挑戰(zhàn)之間努力搶占新技術(shù)制高點。位于中關(guān)村壹號的國內(nèi)DPU芯片研發(fā)領(lǐng)軍企業(yè)
中科馭數(shù)是國內(nèi)DPU芯片領(lǐng)域唯一擁有自研核心架構(gòu)能力的企業(yè),近一年多來獲得了三輪數(shù)億元規(guī)模的融資,被評為中國信科“潛在獨角獸”。中科馭數(shù)創(chuàng)始團隊大多來自科研院所計算機體系結(jié)構(gòu)國家重點實驗室,在計算機體系結(jié)構(gòu)領(lǐng)域有著近二十年的技術(shù)積累,至今已經(jīng)進行了三代DPU芯片的研發(fā)迭代。

2022年12月21日,中科馭數(shù)宣布:
其研發(fā)的第二代DPU芯片——K2成功點亮。這是國內(nèi)首顆功能較完整的ASIC形態(tài)的DPU芯片,ASIC(Application Specific Integrated Circuit)形態(tài)即專用集成電路形態(tài),是指應特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計、制造的集成電路形態(tài),與普通集成電路相比,具有體積更小、功耗更低、可靠性更高、性能更好、保密性更強、成本更低等優(yōu)點。ASIC形態(tài)DPU芯片對于中國芯片行業(yè)升級以及中科馭數(shù)的發(fā)展都具有里程碑式的意義。

“K2出現(xiàn)之際,正值國家提出東數(shù)西算戰(zhàn)略,可謂生逢其時。它的成功,為中科馭數(shù)DPU芯片產(chǎn)品規(guī)?;慨a(chǎn)打下了堅實的基礎(chǔ)。”中科馭數(shù)創(chuàng)始人、CEO鄢貴海表示。K2采用了28nm成熟工藝制程,可以支持網(wǎng)絡(luò)、存儲、虛擬化等功能卸載,是目前國內(nèi)首顆功能較完整的ASIC形態(tài)的DPU芯片,具有極其出色的時延性能,可以達到1.2微秒超低時延,支持最高200G網(wǎng)絡(luò)帶寬。

此外,基于DPU芯片核心技術(shù),中科馭數(shù)研發(fā)了超低時延DPU網(wǎng)卡、RDMA加速卡、數(shù)據(jù)查詢加速DPU卡,以及面向金融計算領(lǐng)域的極速風控、極速行情等產(chǎn)品。其中,中科馭數(shù)面向金融計算領(lǐng)域的極速行情加速卡,可達到業(yè)界領(lǐng)先的1微秒級別的轉(zhuǎn)發(fā)穿透時延,在加工處理行情時,能夠?qū)崟r根據(jù)行情生成快照,最大吞吐量可達每秒近千萬條信息處理速度。
應用場景廣泛,解決多種行業(yè)難題近年來,隨著新基建、東數(shù)西算、“雙碳”目標等政策規(guī)劃的提出,以及云計算、智能駕駛、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的創(chuàng)新突破,為我國經(jīng)濟數(shù)字化轉(zhuǎn)型提供了廣闊場景,不斷催生多元算力需求。K2作為我國第一顆功能比較完整的DPU數(shù)據(jù)處理芯片,它的成功研制為我國數(shù)字經(jīng)濟時代基礎(chǔ)設(shè)施建設(shè)提供了保障,為整個社會的數(shù)字化轉(zhuǎn)型提供強勁且綠色的動力。

在實際應用中,K2廣泛布局在金融計算、高性能計算、數(shù)據(jù)中心、云原生、5G邊緣計算、自動駕駛等領(lǐng)域,它的直接效果是給CPU“減負”,帶來算力和運營效率的雙倍提升,可用在一些超低時延和超大吞吐的應用上,在建設(shè)數(shù)字化、智能化產(chǎn)業(yè)中發(fā)揮巨大的價值。在未來的實際應用中,K2將推動云計算網(wǎng)絡(luò)、安全、存儲等方向上的技術(shù)革新,助力大數(shù)據(jù)計算基礎(chǔ)架構(gòu)創(chuàng)新,賦能數(shù)據(jù)中心、運營商網(wǎng)絡(luò)高性能計算網(wǎng)絡(luò),助力大數(shù)據(jù)和人工智能多領(lǐng)域基礎(chǔ)設(shè)施產(chǎn)業(yè)升級。
國內(nèi)芯片技術(shù)的新時代標桿與技術(shù)集成開拓者目前,業(yè)界DPU主要運用FPGA形態(tài)方式,簡單來說FPGA就是一塊可由工程師反復編程的邏輯器件,本體是一種數(shù)字集成電路,一個可以通過編程來改變內(nèi)部結(jié)構(gòu)的芯片,具備布線資源豐富、可重復編程、集成度高、投資較低的特點。FPGA也存在不足,它的所有功能均需依靠硬件實現(xiàn),只能實現(xiàn)定點運算,無法實現(xiàn)分支條件跳轉(zhuǎn)等操作,雖然速度上可以和專用芯片相比,但設(shè)計的靈活性與通用處理器相比有很大的差距。隨著我國計算機領(lǐng)域的飛速發(fā)展,F(xiàn)PGA形態(tài)的芯片已不能滿足當前產(chǎn)業(yè)經(jīng)濟發(fā)展需求。

而中科馭數(shù)ASIC形態(tài)K2芯片則恰到好處地彌補了FPGA的不足。K2芯片具有成本低、性能優(yōu)、功耗小等優(yōu)勢,包含帶寬支撐200G、60兆TPS轉(zhuǎn)發(fā)速度,主打延遲高性能網(wǎng)絡(luò),不僅在網(wǎng)絡(luò)加速方面的功能顯著高于智能網(wǎng)卡和基礎(chǔ)網(wǎng)卡所能提供的延遲指標,還能對數(shù)據(jù)中心起到支撐作用,支撐各種軟件定義的技術(shù)。同時,中科馭數(shù)的自主研發(fā)優(yōu)勢,能更好地避免商業(yè)經(jīng)濟捆綁與威脅,且能更好地適配用戶系統(tǒng)與產(chǎn)業(yè)特性,有利于當產(chǎn)業(yè)性能與貿(mào)易經(jīng)濟發(fā)生細微變化時,能及時有效作出調(diào)整,具備強大的市場競爭力。
結(jié)語2019年,中科馭數(shù)研發(fā)了第一代DPU芯片K1,2022年,研發(fā)了第二代DPU芯片K2。從K1到K2,中科馭數(shù)拼搏進取,銳意創(chuàng)新,逐步填補了國產(chǎn)DPU市場的空白。“未來,中科馭數(shù)將繼續(xù)堅持自主可控、核心功能自研的策略,在軟件層面堅持開放,與上下游廠商充分融合,推進國內(nèi)DPU產(chǎn)業(yè)發(fā)展?!敝锌岂S數(shù)創(chuàng)始人兼CEO鄢貴海表示。
小貼士[1] CPU是central processing unit的簡稱,即中央處理器,作為計算機系統(tǒng)的運算和控制核心,是信息處理、程序運行的最終執(zhí)行單元。[2] DPU是Data Processing Unit的簡稱,它是最新發(fā)展起來的專用處理器的一個大類,是繼CPU、GPU之后,數(shù)據(jù)中心場景中的第三顆重要的算力芯片,為高帶寬、低延遲、數(shù)據(jù)密集的計算場景提供計算引擎。[3] ASIC是Application Specific Integrated Circuit的簡稱,即專用集成電路,是指應特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計、制造的集成電路。[4] GPU是graphics processing unit的簡稱,即圖形處理器,又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設(shè)備(如平板電腦、智能手機等)上做圖像和圖形相關(guān)運算工作的微處理器。[5] RDMA是Remote Direct Memory Access的縮寫,意思是遠程直接數(shù)據(jù)存取,就是為了解決網(wǎng)絡(luò)傳輸中服務器端數(shù)據(jù)處理的延遲而產(chǎn)生的。[6] FPGA(Field Programmable Gate Array)是在PAL (可編程陣列邏輯)、GAL(通用陣列邏輯)等可編程器件的基礎(chǔ)上進一步發(fā)展的產(chǎn)物。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。[7] TPS是Transaction Per Second的簡稱,一個表達系統(tǒng)處理能力的性能指標,每秒處理的消息數(shù)。