存儲(chǔ)優(yōu)先架構(gòu) (Storage First Architecture)
針對(duì)AI計(jì)算“高差異、高并發(fā)、高耦合”特性
以存儲(chǔ)驅(qū)動(dòng)計(jì)算,打破存儲(chǔ)墻
在同等條件下:數(shù)據(jù)訪問(wèn)可降低10-100倍
28nm工藝條件下,系統(tǒng)能效比超過(guò)4T OPS/W
計(jì)算資源利用率超過(guò)80%,DDR帶寬占用率降低5倍
(注:以上數(shù)據(jù)源自探境實(shí)驗(yàn)室實(shí)測(cè))
通用性AI芯片架構(gòu)
支持所有已知神經(jīng)網(wǎng)絡(luò),等同于GPU兼容性
對(duì)神經(jīng)網(wǎng)絡(luò)的參數(shù)沒(méi)有限制,對(duì)數(shù)據(jù)類(lèi)型沒(méi)有限制
支持(INT4/INT8/INT16/FP16/自定義浮點(diǎn))
自適應(yīng)稀梳數(shù)據(jù)處理
易用性強(qiáng)
提供零基礎(chǔ)可用的工具鏈
無(wú)需用戶網(wǎng)絡(luò)重訓(xùn)即可使用,網(wǎng)絡(luò)精度損失低
學(xué)習(xí)成本低,模型移植簡(jiǎn)單
端云一體
同時(shí)支持推理和訓(xùn)練加速
支持終端推理芯片、終端推理+訓(xùn)練芯片
支持云端訓(xùn)練芯片、云端推理芯片
符合大規(guī)模商業(yè)化需求
采用成熟設(shè)計(jì)方案,無(wú)需對(duì)底層器件進(jìn)行修改設(shè)計(jì)
符合現(xiàn)代工藝,支持多種算法和應(yīng)用場(chǎng)景