從復(fù)現(xiàn)人類智能到挑戰(zhàn)AI大工程,智能計(jì)算正經(jīng)歷什么考驗(yàn)?
面對(duì)多樣化算力供應(yīng)的需求,曙光智算早就做好充足準(zhǔn)備,比如,曙光智算已經(jīng)為許多大型企業(yè)提供AI應(yīng)用的支撐。
靈活而多樣的算力配置是復(fù)雜的數(shù)學(xué)問題,但曙光智算卻化繁為簡(jiǎn),只對(duì)外提供即插即用式的接口,這正是「智算+」API新模式。
「智算+」API新模式,依托于曙光智算API接口。基于該API接口,AI研究人員無需任何算力配置的專業(yè)知識(shí),便可輕松接入資源龐大的曙光計(jì)算服務(wù)平臺(tái),實(shí)現(xiàn)AI模型訓(xùn)練、推理等操作,從而加快、簡(jiǎn)易化整個(gè)研發(fā)流程。
無界的兩大含義——向內(nèi)多樣化、向外簡(jiǎn)易化,被「智算+」API詮釋透徹。
圖注:曙光智算服務(wù)架構(gòu)
通過開放API,曙光智算可為SAAS服務(wù)提供商、應(yīng)用軟件提供商、第三方算力服務(wù)商提供多樣化的算力服務(wù),分別對(duì)應(yīng)3種集成模式:
首先是平臺(tái)集成。該模式主要面向第三方算力服務(wù)商,具體來說是,基于曙光智算AC平臺(tái)服務(wù)和「智算+」API,將第三方算力服務(wù)商平臺(tái)入口集成到曙光統(tǒng)一服務(wù)平臺(tái)(AC平臺(tái)),底層使用曙光自運(yùn)營(yíng)算力。
AC平臺(tái)將多個(gè)智能計(jì)算中心通過數(shù)據(jù)互聯(lián)互通,從而進(jìn)行跨中心的管理和調(diào)度,并以API或非API的形式對(duì)外服務(wù)。
其中,智能計(jì)算中心采用專有的調(diào)度引擎,來協(xié)同計(jì)算資源。所謂調(diào)度也就是對(duì)于特定的問題,選擇不同的建模(比如SVM、CNN等)和計(jì)算方式(比如BLAS、AVX等并行模式)。
其次是應(yīng)用集成。該模式主要面向應(yīng)用軟件提供商,為包含多個(gè)軟件的應(yīng)用商城提供強(qiáng)大而靈活的算力。具體來說是,將第三方應(yīng)用部署到曙光智算現(xiàn)有算力資源中,并依托平臺(tái)監(jiān)控管理模塊對(duì)應(yīng)用程序進(jìn)行管理、調(diào)度、性能監(jiān)控、提供優(yōu)化指導(dǎo)等。
目前應(yīng)用商城已經(jīng)集成海量商業(yè)應(yīng)用Portal和開源應(yīng)用軟件,比如人工智能類軟件包括了TensorFlow、PyTorch等深度學(xué)習(xí)框架,以及Hadoop、Spark等數(shù)據(jù)分析框架。
例如在人工智能領(lǐng)域,百度飛槳與曙光智算合作,已實(shí)現(xiàn)「智算+」API與Paddle2.x的適配,國(guó)產(chǎn)X86及其加速卡版作為常用分支合入官方GitHub倉(cāng)庫(kù),支持安裝包直接安裝,實(shí)現(xiàn)與GPU的API接口統(tǒng)一。此外,通過將「智算+」API對(duì)接AI Studio,百度飛槳還可為開發(fā)者提供人工智能學(xué)習(xí)、實(shí)訓(xùn)、比賽的算力資源。
曙光智算還助力復(fù)旦大學(xué)類腦智能科學(xué)與技術(shù)研究院,構(gòu)建并利用多模態(tài)多尺度腦數(shù)據(jù)庫(kù),發(fā)展了模式識(shí)別、深度學(xué)習(xí)等類腦智能方法。其中,「智算+」API為研究院提供了數(shù)百獨(dú)占節(jié)點(diǎn)+上千個(gè)動(dòng)態(tài)節(jié)點(diǎn),協(xié)助完成了從CUDA生態(tài)到國(guó)產(chǎn)異構(gòu)加速生態(tài)的代碼遷移、應(yīng)用優(yōu)化等工作。
在AI領(lǐng)域中,深度學(xué)習(xí)盛行的當(dāng)下,人工智能近乎有了一致的數(shù)學(xué)語言,同時(shí)也就有了更加靈活的協(xié)同效應(yīng),而耦合與解耦的協(xié)同也在深度學(xué)習(xí)領(lǐng)域發(fā)揮重要作用。比如在一般的全連接神經(jīng)網(wǎng)絡(luò)自身效率不高時(shí),就要通過內(nèi)部“橫向耦合”來深入地探索合適的機(jī)制,最終具有更強(qiáng)適應(yīng)性的Transformer架構(gòu)脫穎而出。之后,與數(shù)據(jù)、任務(wù)等要素“縱向解耦”,Transformer成為如今適用多種任務(wù)的大模型的標(biāo)配,并且不僅僅限于類人智能,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等科學(xué)計(jì)算任務(wù)亦被證實(shí)利用Transformer是可行的,基于Transformer的大模型也在通用AI的探索路徑上被寄予厚望。
可以說,AI的技術(shù)演變?nèi)缃褚渤尸F(xiàn)向內(nèi)多樣化、向外簡(jiǎn)易化的模式。
同樣,算力的耦合與解耦的協(xié)同也在曙光智算的設(shè)想之中?;谶@種協(xié)同作用,并憑借20多年的從業(yè)經(jīng)驗(yàn)、統(tǒng)一和商業(yè)化的運(yùn)營(yíng)模式、豐富的多類型資源、超高速的計(jì)算/存儲(chǔ)網(wǎng)絡(luò)、安全的設(shè)計(jì)標(biāo)準(zhǔn),曙光智算將打造算力的“無界”生態(tài)。
首先,AC平臺(tái)將不同的智能計(jì)算中心進(jìn)行內(nèi)部“橫向耦合”,如同調(diào)整神經(jīng)網(wǎng)絡(luò)中錯(cuò)綜復(fù)雜的連接和激活機(jī)制一般,通過深度的融合來得到“強(qiáng)適應(yīng)的Transformer”,也就是規(guī)劃出多樣的算力配置方案,體現(xiàn)資源無界優(yōu)勢(shì);其次,「智算+API」則像經(jīng)過千錘百煉的Transformer模型,以“好用、通用黑箱”的、“縱向解耦”的方式,最大限度推動(dòng)硬件資源、算力網(wǎng)絡(luò)、算法應(yīng)用之間的協(xié)調(diào)適配,以實(shí)現(xiàn)計(jì)算價(jià)值最大化,體現(xiàn)技術(shù)無界優(yōu)勢(shì)。
最后,在資源無界、技術(shù)無界的推動(dòng)下,曙光智算得以打造全產(chǎn)業(yè)鏈共享的算力生態(tài),以“零門檻”方式最大限度接入產(chǎn)業(yè)鏈上下游相關(guān)方,破除信息孤島,推動(dòng)打造超連接、共進(jìn)化的無界生態(tài)系統(tǒng),實(shí)現(xiàn)無界生態(tài)的持續(xù)創(chuàng)新、升級(jí)。
「智算+」API新模式,詮釋了曙光智算的算力“無界”的終極奧義,從資源、技術(shù)、生態(tài)三個(gè)層面構(gòu)建“開放無界”的算力平臺(tái),引領(lǐng)計(jì)算產(chǎn)業(yè)邁入互利共贏的新時(shí)代。
? Copyright 2013 南京奧特賽人工智能技術(shù)研發(fā)有限公司 版權(quán)所有 備案號(hào):蘇ICP備19032300號(hào)-1 蘇公網(wǎng)安備32011602010459 技術(shù)支持:科威鯨網(wǎng)絡(luò)