欧美综合自拍亚洲综合图,精品久久久久久无码中文野结衣,日韩国产精品亚洲а∨天堂免,亚洲av无码一区二区一二区潮浪

澳門(mén)永利官網(wǎng)

國(guó)產(chǎn)芯片15天左右可跑通大模型,高端算力仍需各方努力

2024.07.23

大模型落地應(yīng)用元年


2023,隨著ChatGPT的橫空出世,大模型迎來(lái)了前所未有的關(guān)注。2024,業(yè)內(nèi)普遍認(rèn)為,大模型將迎來(lái)落地應(yīng)用熱潮。


大模型落地應(yīng)用元年,人工智能技術(shù)也行至產(chǎn)業(yè)應(yīng)用的臨界點(diǎn)。紅星資本局采訪多家國(guó)內(nèi)大模型企業(yè),聚焦大模型應(yīng)用行業(yè)前沿關(guān)鍵節(jié)點(diǎn)。
算力與數(shù)據(jù),是支撐超大規(guī)模訓(xùn)練模型發(fā)展的兩大基礎(chǔ)設(shè)施。面對(duì)全球追逐大模型熱潮,高端AI芯片短缺,算力問(wèn)題也成為各行業(yè)實(shí)現(xiàn)人工智能普惠的最大難點(diǎn)。

近期,澳門(mén)永利官網(wǎng)運(yùn)營(yíng)實(shí)體澳門(mén)永利官網(wǎng)CTO甄亞楠在接受紅星資本局等媒體專訪時(shí)談到了超算中心與智算中心轉(zhuǎn)換、大模型使用國(guó)產(chǎn)芯片的情況、大模型算力供給等問(wèn)題。

他告訴紅星資本局,目前幫國(guó)產(chǎn)大模型“嫁接”國(guó)產(chǎn)芯片,只需15天左右就可以跑通。他認(rèn)為算力共享會(huì)是行業(yè)大趨勢(shì),高端GPU算力資源需要各方努力。

北龍超云CTO甄亞楠

超算轉(zhuǎn)智算會(huì)是趨勢(shì)嗎?

一般來(lái)說(shuō),算力分為通用算力(基礎(chǔ)算力)、智能算力和超算算力三大板塊。

其中,基礎(chǔ)算力主要由基于CPU芯片的服務(wù)器提供,用于支持如云計(jì)算和邊緣計(jì)算等基礎(chǔ)通用計(jì)算。智能算力則由基于GPU、FPGA、ASIC等AI芯片的加速計(jì)算平臺(tái)提供,主要用于人工智能的訓(xùn)練和推理計(jì)算。而超算算力則由超級(jí)計(jì)算機(jī)等高性能計(jì)算集群提供,主要用于尖端科學(xué)領(lǐng)域的計(jì)算。

各類算力中心在計(jì)算方式和擅長(zhǎng)領(lǐng)域等方面各異,近幾年各地也在加快智算中心的建設(shè)。

“其實(shí)海外并未區(qū)分‘超算’‘智算’的概念,他們專門(mén)用來(lái)做計(jì)算的這類機(jī)器都叫做super computer(超級(jí)計(jì)算機(jī))!闭鐏嗛J(rèn)為,智算中心在國(guó)內(nèi)看起來(lái)利用率比較高,主要還是供需關(guān)系決定的。

“現(xiàn)在做大模型的企業(yè)比較多,大家都在‘搶時(shí)間’研發(fā),迫切需要有更大量的算力資源,短時(shí)間之內(nèi)高端GPU算力資源大家都是按月或者按年的方式去租賃。所以這個(gè)機(jī)器只要一上線,就有大量的客戶把這些資源拿走去用,這就看起來(lái)智算中心的利用率更高一些!

甄亞楠表示,超算和智算解決的都是同一類問(wèn)題,即計(jì)算密集型問(wèn)題!叭绾谓o用戶提供足夠量的資源池,如何提供穩(wěn)定長(zhǎng)時(shí)間的計(jì)算,如何能夠在計(jì)算過(guò)程中性能是高效的,不管對(duì)于超算還是智算,都屬于共性問(wèn)題。”

甄亞楠認(rèn)為,算力中心的建設(shè)就需要具有一定的“適度超前性”,因?yàn)橐休d未來(lái)3~5年的使用訴求。為了應(yīng)對(duì)空閑,澳門(mén)永利官網(wǎng)采取的是“分批次”的按需建設(shè)模式!氨热缧枨笸⒌臅r(shí)候,增加建設(shè)幾百臺(tái)甚至幾千臺(tái),當(dāng)利用率飽和的時(shí)候,再進(jìn)行有效的擴(kuò)容!贝送猓P(guān)于超算智算之間的轉(zhuǎn)換,他表示超算架構(gòu)加上GPU卡就可以服務(wù)AI智算。

數(shù)據(jù)顯示,截至去年我國(guó)就有十余家超算中心,超30個(gè)城市提出或正在建設(shè)智算中心。

甄亞楠告訴紅星資本局,各個(gè)地方建設(shè)算力中心,澳門(mén)永利官網(wǎng)也在積極關(guān)注,“如果地方建設(shè)了大型的算力中心,是不是能找到客戶、服務(wù)好客戶?是不是能把平臺(tái)高效運(yùn)營(yíng)起來(lái)實(shí)現(xiàn)經(jīng)濟(jì)效益的轉(zhuǎn)化?這些是我們持續(xù)關(guān)注的點(diǎn)!

甄亞楠還提到了另一個(gè)關(guān)注點(diǎn),即未來(lái)算力產(chǎn)業(yè)。“本質(zhì)上它受限于算法和算力芯片技術(shù)的快速迭代和更新。以英偉達(dá)來(lái)講,都會(huì)有非常明確的算力芯片發(fā)展規(guī)劃。未來(lái)高端芯片出來(lái)后,是不是低端芯片會(huì)逐步被替代掉,這也是一個(gè)值得探討的問(wèn)題。”

國(guó)產(chǎn)芯片跑通大模型有障礙嗎?

近年來(lái),我國(guó)人工智能算力芯片的市場(chǎng)格局主要由英偉達(dá)主導(dǎo),其占據(jù)了80%以上的市場(chǎng)份額,一直保持著無(wú)可匹敵的競(jìng)爭(zhēng)優(yōu)勢(shì)。然而,隨著美國(guó)對(duì)高性能芯片出口限制措施不斷加強(qiáng),國(guó)產(chǎn)AI芯片肩負(fù)起填補(bǔ)市場(chǎng)空缺的重要使命。

“我們也非常關(guān)注國(guó)產(chǎn)芯片的發(fā)展,據(jù)了解,國(guó)內(nèi)自研的大模型,甚至一些開(kāi)源的大模型都在不斷往國(guó)產(chǎn)芯片上去做移植。”

甄亞楠指出,現(xiàn)在從芯片使用角度來(lái)講,有些模型已經(jīng)可以跑通運(yùn)行了,需要追趕的方面主要在類似GPU這種高性能。

“整個(gè)的國(guó)產(chǎn)化是分層級(jí)的,芯片屬于硬件這一層,除此之外還有軟件的生態(tài)。對(duì)于國(guó)產(chǎn)的芯片來(lái)講,不管是框架還是生態(tài),都需要有一定的培育周期。”甄亞楠呼吁,最終的應(yīng)用方要給到國(guó)產(chǎn)芯片足夠的信心。他透露,目前澳門(mén)永利官網(wǎng)有專門(mén)的團(tuán)隊(duì),在國(guó)產(chǎn)芯片各類指導(dǎo)文檔比較齊全的情況下,歷時(shí)15~20天,開(kāi)展服務(wù)器基礎(chǔ)環(huán)境部署、性能測(cè)試到模型移植、性能優(yōu)化、加速庫(kù)替換等工作,可以幫助客戶完成國(guó)產(chǎn)算力的模型移植與部署!

甄亞楠坦言,從整個(gè)生態(tài)角度,需要硬件、軟件、模型企業(yè)共同努力!氨举|(zhì)上來(lái)講還是個(gè)非常復(fù)雜的系統(tǒng)性問(wèn)題,國(guó)產(chǎn)芯片是可以‘跑起來(lái)’,解決‘可用’的問(wèn)題,但剩下的性能問(wèn)題,也就是達(dá)到‘好用’的程度,則需要大家共同努力!

大模型算力供給是否存在困難?

紅星資本局注意到,從去年開(kāi)始,就有專家學(xué)者指出,大模型時(shí)代,智能算力成為“稀缺資產(chǎn)”。如何善用算力資源,發(fā)揮其最大效益,已經(jīng)成為每個(gè)參與者必須面對(duì)的挑戰(zhàn)。

甄亞楠認(rèn)為,對(duì)于大模型需求多少算力,應(yīng)用上有所區(qū)分。

比如,做基座大模型的企業(yè),對(duì)算力資源的總量要求比較高,可能動(dòng)輒就是5000卡,甚至萬(wàn)卡的規(guī)模,甄亞楠表示,目前能夠拿出空閑5000卡左右的算力資源的智算中心在國(guó)內(nèi)還是非常少的,所以基座大模型企業(yè)算力依然緊缺。特別是對(duì)于那些頂級(jí)的基座大模型研究企業(yè),目前缺卡的情況依然存在。

另外一類是行業(yè)大模型或者垂類大模型,一般都是在基座大模型的基礎(chǔ)之上,利用自有數(shù)據(jù)做微調(diào)。甄亞楠指出,這種對(duì)算力總量需求相對(duì)來(lái)講比較小,國(guó)內(nèi)有很多算力服務(wù)單位都可以滿足,這里存在的就是如何去優(yōu)選服務(wù)的問(wèn)題。

目前從大模型的算力供給量來(lái)講,是否還存在制約?甄亞楠認(rèn)為長(zhǎng)遠(yuǎn)看,供需關(guān)系會(huì)發(fā)生變化,但當(dāng)下,高端算力資源供貨周期不可控,導(dǎo)致其依然“難求”。

甄亞楠提到,算力中心的建設(shè)投入是最直接的“制約”,周期長(zhǎng),耗資巨大。另一方面,建設(shè)多大的算力資源池,與大模型企業(yè)的長(zhǎng)期規(guī)劃更是有直接關(guān)系。

“我們必須和企業(yè)保持及時(shí)且長(zhǎng)期的溝通,針對(duì)他們的業(yè)務(wù)發(fā)展走向,提前做布局。才能在規(guī)劃時(shí)間內(nèi)儲(chǔ)備足夠的算力資源池!

甄亞楠坦言,高端GPU算力資源需要各方努力!耙环矫嫖覀冏约航,另一方面我們也和國(guó)內(nèi)的運(yùn)營(yíng)商、地方政府在洽談,他們?cè)诮ㄔO(shè)算力方面有資金以及政策支持。算力共享在這個(gè)行業(yè)里會(huì)是大趨勢(shì),需要各方共同去謀求算力上的合作!


構(gòu)建云上科研工作環(huán)境

讓計(jì)算更簡(jiǎn)單,讓生活更美好

免費(fèi)試算
Sitemap