“隨著AI從1.0進入2.0大模型技術階段,我們迎來了有史以來最重要的科技革命和平臺革命。”零一萬物CEO、創(chuàng)新工場董事長李開復日前在接受記者采訪時表示,算力作為AI 2.0發(fā)展的關鍵環(huán)節(jié),需要采用更務實、更統(tǒng)籌優(yōu)化的方法來應對當前的挑戰(zhàn)。未來,期待著人工智能尖端企業(yè)能夠更廣泛、深入?yún)⑴c到國家AI算力建設中來,各方優(yōu)勢資源充分融合,更好賦能AI大模型產(chǎn)業(yè)發(fā)展。
“多地正在積極建設超算中心,打造國家級的算力底座,促進超算算力一體化運營,是非常好的探索和嘗試?!崩铋_復認為,超算中心匯聚云計算、大數(shù)據(jù)和人工智能研發(fā)等多重功能及要素,聚集了豐富的AI發(fā)展資源和動能,未來可期。如何更好發(fā)揮各方優(yōu)勢構建超強AI算力,或可從以下四個方面入手:
首先,遵循規(guī)模定律(Scaling Law),提升計算效率。大模型規(guī)模定律的重要性在這個時代得以凸顯——人類能夠用更多計算和數(shù)據(jù)不斷增加大模型的智慧,這條被多方驗證的路徑還在推進中,還遠沒有觸達天花板。
同時,大模型的智慧來自于接近無損的壓縮,這點也非常重要。因為規(guī)模定律過程中不能盲目堆更多的GPU,所以需要有一個方法評估大模型企業(yè)有沒有越做越好或者哪個方法做得更好。遵循規(guī)模定律也成為當前諸多大模型企業(yè)規(guī)?;瘧么竽P蜁r嘗試突破算力限制,將計算效率最優(yōu)化的有效途徑之一。
零一萬物內(nèi)部有嚴謹?shù)南嚓P方法論,且用壓縮的理念去評估,讓以往漫無目的訓模過程變得更系統(tǒng)、更科學并有數(shù)學根據(jù),較大提升了自身大模型的計算效率。
第二,加強“?;步ā?,尋找算力最優(yōu)解。目前,發(fā)達國家AI領域GPU的數(shù)量和規(guī)模是我國的數(shù)倍左右,面對這樣的差距,我們需要采取更務實有效的舉措——自研AI Infra(AI Infrastructure人工智能基礎架構技術)。AI Infra主要涵蓋大模型訓練和部署提供各種底層技術設施。在國外一線大廠,最高效訓練模型的方式是算法與Infra共建,不僅關注模型架構,而是從優(yōu)化底層訓練方法出發(fā)。零一萬物自成立起便將自研AI Infra設立為重要方向,選擇跟國際一線梯隊齊平的“?;步ā睉?zhàn)略,模型團隊和AI Infra團隊高度共建,人數(shù)比為1:1。零一萬物在此基礎上自研了人工智能基礎架構技術,從底層優(yōu)化訓練方法,較大節(jié)省成本,找到了當前條件下算力運用的優(yōu)質(zhì)路徑。從零一萬物國際領先的千億參數(shù)大模型“Yi-Large”訓練過程來看,經(jīng)優(yōu)化后,Yi-Large千億參數(shù)模型的訓練成本同比大幅下降。
第三,打造“模應一體”,探尋TC-PMF(Product-Market-Technology-Cost Fit,技術成本×產(chǎn)品市場契合度)。在大模型時代,模型訓練和推理成本構成了幾乎每個創(chuàng)業(yè)公司都必須要面對的增長陷阱。用戶增長需要優(yōu)質(zhì)的應用,而優(yōu)質(zhì)應用離不開強大的基座模型,強大基座模型的背后往往是高昂的訓練成本,接著還需要考慮隨用戶規(guī)模增長的推理成本。能夠率先察覺、并達到 TC-PMF這一普惠點的企業(yè)無疑會占盡先機。要做到這一點,模型、AI Infra、應用這“三位一體”的優(yōu)異能力缺一不可。基于此,零一萬物將“模應一體”與“模基共建”一同列為公司的頂層核心戰(zhàn)略,在人才密度和協(xié)作方式上,也快速打磨出一整套能夠融合不同專業(yè)的優(yōu)秀人才跨界共創(chuàng)的組織體系。基座模型、AI Infra、API、C端應用AI助手“萬知”,這些全棧式業(yè)務部署,使得零一萬物能夠以更全面的視野來看待大模型時代的增長陷阱,也為其在應用層的商業(yè)落地帶來了更大發(fā)揮空間。
第四,充分發(fā)揮尖端AI企業(yè)示范優(yōu)勢。李開復認為,我國在發(fā)展AI算力等領域具有一定優(yōu)勢。除了豐富的大數(shù)據(jù)資源外,我國的社會資源動員力、融合度較高,在科研、應用領域的研發(fā)效率、落地效果較好。同時,我國有非常多卓越的互聯(lián)網(wǎng)企業(yè)和現(xiàn)象級App應用,比如抖音、美團等等,這些企業(yè)在AI算力、算法領域的探索有用戶支持作為基礎,企業(yè)更易研發(fā)出更具有前瞻性、應用性的應用,是AI大模型產(chǎn)業(yè)發(fā)展的重要推力?!拔磥?,希望國家級超算中心、國內(nèi)可靠尖端AI企業(yè)、多領域企業(yè)間能夠增強資源的整合利用,充分發(fā)揮各方優(yōu)勢,更好融合發(fā)展,為AI更好賦能千行百業(yè)發(fā)展再添新動能?!?/p>