米樂M6:Meta推出新版自研AI芯片:性能較上代提高三倍,降低對英偉達(dá)依賴
作者:米樂發(fā)布時間:2024-12-27
AI(人工智能)芯片緊缺之際,越來越多科技巨頭選擇自行研發(fā)。
當(dāng)?shù)貢r間4月10日,社交巨頭Meta公布了自主研發(fā)芯片MTIA的最新版本。MTIA是Meta專門為AI訓(xùn)練和推理工作設(shè)計的定制芯片系列。和去年五月官宣的Meta第一代AI推理加速器MTIA v1相比,最新版本芯片在性能上有顯著提升,專為Meta旗下社交軟件的排名和推薦系統(tǒng)而設(shè)計。分析指出,Meta的目標(biāo)是降低對英偉達(dá)等芯片廠商的依賴。
10日當(dāng)天,Meta(Nasdaq:META)股價收于每股519.83美元,漲0.57%,總市值1.33萬億美元米樂M6。Wind數(shù)據(jù)顯示,自今年年初以來,Meta股價已漲超47%。
從名字來看,MTIA即為“Meta訓(xùn)練與推理加速器(Meta Training and Inference Accelerator)”的縮寫。盡管含有“訓(xùn)練”二字,這款芯片實際上并不是為AI訓(xùn)練所優(yōu)化的,而是專注于推理,即在生產(chǎn)過程中運(yùn)行AI模型的任務(wù)。
Meta在博客文章中寫道,MTIA是公司“長期計劃的重要組成部分”,旨在Meta的服務(wù)中使用AI來構(gòu)建基礎(chǔ)設(shè)施:“為了實現(xiàn)我們對定制芯片的雄心,這意味著不僅要投資于計算芯片,還要投資于內(nèi)存帶寬、網(wǎng)絡(luò)和容量以及其他下一代硬件系統(tǒng)?!?/p>
Meta新款MTIA芯片。來源:Meta官網(wǎng)
據(jù)介紹,新款MTIA芯片“從根本上專注于提供計算、內(nèi)存帶寬和內(nèi)存容量的適當(dāng)平衡”。初代MTIA v1芯片采用臺積電的7nm制程工藝,而新款 MTIA 芯片采用臺積電的5nm工藝,擁有更多的處理核心。該芯片將擁有256MB的片上內(nèi)存,頻率為1.3GHz,而MTIA v1的片上內(nèi)存為128MB和800GHz。Meta的早期測試結(jié)果顯示,通過測試兩種芯片的“四個關(guān)鍵模型”的性能,新芯片的性能是一代版本的三倍。
在硬件方面,為了支持下一代芯片,Meta開發(fā)了一個大型機(jī)架式系統(tǒng),最多可容納72個加速器。它由三個機(jī)箱組成,每個機(jī)箱包含12個板,每個板包含兩個加速器。該系統(tǒng)可以將芯片的時鐘頻率從初代的800 MHz提高至1.35GHz,并以90瓦的功率運(yùn)行,而初代設(shè)計的功耗為25瓦。
Meta為MTIA開發(fā)的大型機(jī)架式系統(tǒng)。來源:Meta官網(wǎng)
在軟件方面,Meta強(qiáng)調(diào),新芯片系統(tǒng)運(yùn)行的軟件堆棧與 MTIA v1非常類似,加快團(tuán)隊的部署速度。此外,新的MTIA與為MTIA v1開發(fā)的代碼兼容,由于Meta已經(jīng)將完整的軟件堆棧集成到芯片中,開發(fā)者在幾天內(nèi)就可以使用這款新芯片啟動并運(yùn)行Meta的流量,使Meta能夠在九個月的時間內(nèi)將芯片落地到16個地區(qū),運(yùn)行生產(chǎn)模型。
根據(jù)Meta的總結(jié),迄今為止的測試結(jié)果表明,這款MTIA芯片可以處理作為Meta產(chǎn)品組件的低復(fù)雜性 (LC) 和高復(fù)雜性 (HC) 排名以及推薦模型:“因為我們控制整個堆棧,與商用GPU相比,我們可以實現(xiàn)更高的效率?!?/p>
目前,新款MTIA芯片已被部署在Meta的數(shù)據(jù)中心,并展現(xiàn)出了積極成果:“公司能夠為更密集的AI工作負(fù)載投入并投資更多的算力。事實證明,在針對元特定工作負(fù)載提供性能和效率的最佳組合方面,該芯片與商用GPU具有高度互補(bǔ)性?!?/p>
今年2月,已有外媒透露了關(guān)于第二代MTIA芯片的消息,稱Meta擬在今年投產(chǎn)被內(nèi)部稱為“阿爾忒彌斯(Artemis)”的AI芯片,以進(jìn)一步加速公司在AI領(lǐng)域內(nèi)的擴(kuò)張。當(dāng)時,Meta發(fā)言人確認(rèn)該計劃屬實,稱該芯片將與Meta采購到的數(shù)十萬個GPU協(xié)同工作。
隨著AI競賽加劇,高性能的AI芯片變得越來越搶手。今年1月18日,Meta的CEO馬克·扎克伯格曾高調(diào)宣布,Meta正在計劃構(gòu)建自己的AGI(通用人工智能),計劃在今年年底前獲得約35萬塊來自英偉達(dá)的H100 GPU,再算上其他GPU,公司擁有的算力總和將接近于60萬塊H100所能提供的算力米樂m6網(wǎng)址。即使按照明星芯片H100的最低售價25000美元來計算,Meta仍將為35萬塊H100支付約87.5億美元的支出。
當(dāng)然,Meta并不是唯一一家將目光轉(zhuǎn)向自研芯片的科技巨頭。就在幾天前,谷歌宣布其正在制造基于ARM架構(gòu)的定制CPU,名為“Axion” ,計劃讓其支持谷歌云上的YouTube廣告等服務(wù),并將于2024年晚些時候上市。此前,微軟和亞馬遜也都開始研發(fā)能夠處理AI任務(wù)的定制芯片。
市場研究機(jī)構(gòu)CFRA的分析師表示,這些大型科技公司正在面臨成本上的壓力,需要靠自研芯片來加以緩解。盡管這些芯片對于公司來說是“必要的”,它們在性能上可能無法追上英偉達(dá)最新的Blackwell平臺產(chǎn)品。