昨晚,微軟 Build 2020 大會發(fā)布的超級計(jì)算機(jī)則無疑成為了 Azure 在 AI 方面的一把利器,擁有超過 285000 個(gè) CPU 內(nèi)核、10000 個(gè) GPU 和 400Gbps
昨晚,微軟 Build 2020 大會發(fā)布的超級計(jì)算機(jī)則無疑成為了 Azure 在 AI 方面的一把利器,擁有超過 285000 個(gè) CPU 內(nèi)核、10000 個(gè) GPU 和 400Gbps 的網(wǎng)絡(luò)連接,居于世界超算 Top5 之列。
云計(jì)算廠商之所以需要大刀闊斧地建立超算中心,其原因在于通過云化的形式和高效的軟件服務(wù),云計(jì)算廠商可以將超大規(guī)模的計(jì)算力共享給客戶,重復(fù)利用,靈活調(diào)度,以獲得最大的經(jīng)濟(jì)效益。
目前,微軟的超級計(jì)算機(jī)主要用于訓(xùn)練超大規(guī)模 AI 模型(這同時(shí)也是 OpenAI 的強(qiáng)項(xiàng)),與上一代 AI 模型相比,超大型 AI 模型是對現(xiàn)有 AI 模型的升級,它具有自我監(jiān)督的優(yōu)勢,這意味著它們可以通過暴露數(shù)據(jù)各部分之間的關(guān)系來從數(shù)據(jù)生成標(biāo)簽,這被認(rèn)為對實(shí)現(xiàn)人類智能至關(guān)重要。
受新冠疫情的影響,門票原本為 2395 美元的微軟 Build 2020 完全在線上舉行。
雖然變?yōu)榫€上舉行,但微軟對于 Build 2020 依舊充滿了誠意,納德拉這樣說道:這是另一種以新方式交付的 Microsoft Build。舉辦數(shù)字活動為開發(fā)人員社區(qū)提供了難得的機(jī)會,他們可以聚在一起以獲得真正的全球體驗(yàn)。而由此 Build 2020 也比以往更加注重開發(fā)人員。
比肩全球 Top 5 的 AI 超級計(jì)算機(jī)、Windows 應(yīng)用生態(tài) UI 和 API 大統(tǒng)一、Edge 瀏覽器多項(xiàng)功能更新、Microsoft Teams 大升級、諸多基于 Azure 云計(jì)算的功能更新……一連串的產(chǎn)品發(fā)布、升級,也讓 Build 2020 有了頗多看點(diǎn)。
一 聯(lián)手 OpenAI,自研超算中心
毫無疑問的是,在這場硬核的開發(fā)者大會上,微軟與 OpenAI 共同構(gòu)建的 AI 超級計(jì)算機(jī)吸引了最多的眼球,被微軟稱之為可躋身全球前五。
2019 年 7 月 22 日,微軟宣布將向 OpenAI 投資 10 億美元,以共同開發(fā)用于 Microsoft Azure 云平臺的新技術(shù),作為交換,OpenAI 同意將其部分知識產(chǎn)權(quán)許可給 Microsoft,然后該公司將其商業(yè)化并出售給合作伙伴,并在 OpenAI 致力于開發(fā)下一代計(jì)算硬件時(shí)在 Azure 上訓(xùn)練和運(yùn)行 AI 模型。
OpenAI LP CEO、原 YC 總裁 Sam Altman 與微軟公司 CEO 薩提亞·納德拉(Satya Nadella)
在微軟的 Build 2020 開發(fā)者大會上,合作伙伴關(guān)系的第一個(gè)成果以一臺新型超級計(jì)算機(jī)的形式得以展示。
該計(jì)算機(jī)專為訓(xùn)練 OpenAI 的 AI 模型而設(shè)計(jì),是單個(gè)系統(tǒng),算力十分強(qiáng)大,它擁有超過 285000 個(gè) CPU 內(nèi)核、10000 個(gè) GPU 和 400Gbps 的網(wǎng)絡(luò)連接。
根據(jù)「TOP 500」組織編制的全球超級計(jì)算機(jī) 500 強(qiáng)榜單顯示,算力排名前五的計(jì)算怪獸分別包括:
1)美國橡樹嶺國家實(shí)驗(yàn)室的Summit系統(tǒng)(148.6 petaflops);
2)Lawrence Livermore國家實(shí)驗(yàn)室的Sierra(94.6 petaflops);
3)由中國國家并行計(jì)算機(jī)工程與技術(shù)研究中心(NRCPC)開發(fā)的“神威-太湖之光”超級計(jì)算機(jī)(93.0 petaflops)
4)由中國國防科技大學(xué)(NUDT)開發(fā)的天河2A(61.4 petaflops)
5)戴爾制造的Frontera Dell C6420(23.5 petaflops)。
微軟表示,與世界 TOP500 超級計(jì)算機(jī)相比可比肩 Top 5,則意味著它在中國國家超級計(jì)算機(jī)中心的天河 2A 后面,在德克薩斯高級計(jì)算機(jī)中心的 Frontera 之前,其算力峰值每秒可以執(zhí)行 23.5 到 61.4 個(gè)萬億浮點(diǎn)運(yùn)算。
從性能上來說,得益于在 Azure 上托管,這臺超級計(jì)算機(jī)擁有現(xiàn)代云計(jì)算基礎(chǔ)設(shè)施的各種優(yōu)點(diǎn),包括快速部署、可持續(xù)發(fā)展的數(shù)據(jù)中心、并可以訪問所有 Azure 服務(wù)。
超高性能將用來訓(xùn)練更高級別的超大規(guī)模人工智能模型,并為機(jī)構(gòu)和開發(fā)人員提供了超大型 AI 模型和訓(xùn)練這一模型所需的架構(gòu)。
通過培訓(xùn)優(yōu)化工具和超級計(jì)算資源,數(shù)據(jù)科學(xué)家和商業(yè)客戶便可以輕松利用 Scale AI 功能。深入了解語言語法,識別概念中的差別,完成復(fù)雜任務(wù)。
所謂超大型人工智能模型是針對小型模型而言的,小型人工智能模型使用許多帶有標(biāo)簽的示例來學(xué)習(xí)單個(gè)任務(wù),例如在語言之間進(jìn)行翻譯,識別對象等。
而超大型模型可以通過檢查數(shù)十億頁的公開文本來學(xué)習(xí)。這種類型的模型可以如此深入地吸收語言,語法,知識,概念和上下文的細(xì)微差別,以至于可以勝任多項(xiàng)任務(wù):總結(jié)冗長的講話,調(diào)節(jié)實(shí)時(shí)游戲聊天中的內(nèi)容,在成千上萬個(gè)法律文件中甚至找到相關(guān)段落從搜尋 GitHub 生成代碼。
超大型 AI 模型以新的方式來學(xué)習(xí)文本 Craighton Berman 的藝術(shù)
「這些模型令人興奮的是它們將實(shí)現(xiàn)的功能的廣度。」,潛在的好處遠(yuǎn)遠(yuǎn)超出了一種 AI 模型的微小進(jìn)步。微軟首席技術(shù)官凱文·斯科特(Kevin Scott)說?!高@是關(guān)于能夠一次在自然語言處理中完成一百項(xiàng)令人興奮的事情,以及在計(jì)算機(jī)視覺中完成一百項(xiàng)令人興奮的事情,當(dāng)您開始看到這些感知領(lǐng)域的組合時(shí),您將擁有很難的新應(yīng)用程序甚至現(xiàn)在都無法想象?!?/p>
另外,從技術(shù)角度來看,超大型模型具有「自我監(jiān)督」的優(yōu)勢,優(yōu)于大型模型。在所謂的「自我監(jiān)督」學(xué)習(xí)中,這些 AI 模型可以通過檢查 Internet 上數(shù)十億頁的公共文檔(維基百科條目,自出版的書籍,說明手冊,歷史課程,人力資源指南)來學(xué)習(xí)語言。
這些改進(jìn)有點(diǎn)像從基礎(chǔ)閱讀水平跳到對語言的更復(fù)雜和細(xì)微的理解。
此外,自我監(jiān)督也意味著它們可以通過暴露數(shù)據(jù)各部分之間的關(guān)系來從數(shù)據(jù)生成標(biāo)簽,這被認(rèn)為對實(shí)現(xiàn)人類智能至關(guān)重要。
二 開源全球最大語言模型
毫無疑問的是,用于設(shè)計(jì)超級計(jì)算機(jī)的軟件工具都可能為 Microsoft 帶來新的市場機(jī)會。通過規(guī)?;?AI 計(jì)劃,這家科技巨頭正在提供資源,以優(yōu)化的方式在 Azure AI 加速器和網(wǎng)絡(luò)上訓(xùn)練大型模型。
Microsoft 一直有自己的大型 AI 模型家族,今年早些時(shí)候,它還向研究人員開源了世界上最大的公開可用的 AI 語言模型,即用于自然語言生成 的 Microsoft Turing 模型。該模型已用于改善 Bing,Office,Dynamics 和其他生產(chǎn)力產(chǎn)品的許多不同的語言理解任務(wù)。
這些模型家族只需使用大量數(shù)據(jù)和超級計(jì)算資源對其進(jìn)行一次培訓(xùn),公司便可以采用「經(jīng)過預(yù)訓(xùn)練」的模型,并可以使用更小的數(shù)據(jù)集和資源對不同的任務(wù)進(jìn)行微調(diào)。
例如,過去一年中,基于自然語言理解的「微軟圖靈模型(Microsoft Turing)」用于改善各種生產(chǎn)力產(chǎn)品。它在 Bing 中 具有顯著先進(jìn)的字幕生成和問答功能,在某些市場中將搜索問題的答案提高了多達(dá) 125%。
在 Office 中,同一模型推動了智能查找功能的發(fā)展 ,從而使在 Word 中的搜索更加輕松,Key Insights 功能可提取重要的句子以快速定位 Word 中的關(guān)鍵點(diǎn),而 Outlook 的「建議的答復(fù)」功能會自動生成對電子郵件的可能答復(fù)。Dynamics 365 Sales Insights 還使用它根據(jù)與客戶的互動向賣方建議操作。
對于希望訓(xùn)練超大型 AI 模型但又不需要專用超級計(jì)算機(jī)的客戶,微軟還提供了以分布式和優(yōu)化方式在這些集群上訓(xùn)練大型 AI 模型的工具。通過一組同樣為超級計(jì)算機(jī)提供動力的 AI 加速器和網(wǎng)絡(luò)提供了對強(qiáng)大計(jì)算的訪問 。
在 Build 會議上,Microsoft 宣布它將很快開始開放其 Microsoft Turing 模型以及在 Azure 機(jī)器學(xué)習(xí)中對其進(jìn)行培訓(xùn)的原材料的開源。
微軟首席項(xiàng)目經(jīng)理 Phil Waymouth 說:「我們希望能夠構(gòu)建這些非常先進(jìn)的 AI 技術(shù),使人們最終可以輕松地使用它們來幫助他們完成工作并更快地實(shí)現(xiàn)目標(biāo)?!?/p>
云計(jì)算廠商之所以需要大刀闊斧地建立超算中心,其原因在于通過云化的形式和高效的軟件服務(wù),云計(jì)算廠商可以將超大規(guī)模的計(jì)算力共享給客戶,重復(fù)利用,靈活調(diào)度,以獲得最大的經(jīng)濟(jì)效益。
比如部署在國家超算廣州中心的天河二號,研究人員根據(jù)應(yīng)用的需求以及實(shí)際的硬件環(huán)境,對開源的 OpenStack 進(jìn)行大量的定制和優(yōu)化,并結(jié)合容器技術(shù),打造企業(yè)級解決方案 KylinCloud 云平臺,為政府部門和企事業(yè)單位的信息化建設(shè)和大數(shù)據(jù)處理提供資源支撐。
事實(shí)上,從部署規(guī)模的維度來看,云計(jì)算的底層也是一種超級計(jì)算機(jī)——通過數(shù)據(jù)中心級操作系統(tǒng),把不同地域的超大規(guī)模的物理服務(wù)器,聚合成一臺超級計(jì)算機(jī),統(tǒng)一調(diào)度和使用。所以,現(xiàn)在云計(jì)算和超算更像是不同維度的概念,前者側(cè)重信息技術(shù)的交付模式,后者側(cè)重體現(xiàn)系統(tǒng)的構(gòu)建。
三 搶下云計(jì)算 AI 第一把交椅?
全世界的科技巨頭在云端的戰(zhàn)火不斷升級,而云計(jì)算對于微軟和納德拉來說,其意義更為重要。
在鮑爾默宣布要退休的時(shí)候,微軟 CEO 這個(gè)職位沒被當(dāng)作一個(gè)美差。彭博社甚至還發(fā)表了一篇標(biāo)題為「為什么你不想成為微軟的首席執(zhí)行官」的文章。而納德拉就在這樣的危機(jī)存亡時(shí)刻,接手微軟,此時(shí)的微軟市值縮減到 3000 多億美元,不及 1999 年微軟輝煌時(shí)刻的一半。
在納德拉接手微軟之后,云計(jì)算成為微軟的「重頭戲」,微軟的股價(jià)也在納德拉的努力之下,不僅達(dá)到了 1999 年巔峰的 6000 億美元市值,更是不斷上漲直到現(xiàn)在的 1.39 萬億美元。
在全球云市場,微軟目前市場占有率第二,占有 17.9% 的市場份額,僅次于巨頭亞馬遜。在競爭激烈的云市場中,AI 算力或許會成為巨頭們的下一法寶。
眾所周知,在當(dāng)今 AI 技術(shù)研發(fā)和產(chǎn)業(yè)落地過程中,所需「算力」逐年遞增。根據(jù) OpenAI 發(fā)布的 AI 計(jì)算量報(bào)告,自 2012 年以來,AI 計(jì)算量每年增長 10 倍,而從 AlexNet 到 AlphaGo Zero,最先進(jìn) AI 模型對計(jì)算量的需求已經(jīng)增長了 30 萬倍。
在云計(jì)算 Top5 公司中,據(jù) CCS Insight 調(diào)查報(bào)告顯示,擁有 AlphaGo 的谷歌在 AI 領(lǐng)域一直處于領(lǐng)先的地位,領(lǐng)先于微軟等其他科技巨頭。
對于微軟來說,在 Azure 推出 AI 超算平臺,提升了 Azure AI 服務(wù),并通過 GitHub 提供其大型 AI 模型,通過可以為客戶提供差異化的服務(wù),提升了微軟在 AI 領(lǐng)域的服務(wù)能力,吸引更多開發(fā)者使用 Azure。而谷歌在 AI 領(lǐng)域的優(yōu)勢或?qū)⒉粡?fù)存在。
微軟首席技術(shù)官凱文·斯科特(Kevin Scott)表示:「通過開發(fā)用于訓(xùn)練大型 AI 模型的領(lǐng)先基礎(chǔ)架構(gòu),我們使所有 Azure 變得更好?!埂肝覀冋诮ㄔ旄玫挠?jì)算機(jī),更好的分布式系統(tǒng),更好的網(wǎng)絡(luò),更好的數(shù)據(jù)中心。所有這些使整個(gè) Azure 云的性能,成本和靈活性更好?!?/p>
關(guān)鍵詞: 微軟