国产麻豆精品福利在线观看,亚洲人亚洲精品成人网站,亚洲熟妇无码AV另类VR影视,欧美A级毛欧美1级A大片免费播放

您的位置:首頁(yè) > 行業(yè) >

語(yǔ)言模型又迭代了 史上最大AI語(yǔ)言模型—GPT-3

2020-06-02 10:07:52 來(lái)源: 量子位

那個(gè)語(yǔ)言模型又迭代了,現(xiàn)在有1750億個(gè)參數(shù)。這個(gè)讓英偉達(dá)狂喜,讓調(diào)參師流淚的數(shù)字來(lái)自O(shè)penAI,史上最大AI語(yǔ)言模型——GPT-3。單單論文就有72

那個(gè)語(yǔ)言模型又迭代了,現(xiàn)在有1750億個(gè)參數(shù)。

這個(gè)讓英偉達(dá)狂喜,讓調(diào)參師流淚的數(shù)字來(lái)自O(shè)penAI,史上最大AI語(yǔ)言模型——

GPT-3。

單單論文就有72頁(yè)。

OpenAI表示,通過(guò)GPT-3,他們證明了無(wú)需梯度更新,無(wú)需微調(diào),規(guī)模更大的語(yǔ)言模型就可以大大改善無(wú)關(guān)任務(wù)和小樣本(few-shot)學(xué)習(xí)的性能,達(dá)到最先進(jìn)微調(diào)方法的水準(zhǔn)。

在部分任務(wù)中,甚至超越了最先進(jìn)微調(diào)方法。

不僅如此,這個(gè)語(yǔ)言模型,還能做加減法。

GPT-3是什么

不妨先來(lái)看看GPT-3的實(shí)際表現(xiàn)。

比如,先告訴GPT-3這樣一個(gè)示例:

“whatpu”是坦桑尼亞的一種小型、毛茸茸的動(dòng)物。一個(gè)使用whatpu造句的例子是:我們?cè)诜侵蘼眯袝r(shí),看到了非常可愛(ài)的whatpu。

此后不再給GPT-3任何特定任務(wù)提示,就向它拋出問(wèn)題:

“Burringo”是指加速度非??斓钠?chē)。一個(gè)使用Burringo造句的例子是:

GPT-3造出的句子是這樣的:

在我們的車(chē)庫(kù)里有一輛Burringo,我爸天天開(kāi)著它上下班。

至于編故事的能力,在500個(gè)詞的情況下,人類(lèi)判斷出其為AI生成的概率僅為52%。在最佳案例中,判斷準(zhǔn)確率甚至降到了12%。

能自己編故事、糾正英語(yǔ)語(yǔ)法,甚至,GPT-3還學(xué)會(huì)了3位數(shù)基本運(yùn)算。

表中,D{+,-}表示2、3、4、5位數(shù)加法或減法,2Dx代表2位數(shù)乘法,1DC代表1位數(shù)復(fù)合運(yùn)算。

無(wú)需微調(diào)

前文也說(shuō)到了,達(dá)到這樣的效果,不需要梯度更新,不需要微調(diào)。只需要指定任務(wù)、展示少量演示,來(lái)與模型文本交互,就能使其完成任務(wù)。

這樣一來(lái),一方面,對(duì)于新任務(wù),就不需要重新收集大量帶標(biāo)簽的數(shù)據(jù)。

另一方面,可以避免微調(diào)階段出現(xiàn)過(guò)擬合,導(dǎo)致模型泛化能力下降的問(wèn)題。

而實(shí)現(xiàn)的關(guān)鍵,總結(jié)起來(lái)就是:大力出奇跡。

不僅模型尺寸增大到了1750億,數(shù)據(jù)量也達(dá)到了45TB。V100嘛,是“微軟提供的高帶寬群集中的V100 GPU”。

研究人員將預(yù)訓(xùn)練模型在三種不同的設(shè)置下進(jìn)行了探索。

本文的重點(diǎn)放在零樣本、單樣本和小樣本學(xué)習(xí)上。研究人員沒(méi)有對(duì)GPT-3進(jìn)行微調(diào),不過(guò),論文談到,原則上是可以微調(diào)GPT-3的。

模型與架構(gòu)

具體到模型與架構(gòu),研究人員采用了與GPT-2相同的模型和架構(gòu),不過(guò),在tranformer各層中使用了交替稠密(alternating dense)和局部帶狀稀疏注意力(locally banded sparse attention)模式,類(lèi)似于Spare Transformer。

GPT-3的影響

知乎問(wèn)題「如何評(píng)價(jià)1700億參數(shù)的GPT-3」 的標(biāo)簽,已經(jīng)透露出玄機(jī)。

知乎用戶CloudySky就說(shuō),看了GPT-3,再看看自己 i9+2080ti+2TB 硬盤(pán)的臺(tái)式,想想有空還是打開(kāi)steam,趁打折多買(mǎi)幾個(gè)3A大作比較合適。

他還發(fā)出了靈魂一問(wèn):

有見(jiàn)過(guò)人用竄天猴去調(diào)試火箭發(fā)射井嘛?

復(fù)旦邱錫鵬教授則認(rèn)為,Pretrain+finetune仍然會(huì)是未來(lái)幾年的主流。

雖然如此恐怖的計(jì)算成本讓人有些望而卻步,但EECVC聯(lián)合創(chuàng)始人Dmytro Mishkin認(rèn)為:

按10年前的標(biāo)準(zhǔn),ResNet50的計(jì)算代價(jià)也是令人望而卻步的,但事實(shí)證明它們的存在是必要的。

也有網(wǎng)友表示:

GPT-3可能還是無(wú)法幫助OpenAI盈利,也無(wú)法直接上線顯著造福網(wǎng)民,但是從中積累的大模型訓(xùn)練經(jīng)驗(yàn)是OpenAI及其背后的微軟Azure一筆巨大的財(cái)富。這就像,人類(lèi)登上火星/月球可能并不能帶來(lái)直接的資源收益,但是從中積累的科學(xué)技術(shù)卻可以推動(dòng)人類(lèi)社會(huì)的發(fā)展。

做NLP,雖然有了資源不一定行,但是沒(méi)有資源現(xiàn)在肯定是不行了。

不管怎么說(shuō),看到這GPU熊熊燃燒的場(chǎng)面,想必老黃已經(jīng)樂(lè)開(kāi)了花。

目前,GPT-3尚未開(kāi)源,可以期待一下,OpenAI這回會(huì)擠多久牙膏了。

關(guān)鍵詞: GPT-3

精選 導(dǎo)讀

募資55億港元萬(wàn)物云啟動(dòng)招股 預(yù)計(jì)9月29日登陸港交所主板

萬(wàn)科9月19日早間公告,萬(wàn)物云當(dāng)日啟動(dòng)招股,預(yù)計(jì)發(fā)行價(jià)介乎每股47 1港元至52 7港元,預(yù)計(jì)9月29日登陸港交所主板。按發(fā)行1 167億股計(jì)算,萬(wàn)

發(fā)布時(shí)間: 2022-09-20 10:39
管理   2022-09-20

公募基金二季度持股情況曝光 隱形重倉(cāng)股多為高端制造業(yè)

隨著半年報(bào)披露收官,公募基金二季度持股情況曝光。截至今年二季度末,公募基金全市場(chǎng)基金總數(shù)為9794只,資產(chǎn)凈值為269454 75億元,同比上

發(fā)布時(shí)間: 2022-09-02 10:45
資訊   2022-09-02

又有上市公司宣布變賣(mài)房產(chǎn) 上市公司粉飾財(cái)報(bào)動(dòng)作不斷

再有上市公司宣布變賣(mài)房產(chǎn)。四川長(zhǎng)虹25日稱(chēng),擬以1 66億元的轉(zhuǎn)讓底價(jià)掛牌出售31套房產(chǎn)。今年以來(lái),A股公司出售房產(chǎn)不斷。根據(jù)記者不完全統(tǒng)

發(fā)布時(shí)間: 2022-08-26 09:44
資訊   2022-08-26

16天12連板大港股份回復(fù)深交所關(guān)注函 股份繼續(xù)沖高

回復(fù)交易所關(guān)注函后,大港股份繼續(xù)沖高。8月11日大港股份高開(kāi),隨后震蕩走高,接近收盤(pán)時(shí)觸及漲停,報(bào)20 2元 股。值得一提的是,在7月21日

發(fā)布時(shí)間: 2022-08-12 09:56
資訊   2022-08-12

萬(wàn)家基金再添第二大股東 中泰證券擬受讓11%基金股權(quán)

7月13日,中泰證券發(fā)布公告,擬受讓齊河眾鑫投資有限公司(以下簡(jiǎn)稱(chēng)齊河眾鑫)所持有的萬(wàn)家基金11%的股權(quán),交易雙方共同確定本次交易的標(biāo)的資

發(fā)布時(shí)間: 2022-07-14 09:39
管理   2022-07-14

央行連續(xù)7日每天30億元逆回購(gòu) 對(duì)債市影響如何?

央行12日再次開(kāi)展了30億元逆回購(gòu)操作,中標(biāo)利率2 10%。這已是央行連續(xù)7日每天僅進(jìn)行30億元的逆回購(gòu)縮量投放,創(chuàng)下去年1月以來(lái)的最低操作規(guī)

發(fā)布時(shí)間: 2022-07-13 09:38
資訊   2022-07-13

美元指數(shù)創(chuàng)近20年新高 黃金期貨創(chuàng)出逾9個(gè)月新低

由于對(duì)美聯(lián)儲(chǔ)激進(jìn)加息的擔(dān)憂,美元指數(shù)11日大漲近1%創(chuàng)出近20年新高。受此影響,歐美股市、大宗商品均走弱,而黃金期貨創(chuàng)出逾9個(gè)月新低。美

發(fā)布時(shí)間: 2022-07-13 09:36
資訊   2022-07-13

美股三大股指全線下跌 納斯達(dá)克跌幅創(chuàng)下記錄以來(lái)最大跌幅

今年上半年,美股持續(xù)回落。數(shù)據(jù)顯示,道瓊斯指數(shù)上半年下跌15 3%,納斯達(dá)克綜合指數(shù)下跌29 5%,標(biāo)普500指數(shù)下跌20 6%。其中,納斯達(dá)克連續(xù)

發(fā)布時(shí)間: 2022-07-04 09:51
推薦   2022-07-04

融資客熱情回升 兩市融資余額月內(nèi)增加超344億元

近期A股走強(qiáng),滬指6月以來(lái)上漲4%,融資客熱情明顯回升。數(shù)據(jù)顯示,截至6月16日,兩市融資余額1 479萬(wàn)億元,月內(nèi)增加344 67億元,最近一個(gè)半

發(fā)布時(shí)間: 2022-06-20 09:41
資訊   2022-06-20

4個(gè)交易日凈買(mǎi)入超百億元 北向資金持續(xù)流入A股市場(chǎng)

北向資金凈流入態(tài)勢(shì)延續(xù)。繼6月15日凈買(mǎi)入133 59億元后,北向資金6月16日凈買(mǎi)入44 52億元。自5月27日至今,除6月13日以外,北向資金累計(jì)凈

發(fā)布時(shí)間: 2022-06-17 09:37
推薦   2022-06-17

熱門(mén)TAG

more
美聯(lián)儲(chǔ)今年已將基準(zhǔn)利率從接近零大幅上調(diào)至略高于3% EIA報(bào)告:美國(guó)原油庫(kù)存及戰(zhàn)略儲(chǔ)備減少,汽油及精煉油庫(kù)存輕微波動(dòng) 美國(guó)政府更廣泛推動(dòng)從汽油動(dòng)力汽車(chē)轉(zhuǎn)向電動(dòng)汽車(chē)的一部分 數(shù)據(jù)顯示:今年9月日本船企接單量延續(xù)8月下跌下跌趨勢(shì) 公告顯示:2022年前三季度TCL中環(huán)研發(fā)投入為27億元 占比營(yíng)業(yè)收入5.42% 新的111.75億英鎊注資列在“對(duì)金融機(jī)構(gòu)的援助—支付給英格蘭銀行”標(biāo)題下 本次政府儲(chǔ)備肉投放面向北京18家主要連鎖超市門(mén)店及相關(guān)零售終端投放 有交易員預(yù)計(jì):如果LME不采取措施 接下來(lái)可能將有數(shù)十萬(wàn)噸鋁流入LME 據(jù)報(bào)道:繼德國(guó)最大釀酒商拉德貝格啤酒公司9月宣布漲價(jià) 據(jù)報(bào)道:澳大利亞礦商Pilbara的鋰礦拍賣(mài)價(jià)再創(chuàng)新高 折算后的碳酸鋰成本 中集天達(dá)首次公開(kāi)發(fā)行A股股票 招股書(shū)顯示此次擬公開(kāi)發(fā)行股數(shù)不超過(guò)103, 多家銀行加強(qiáng)綠色金融頂層設(shè)計(jì) 致力于為經(jīng)濟(jì)社會(huì)綠色低碳轉(zhuǎn)型貢獻(xiàn)力量 萊特幣 比特幣 數(shù)字資產(chǎn) 火幣 以太經(jīng)典 比特股 EOS 比特幣現(xiàn)金 量子鏈 Hcash 泰達(dá)幣 瑞波幣 Qcash 比特幣鉆石 超級(jí)比特幣 優(yōu)幣 硬分叉 加密貨幣