ChatGPT爆火，中美AI差距拉大到什么程度？

Insigne · 發(fā)表于 2023-3-27 09:31:05

3月16日，李彥宏站在舞臺(tái)聚光燈下,，感受著全球科技從業(yè)者目光的注視，風(fēng)頭一時(shí)無(wú)兩,。

3年前,，同一個(gè)場(chǎng)景，他也曾這么出風(fēng)頭過(guò),，但當(dāng)時(shí)是因?yàn)橐黄繌念^澆下的礦泉水。

這一次他顯然信心十足,。預(yù)熱了幾個(gè)月,，只要“文心一言”一發(fā)布，在ChatGPT掀起全球AIGC(生成式AI)狂潮乃至狂熱的當(dāng)下,，百度就將成為全球第2個(gè)觸摸到未來(lái)的科技先鋒,。

沒(méi)想到，發(fā)布當(dāng)天,，李彥宏在臺(tái)上說(shuō),，百度股價(jià)在板上跌。

無(wú)論是發(fā)布會(huì)前一天OpenAI不講武德地推出了革新的GPT-4模型,，還是發(fā)布會(huì)上缺少實(shí)機(jī)演示,，亦或是第一批嘗鮮的用戶(hù)輸入“愛(ài)國(guó)”結(jié)果畫(huà)出星條旗，都沉重打擊了市場(chǎng)信心。

發(fā)布會(huì)開(kāi)始不到20分鐘,，百度港股股價(jià)就暴跌超9.8%,，后來(lái)股價(jià)略有上升，但跌幅仍超5%,。不出意料,，微博、知乎迅速出現(xiàn)了一片嘲笑聲,，“百度股價(jià)跳水”被送上熱搜,，線上線下彌漫著快活的空氣。

然而,，僅過(guò)了一晚上,，股市完全變了。3月17日港股開(kāi)盤(pán)后,，百度幾乎是直線拉升,，日內(nèi)繼續(xù)波動(dòng)上漲，全天漲幅近15%,。隨后幾天,，余威未消，百度股價(jià)繼續(xù)上漲,，目前已經(jīng)回到年內(nèi)高位,。

事實(shí)上，業(yè)界很快回味過(guò)來(lái)了,。

文心一言雖然比GPT4差得遠(yuǎn),，甚至比不上GPT3.5的ChatGPT，但依然是能用的,。各種讓人啼笑皆非的產(chǎn)出結(jié)果恰恰證實(shí)了技術(shù)的真實(shí)性,，沒(méi)有弄虛作假，這就夠了,。只要是真的,，花錢(qián)花時(shí)間，總能迭代到好用的時(shí)候,。

況且要論落后,，落后第1名，那也是行業(yè)第2,，在一個(gè)公認(rèn)前途無(wú)量的領(lǐng)域做到世界第2,，不強(qiáng)么?

風(fēng)向一下子變了，這下壓力來(lái)到了其他互聯(lián)網(wǎng)大廠一邊：

一直被嘲諷“掉隊(duì)”的百度做出來(lái)了文心一言,，你們?cè)诟墒裁?

1,、第四波浪潮?

不能完全怪其他大廠不努力,，從歷史來(lái)看，過(guò)去AI發(fā)展經(jīng)歷了3波高潮,，但總體來(lái)看,，雷聲大，雨點(diǎn)小,。

人工智能概念的提出始于1956年的美國(guó)達(dá)特茅斯會(huì)議,，1959年Arthur Samuel提出了機(jī)器學(xué)習(xí)，推動(dòng)人工智能進(jìn)入第一個(gè)發(fā)展高潮期,，但因?yàn)閷?duì)現(xiàn)實(shí)問(wèn)題束手無(wú)策而衰退,。這個(gè)階段，AI只會(huì)依據(jù)規(guī)則證明中學(xué)數(shù)學(xué)定理,。

此后70年代末期出現(xiàn)了專(zhuān)家系統(tǒng),，標(biāo)志著人工智能從理論研究走向?qū)嶋H應(yīng)用。80年代到90年代隨著美國(guó)和日本立項(xiàng)支持人工智能研究,，人工智能進(jìn)入第二個(gè)發(fā)展高潮期,，期間人工智能相關(guān)的數(shù)學(xué)模型取得了一系列重大突破，如著名的多層神經(jīng)網(wǎng)絡(luò),、BP反向傳播算法等,，算法模型準(zhǔn)確度和專(zhuān)家系統(tǒng)進(jìn)一步提升。

然而在這個(gè)階段,，AI的能力上限也只是下贏國(guó)際象棋,。

新世紀(jì)以來(lái)，互聯(lián)網(wǎng)將人類(lèi)代入大數(shù)據(jù)時(shí)代,，深度學(xué)習(xí)算法的出現(xiàn)和強(qiáng)化,，GPU、NPU,、FPGA等芯片技術(shù)帶來(lái)的算力突破,，共同推動(dòng)了AI第三次浪潮的出現(xiàn)。

2018年,，新的里程碑出現(xiàn),。

谷歌推出大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型BERT，通過(guò)3億參數(shù)量的訓(xùn)練,，在機(jī)器閱讀理解頂級(jí)水平測(cè)試SQuAD1.1的2個(gè)衡量指標(biāo)上全面超越人類(lèi)，并在11種不同的NLP測(cè)試中達(dá)到SOTA(業(yè)內(nèi)最佳)表現(xiàn),，宣布了大模型時(shí)代的到來(lái),。

次年，OpenAI迅速跟進(jìn),，將GPT-1的1.17億參數(shù)量迭代至GPT-2的15億,，在沒(méi)有對(duì)模型結(jié)構(gòu)做出過(guò)多創(chuàng)新的情況下,，實(shí)現(xiàn)了超強(qiáng)的內(nèi)容生成能力。

又過(guò)了1年,，現(xiàn)在已經(jīng)家喻戶(hù)曉的GPT-3誕生,，大模型參數(shù)量暴漲到1750億，系統(tǒng)出現(xiàn)了從量變到質(zhì)變的跨越,。在優(yōu)化和熟識(shí)1年多后,，OpenAI將基于GPT-3.5的ChatGPT推向市場(chǎng)，轟動(dòng)了全世界,。

推出短短5天內(nèi)注冊(cè)用戶(hù)量就超過(guò)100萬(wàn),，2個(gè)月后突破1個(gè)億，平均每天1300萬(wàn)獨(dú)立訪客使用,，ChatGPT不僅自己打破記錄,，還掀起了一波全球性狂潮。

在同行還沒(méi)反應(yīng)過(guò)來(lái)的時(shí)候,，OpenAI又以迅雷不及掩耳之勢(shì)推出了GPT-4,。雖然沒(méi)有公布詳細(xì)參數(shù)，但其實(shí)際使用體驗(yàn)的巨大提升,，再次震動(dòng)了行業(yè),。

在智能化水平上，GPT-4和之前的模型產(chǎn)生了天壤之別,。比如說(shuō),，在美國(guó)大學(xué)先修課程微積分BC考試中，GPT-4獲得4分(滿分5分),，而GPT-3獲得1分,。GPT-3.5是GPT-3和GPT-4的中間模型，也獲得4分,。

模擬律師考試方面,，GPT-4以排名前10%的成績(jī)通過(guò)，GPT-3.5的分?jǐn)?shù)徘徊在后10%左右,。

GPT-4在各種專(zhuān)業(yè)和學(xué)術(shù)基準(zhǔn)上的表現(xiàn),，已經(jīng)達(dá)到了“人類(lèi)水平”。

GPT-4更有趣的方面之一是多模態(tài),。與GPT-3和GPT-3.5只能接受文本提示不同,，GPT-4還能接受圖像提示來(lái)執(zhí)行某些操作，也就是輸入圖片,，它生成一段相關(guān)的文字內(nèi)容,。

而這，很可能還不是OpenAI的全部招式,。

從時(shí)間上看,，GPT-4早在2022年年中就基本完成;從產(chǎn)品上看,，OpenAI還有很多，比如其中一款DELL-E2,，可以輸入文字來(lái)一張圖片,，正好和GPT-4互補(bǔ)。

很難想象,，OpenAI到底領(lǐng)先對(duì)手幾個(gè)身位?

作為行業(yè)第2,，百度在2019年就已開(kāi)始積累AI預(yù)訓(xùn)練模型技術(shù)，2021年12月正式發(fā)布了全球首個(gè)知識(shí)增強(qiáng)千億大模型鵬城-百度·文心,，參數(shù)規(guī)模達(dá)到2600億,，比ChatGPT還大。

有人可能會(huì)嘲笑,，怎么用更大的模型,，百度的產(chǎn)品還不如別人。

這里要為百度說(shuō)句話,，模型的參數(shù)量不是決定最終產(chǎn)品的唯一因素,，模型的架構(gòu)設(shè)計(jì)、數(shù)據(jù)質(zhì)量,、訓(xùn)練策略等因素都會(huì)影響模型的能力和性能,。

就拿數(shù)據(jù)質(zhì)量來(lái)說(shuō)，如果百度是用中文互聯(lián)網(wǎng)的信息來(lái)訓(xùn)練,，那必然能起到一種事倍功半的效果,。

3月，谷歌正式開(kāi)放類(lèi)ChatGPT產(chǎn)品Bard的訪問(wèn),，成為全球第3,，其背后的LaMDA模型使用多達(dá)1370億個(gè)參數(shù)進(jìn)行訓(xùn)練。而從實(shí)際使用來(lái)看,，這個(gè)第3當(dāng)之無(wú)愧——有時(shí)候連文心一言都不如,。

當(dāng)然，這還是比一眾連產(chǎn)品都沒(méi)有的廠商要好得多,。

2,、卷起來(lái)了

中國(guó)率先做出類(lèi)ChatGPT產(chǎn)品的為什么不是騰訊、阿里,、字節(jié)跳動(dòng)這樣頂尖的互聯(lián)網(wǎng)大廠,，而是百度這種“掉隊(duì)”廠商?

這里引用周鴻祎近期采訪時(shí)的一段話：

“國(guó)內(nèi)互聯(lián)網(wǎng)公司花錢(qián)多少不一樣，聚集人工智能的人才團(tuán)隊(duì)大小不一樣,，但是思路一樣——人工智能應(yīng)該找場(chǎng)景,，要解決自己業(yè)務(wù)中遇到的問(wèn)題。

所以,，為什么中國(guó)的人工智能都用來(lái)解決人臉識(shí)別,、圖像濾鏡做得更漂亮，如果一個(gè)人工智能技術(shù)和自己的業(yè)務(wù)不能結(jié)合,，可能就會(huì)認(rèn)為沒(méi)太大意義,。

所以，沒(méi)有人想到用GPT NLP的模型解決通用知識(shí)理解和推理的問(wèn)題,，更沒(méi)有人想到大算力大數(shù)據(jù),，最后做出一個(gè)大模型，能夠產(chǎn)生一種連OpenAI自己都想不到的智能化的結(jié)果,�,！�

總結(jié)一下，就是短期看不到變現(xiàn)可能的,，就不做,。

這段話不一定全對(duì)，但一定有正確的地方,，因?yàn)榇_實(shí)有大廠身體力行地證明了這一點(diǎn),。

比如騰訊。

ChatGPT火了之后,，騰訊深藏于血脈之中的本能立刻覺(jué)醒,，馬上宣布成立“混元助手(HunyuanAide)”項(xiàng)目組。

從人員構(gòu)成來(lái)看,，騰訊這回是下了血本了,。

根據(jù)36氪“職場(chǎng)Bonus”消息，項(xiàng)目組Owner張正友是騰訊史上最高專(zhuān)業(yè)職級(jí)擁有者,，首位17級(jí)研究員/杰出科學(xué)家;下面的3位PM,，分別是騰訊在AI算法、AI工程和商業(yè)化方面的高管;7位組長(zhǎng)是來(lái)自?xún)?nèi)部多個(gè)團(tuán)隊(duì)的骨干;支持人員更是覆蓋廣泛,，連微信和互娛的也出現(xiàn)在名單人員的業(yè)務(wù)覆蓋面內(nèi),，可見(jiàn)騰訊之重視。

不過(guò)之前可不是這樣的,。

事實(shí)上,，如果搜索關(guān)鍵詞可以發(fā)現(xiàn)，“混元”這個(gè)名字并不是第一次出現(xiàn)在騰訊的項(xiàng)目中,。

早在去年4月,，騰訊就宣布了發(fā)布多模態(tài)“混元”AI大模型的消息，不過(guò)這個(gè)模型當(dāng)時(shí)并沒(méi)有用在類(lèi)ChatGPT產(chǎn)品上,。

用在哪里了呢?當(dāng)然是能直接看到錢(qián)的地方啊,。

根據(jù)當(dāng)時(shí)的通稿，“混元”大模型“被廣泛應(yīng)用到廣告創(chuàng)作,、廣告檢索,、廣告推薦等騰訊業(yè)務(wù)場(chǎng)景中”,。具體來(lái)說(shuō)，就是利用AI更好地理解廣告內(nèi)容,，然后更加精確地推送到你手機(jī)上,。

只能說(shuō)，不愧是你啊,。

除了騰訊之外,，國(guó)內(nèi)還有幾個(gè)趕晚集的大廠。

首先是阿里,。2020年,，阿里達(dá)摩院和清華大學(xué)共同推出了3億參數(shù)量的M6大模型，2021年1月模型參數(shù)規(guī)模到達(dá)百億;2021年5月,，具有萬(wàn)億參數(shù)規(guī)模的模型正式投入使用,。

2022年10月，M6的參數(shù)規(guī)模擴(kuò)展到驚人的10萬(wàn)億,，成為全球最大的AI預(yù)訓(xùn)練模型,。

在產(chǎn)品方面，和騰訊一樣,，M6主要應(yīng)用在阿里業(yè)務(wù)上,，比如增進(jìn)淘寶、支付寶等平臺(tái)的搜索及內(nèi)容認(rèn)知精度等,。去年阿里曾公布其在AIGC方面的成果,，生成的實(shí)景圖片已經(jīng)十分逼真。

今年2月,，據(jù)媒體報(bào)道,，阿里版聊天機(jī)器人ChatGPT正在研發(fā)中，目前處于內(nèi)測(cè)階段,。

之后是京東,。2月10日，京東云旗下言犀人工智能應(yīng)用平臺(tái)宣布將整合過(guò)往產(chǎn)業(yè)實(shí)踐和技術(shù)積累,，推出產(chǎn)業(yè)版ChatGPT：ChatJD,。

不過(guò)這個(gè)產(chǎn)品也許八字還沒(méi)一撇，其通稿公布的信息中,，參數(shù)量用的是“預(yù)計(jì)”為千億級(jí)別的字眼,。

在此前的采訪中，京東方面曾透露過(guò)自研領(lǐng)域知識(shí)大模型K-PLUG的消息,，稱(chēng)其生成的商品文案覆蓋了京東3000+品類(lèi),，累計(jì)生成30億字，帶來(lái)超過(guò)3億元GMV。

就算新產(chǎn)品發(fā)布了,，也和普通網(wǎng)友沒(méi)什么關(guān)系,，因?yàn)槠涠ㄎ坏念I(lǐng)域是零售和金融，服務(wù)于京東相關(guān)領(lǐng)域,。

字節(jié)跳動(dòng)方面發(fā)力較晚,。據(jù)公開(kāi)報(bào)道，到今年2月,，ChatGPT已經(jīng)火遍半邊天了，字節(jié)還只是“正在大模型方面布局”,。知情人士表示,，字節(jié)跳動(dòng)語(yǔ)言大模型團(tuán)隊(duì)在今年組建，探索方向主要為與搜索,、廣告等下游業(yè)務(wù)的結(jié)合,，語(yǔ)言大模型團(tuán)隊(duì)的預(yù)期是在今年年中推出大模型。

另外還有華為,。2021年4月,，華為發(fā)布了盤(pán)古大模型，包括30億參數(shù)的視覺(jué)(CV)預(yù)訓(xùn)練模型,，以及與循環(huán)智能,、鵬城實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā)的千億參數(shù)、40TB訓(xùn)練數(shù)據(jù)的中文語(yǔ)言(NLP)預(yù)訓(xùn)練模型,。

不過(guò)無(wú)論是從當(dāng)時(shí)公布的布局,，后續(xù)通稿，還是近期的回應(yīng)來(lái)看,，華為似乎都沒(méi)有推出類(lèi)似ChatGPT這樣面對(duì)普通網(wǎng)民的通用應(yīng)用的意愿,。也許未來(lái)我們可以在鴻蒙的車(chē)機(jī)上體驗(yàn)到華為的技術(shù)實(shí)力。

還有部分大廠,，沒(méi)有公布模型方面的信息,，專(zhuān)攻應(yīng)用層面。

比如網(wǎng)易有道方面稱(chēng),，未來(lái)或?qū)⑼瞥鯟hatGPT同源技術(shù)產(chǎn)品,，應(yīng)用場(chǎng)景圍繞在線教育。

三六零在互動(dòng)平臺(tái)上表示,，正計(jì)劃盡快推出類(lèi)ChatGPT技術(shù)的demo(試用版本)應(yīng)用,。

科大訊飛2月在投資者互動(dòng)平臺(tái)回應(yīng)稱(chēng)，公司在該方向技術(shù)和應(yīng)用具備長(zhǎng)期深厚的積累,�,？拼笥嶏wAI學(xué)習(xí)機(jī)將成為該項(xiàng)技術(shù)率先落地的產(chǎn)品，將于今年5月6日進(jìn)行產(chǎn)品級(jí)發(fā)布。

有意思的是,，去年12月,，他們的董秘還說(shuō)“目前沒(méi)有類(lèi)似ChatGPT的產(chǎn)品計(jì)劃”。

3,、勝負(fù)未分

必須強(qiáng)調(diào)的是,，雖然行業(yè)的領(lǐng)先者已經(jīng)出現(xiàn)，但是長(zhǎng)期來(lái)看,，生成式AI其實(shí)還在萌芽階段,，未來(lái)競(jìng)爭(zhēng)格局依然可能生變。

Gartner《2022年人工智能技術(shù)成熟度曲線》報(bào)告預(yù)測(cè),，廣闊的應(yīng)用場(chǎng)景和需求空間吸引大量資本和技術(shù)投入,，預(yù)計(jì)將在2-5年內(nèi)實(shí)現(xiàn)規(guī)模化應(yīng)用,。

根據(jù)Precedence Research,，生成式AI將在2022年后迎來(lái)應(yīng)用的爆發(fā)，市場(chǎng)空間預(yù)計(jì)由2022年的108億美元上漲至2032年的1181億美元,，未來(lái)10年的CAGR高達(dá)27%,。

在細(xì)分領(lǐng)域，目前生成式AI還主要應(yīng)用在媒體與娛樂(lè)上,，市場(chǎng)份額占比34%,。

不過(guò)在此以后，商業(yè)和金融服務(wù)部門(mén)預(yù)計(jì)將以最快的速度增長(zhǎng) 36.4%,，該行業(yè)的市場(chǎng)擴(kuò)張歸因于人工智能 (AI) 在行業(yè)中越來(lái)越多地使用,，以阻止欺詐、保護(hù)數(shù)據(jù)并滿足金融服務(wù)中各利益相關(guān)者不斷變化的需求,。

總而言之,，這個(gè)行業(yè)才剛剛起步，機(jī)會(huì)很多,，不確定性也很大,。

但有一點(diǎn)可以確定，之前國(guó)內(nèi)大廠的功利主義和商業(yè)KPI導(dǎo)向在此刻將會(huì)得到教育,，接下來(lái)可以預(yù)期,，行業(yè)對(duì)AI成果商業(yè)化的預(yù)期會(huì)更加寬容和長(zhǎng)期主義，對(duì)于AI生產(chǎn)力和增長(zhǎng)曲線的認(rèn)知也會(huì)更加清晰和堅(jiān)定,。

前瞻網(wǎng)

sunbetterwu · 發(fā)表于 2023-3-27 09:33:26

人工智能更啊,，會(huì)是第四次工業(yè)革命么？

walkingon · 發(fā)表于 2023-3-27 10:35:49

對(duì)BD沒(méi)什么好感。

dtltc123 · 發(fā)表于 2023-3-27 11:11:46

前幾天與一個(gè)在阿里達(dá)摩院做人工智能方面的同學(xué)聊了一些,，我問(wèn)他為啥阿里沒(méi)啥動(dòng)作,，他跟我說(shuō)國(guó)內(nèi)的AI與美國(guó)的差距太大了，大到超出你的想象,。阿里不敢動(dòng),，弄出來(lái)說(shuō)不定也會(huì)被同行恥笑。,。,。我想他應(yīng)該沒(méi)騙我吧。,。,。

熱青茶 · 發(fā)表于 2023-3-27 11:18:35

記得以前預(yù)計(jì)機(jī)器超越人類(lèi)智能奇點(diǎn)在2045，現(xiàn)在看來(lái)要提前,。

賣(mài)V導(dǎo)軌V絲桿 · 發(fā)表于 2023-3-27 17:10:43

提示: 作者被禁止或刪除內(nèi)容自動(dòng)屏蔽

dtltc123 · 發(fā)表于 2023-3-28 08:10:30

賣(mài)V導(dǎo)軌V絲桿發(fā)表于 2023-3-27 17:10
這不是很悲哀的一件事情嗎？差距大怕笑話不做然后差距越來(lái)越大,，國(guó)內(nèi)網(wǎng)友也確實(shí)對(duì)國(guó)內(nèi)公司包容性不夠,， ...

其實(shí)也不是不做，我的理解應(yīng)該是做出來(lái)的不成熟也就不對(duì)外公布了,。像你說(shuō)的包容性也確實(shí)差些,，我這同學(xué)要不是媳婦不想去，他自己都想離職去美帝發(fā)展了,。,。。,。我當(dāng)時(shí)還問(wèn)他,，阿里是不是在憋大招兒呢？他跟我說(shuō)不是,。,。。,。唉,，我們還是得正視差距，想辦法打破技術(shù)壁壘,，但確實(shí)很難,。。,。,。

山野向南cj · 發(fā)表于 2023-3-28 11:26:09

體驗(yàn)一下文心一言

18元?dú)馔跸蛲?/a> · 發(fā)表于 2023-3-29 13:53:06

笑死了，看看百度搜出了什么玩意，什么“xx工藝怎樣怎樣,，小編也不知道,，xx工藝究竟是怎樣怎樣呢，還請(qǐng)?jiān)u論區(qū),。,。�,！�,，還不如用gpt幫忙

鑄林邀風(fēng) · 發(fā)表于 2023-3-30 17:55:59

山野向南cj 發(fā)表于 2023-3-28 11:26
體驗(yàn)一下文心一言

現(xiàn)在個(gè)人也能使用了嗎

		自動(dòng)登錄	找回密碼
密碼			注冊(cè)會(huì)員

賣(mài)V導(dǎo)軌V絲桿賣(mài)V導(dǎo)軌V絲桿當(dāng)前離線積分 440	6^# 發(fā)表于 2023-3-27 17:10:43 \| 只看該作者提示: 作者被禁止或刪除內(nèi)容自動(dòng)屏蔽

	回復(fù) 支持反對(duì) 使用道具舉報(bào)

ChatGPT爆火，中美AI差距拉大到什么程度？

點(diǎn)評(píng)