3月16日,李彥宏站在舞臺(tái)聚光燈下,,感受著全球科技從業(yè)者目光的注視,風(fēng)頭一時(shí)無(wú)兩,。
3年前,,同一個(gè)場(chǎng)景,他也曾這么出風(fēng)頭過(guò),,但當(dāng)時(shí)是因?yàn)橐黄繌念^澆下的礦泉水。
這一次他顯然信心十足,。預(yù)熱了幾個(gè)月,,只要“文心一言”一發(fā)布,在ChatGPT掀起全球AIGC(生成式AI)狂潮乃至狂熱的當(dāng)下,,百度就將成為全球第2個(gè)觸摸到未來(lái)的科技先鋒,。
沒(méi)想到,發(fā)布當(dāng)天,,李彥宏在臺(tái)上說(shuō),,百度股價(jià)在板上跌。
無(wú)論是發(fā)布會(huì)前一天OpenAI不講武德地推出了革新的GPT-4模型,,還是發(fā)布會(huì)上缺少實(shí)機(jī)演示,,亦或是第一批嘗鮮的用戶(hù)輸入“愛(ài)國(guó)”結(jié)果畫(huà)出星條旗,都沉重打擊了市場(chǎng)信心。
發(fā)布會(huì)開(kāi)始不到20分鐘,,百度港股股價(jià)就暴跌超9.8%,,后來(lái)股價(jià)略有上升,但跌幅仍超5%,。不出意料,,微博、知乎迅速出現(xiàn)了一片嘲笑聲,,“百度股價(jià)跳水”被送上熱搜,,線上線下彌漫著快活的空氣。
然而,,僅過(guò)了一晚上,,股市完全變了。3月17日港股開(kāi)盤(pán)后,,百度幾乎是直線拉升,,日內(nèi)繼續(xù)波動(dòng)上漲,全天漲幅近15%,。隨后幾天,,余威未消,百度股價(jià)繼續(xù)上漲,,目前已經(jīng)回到年內(nèi)高位,。
事實(shí)上,業(yè)界很快回味過(guò)來(lái)了,。
文心一言雖然比GPT4差得遠(yuǎn),,甚至比不上GPT3.5的ChatGPT,但依然是能用的,。各種讓人啼笑皆非的產(chǎn)出結(jié)果恰恰證實(shí)了技術(shù)的真實(shí)性,,沒(méi)有弄虛作假,這就夠了,。只要是真的,,花錢(qián)花時(shí)間,總能迭代到好用的時(shí)候,。
況且要論落后,,落后第1名,那也是行業(yè)第2,,在一個(gè)公認(rèn)前途無(wú)量的領(lǐng)域做到世界第2,,不強(qiáng)么?
風(fēng)向一下子變了,這下壓力來(lái)到了其他互聯(lián)網(wǎng)大廠一邊:
一直被嘲諷“掉隊(duì)”的百度做出來(lái)了文心一言,,你們?cè)诟墒裁?
1,、第四波浪潮?
不能完全怪其他大廠不努力,,從歷史來(lái)看,過(guò)去AI發(fā)展經(jīng)歷了3波高潮,,但總體來(lái)看,,雷聲大,雨點(diǎn)小,。
人工智能概念的提出始于1956年的美國(guó)達(dá)特茅斯會(huì)議,,1959年Arthur Samuel提出了機(jī)器學(xué)習(xí),推動(dòng)人工智能進(jìn)入第一個(gè)發(fā)展高潮期,,但因?yàn)閷?duì)現(xiàn)實(shí)問(wèn)題束手無(wú)策而衰退,。這個(gè)階段,AI只會(huì)依據(jù)規(guī)則證明中學(xué)數(shù)學(xué)定理,。
此后70年代末期出現(xiàn)了專(zhuān)家系統(tǒng),,標(biāo)志著人工智能從理論研究走向?qū)嶋H應(yīng)用。80年代到90年代隨著美國(guó)和日本立項(xiàng)支持人工智能研究,,人工智能進(jìn)入第二個(gè)發(fā)展高潮期,,期間人工智能相關(guān)的數(shù)學(xué)模型取得了一系列重大突破,如著名的多層神經(jīng)網(wǎng)絡(luò),、BP反向傳播算法等,,算法模型準(zhǔn)確度和專(zhuān)家系統(tǒng)進(jìn)一步提升。
然而在這個(gè)階段,,AI的能力上限也只是下贏國(guó)際象棋,。
新世紀(jì)以來(lái),互聯(lián)網(wǎng)將人類(lèi)代入大數(shù)據(jù)時(shí)代,,深度學(xué)習(xí)算法的出現(xiàn)和強(qiáng)化,,GPU、NPU,、FPGA等芯片技術(shù)帶來(lái)的算力突破,,共同推動(dòng)了AI第三次浪潮的出現(xiàn)。
![]()
2018年,,新的里程碑出現(xiàn),。
谷歌推出大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型BERT,通過(guò)3億參數(shù)量的訓(xùn)練,,在機(jī)器閱讀理解頂級(jí)水平測(cè)試SQuAD1.1的2個(gè)衡量指標(biāo)上全面超越人類(lèi),并在11種不同的NLP測(cè)試中達(dá)到SOTA(業(yè)內(nèi)最佳)表現(xiàn),,宣布了大模型時(shí)代的到來(lái),。
次年,OpenAI迅速跟進(jìn),,將GPT-1的1.17億參數(shù)量迭代至GPT-2的15億,,在沒(méi)有對(duì)模型結(jié)構(gòu)做出過(guò)多創(chuàng)新的情況下,,實(shí)現(xiàn)了超強(qiáng)的內(nèi)容生成能力。
又過(guò)了1年,,現(xiàn)在已經(jīng)家喻戶(hù)曉的GPT-3誕生,,大模型參數(shù)量暴漲到1750億,系統(tǒng)出現(xiàn)了從量變到質(zhì)變的跨越,。在優(yōu)化和熟識(shí)1年多后,,OpenAI將基于GPT-3.5的ChatGPT推向市場(chǎng),轟動(dòng)了全世界,。
![]()
推出短短5天內(nèi)注冊(cè)用戶(hù)量就超過(guò)100萬(wàn),,2個(gè)月后突破1個(gè)億,平均每天1300萬(wàn)獨(dú)立訪客使用,,ChatGPT不僅自己打破記錄,,還掀起了一波全球性狂潮。
![]()
在同行還沒(méi)反應(yīng)過(guò)來(lái)的時(shí)候,,OpenAI又以迅雷不及掩耳之勢(shì)推出了GPT-4,。雖然沒(méi)有公布詳細(xì)參數(shù),但其實(shí)際使用體驗(yàn)的巨大提升,,再次震動(dòng)了行業(yè),。
在智能化水平上,GPT-4和之前的模型產(chǎn)生了天壤之別,。比如說(shuō),,在美國(guó)大學(xué)先修課程微積分BC考試中,GPT-4獲得4分(滿分5分),,而GPT-3獲得1分,。GPT-3.5是GPT-3和GPT-4的中間模型,也獲得4分,。
模擬律師考試方面,,GPT-4以排名前10%的成績(jī)通過(guò),GPT-3.5的分?jǐn)?shù)徘徊在后10%左右,。
GPT-4在各種專(zhuān)業(yè)和學(xué)術(shù)基準(zhǔn)上的表現(xiàn),,已經(jīng)達(dá)到了“人類(lèi)水平”。
GPT-4更有趣的方面之一是多模態(tài),。與GPT-3和GPT-3.5只能接受文本提示不同,,GPT-4還能接受圖像提示來(lái)執(zhí)行某些操作,也就是輸入圖片,,它生成一段相關(guān)的文字內(nèi)容,。
而這,很可能還不是OpenAI的全部招式,。
從時(shí)間上看,,GPT-4早在2022年年中就基本完成;從產(chǎn)品上看,,OpenAI還有很多,比如其中一款DELL-E2,,可以輸入文字來(lái)一張圖片,,正好和GPT-4互補(bǔ)。
很難想象,,OpenAI到底領(lǐng)先對(duì)手幾個(gè)身位?
作為行業(yè)第2,,百度在2019年就已開(kāi)始積累AI預(yù)訓(xùn)練模型技術(shù),2021年12月正式發(fā)布了全球首個(gè)知識(shí)增強(qiáng)千億大模型鵬城-百度·文心,,參數(shù)規(guī)模達(dá)到2600億,,比ChatGPT還大。
有人可能會(huì)嘲笑,,怎么用更大的模型,,百度的產(chǎn)品還不如別人。
這里要為百度說(shuō)句話,,模型的參數(shù)量不是決定最終產(chǎn)品的唯一因素,,模型的架構(gòu)設(shè)計(jì)、數(shù)據(jù)質(zhì)量,、訓(xùn)練策略等因素都會(huì)影響模型的能力和性能,。
就拿數(shù)據(jù)質(zhì)量來(lái)說(shuō),如果百度是用中文互聯(lián)網(wǎng)的信息來(lái)訓(xùn)練,,那必然能起到一種事倍功半的效果,。
3月,谷歌正式開(kāi)放類(lèi)ChatGPT產(chǎn)品Bard的訪問(wèn),,成為全球第3,,其背后的LaMDA模型使用多達(dá)1370億個(gè)參數(shù)進(jìn)行訓(xùn)練。而從實(shí)際使用來(lái)看,,這個(gè)第3當(dāng)之無(wú)愧——有時(shí)候連文心一言都不如,。
當(dāng)然,這還是比一眾連產(chǎn)品都沒(méi)有的廠商要好得多,。
2,、卷起來(lái)了
中國(guó)率先做出類(lèi)ChatGPT產(chǎn)品的為什么不是騰訊、阿里,、字節(jié)跳動(dòng)這樣頂尖的互聯(lián)網(wǎng)大廠,,而是百度這種“掉隊(duì)”廠商?
這里引用周鴻祎近期采訪時(shí)的一段話:
“國(guó)內(nèi)互聯(lián)網(wǎng)公司花錢(qián)多少不一樣,聚集人工智能的人才團(tuán)隊(duì)大小不一樣,,但是思路一樣——人工智能應(yīng)該找場(chǎng)景,,要解決自己業(yè)務(wù)中遇到的問(wèn)題。
所以,,為什么中國(guó)的人工智能都用來(lái)解決人臉識(shí)別,、圖像濾鏡做得更漂亮,如果一個(gè)人工智能技術(shù)和自己的業(yè)務(wù)不能結(jié)合,,可能就會(huì)認(rèn)為沒(méi)太大意義,。
所以,沒(méi)有人想到用GPT NLP的模型解決通用知識(shí)理解和推理的問(wèn)題,,更沒(méi)有人想到大算力大數(shù)據(jù),,最后做出一個(gè)大模型,能夠產(chǎn)生一種連OpenAI自己都想不到的智能化的結(jié)果,�,!�
總結(jié)一下,就是短期看不到變現(xiàn)可能的,,就不做,。
這段話不一定全對(duì),但一定有正確的地方,,因?yàn)榇_實(shí)有大廠身體力行地證明了這一點(diǎn),。
比如騰訊。
ChatGPT火了之后,,騰訊深藏于血脈之中的本能立刻覺(jué)醒,,馬上宣布成立“混元助手(HunyuanAide)”項(xiàng)目組。
從人員構(gòu)成來(lái)看,,騰訊這回是下了血本了,。
根據(jù)36氪“職場(chǎng)Bonus”消息,項(xiàng)目組Owner張正友是騰訊史上最高專(zhuān)業(yè)職級(jí)擁有者,,首位17級(jí)研究員/杰出科學(xué)家;下面的3位PM,,分別是騰訊在AI算法、AI工程和商業(yè)化方面的高管;7位組長(zhǎng)是來(lái)自?xún)?nèi)部多個(gè)團(tuán)隊(duì)的骨干;支持人員更是覆蓋廣泛,,連微信和互娛的也出現(xiàn)在名單人員的業(yè)務(wù)覆蓋面內(nèi),,可見(jiàn)騰訊之重視。
不過(guò)之前可不是這樣的,。
事實(shí)上,,如果搜索關(guān)鍵詞可以發(fā)現(xiàn),“混元”這個(gè)名字并不是第一次出現(xiàn)在騰訊的項(xiàng)目中,。
早在去年4月,,騰訊就宣布了發(fā)布多模態(tài)“混元”AI大模型的消息,不過(guò)這個(gè)模型當(dāng)時(shí)并沒(méi)有用在類(lèi)ChatGPT產(chǎn)品上,。
用在哪里了呢?當(dāng)然是能直接看到錢(qián)的地方啊,。
根據(jù)當(dāng)時(shí)的通稿,“混元”大模型“被廣泛應(yīng)用到廣告創(chuàng)作,、廣告檢索,、廣告推薦等騰訊業(yè)務(wù)場(chǎng)景中”,。具體來(lái)說(shuō),就是利用AI更好地理解廣告內(nèi)容,,然后更加精確地推送到你手機(jī)上,。
只能說(shuō),不愧是你啊,。
除了騰訊之外,,國(guó)內(nèi)還有幾個(gè)趕晚集的大廠。
首先是阿里,。2020年,,阿里達(dá)摩院和清華大學(xué)共同推出了3億參數(shù)量的M6大模型,2021年1月模型參數(shù)規(guī)模到達(dá)百億;2021年5月,,具有萬(wàn)億參數(shù)規(guī)模的模型正式投入使用,。
2022年10月,M6的參數(shù)規(guī)模擴(kuò)展到驚人的10萬(wàn)億,,成為全球最大的AI預(yù)訓(xùn)練模型,。
在產(chǎn)品方面,和騰訊一樣,,M6主要應(yīng)用在阿里業(yè)務(wù)上,,比如增進(jìn)淘寶、支付寶等平臺(tái)的搜索及內(nèi)容認(rèn)知精度等,。去年阿里曾公布其在AIGC方面的成果,,生成的實(shí)景圖片已經(jīng)十分逼真。
今年2月,,據(jù)媒體報(bào)道,,阿里版聊天機(jī)器人ChatGPT正在研發(fā)中,目前處于內(nèi)測(cè)階段,。
之后是京東,。2月10日,京東云旗下言犀人工智能應(yīng)用平臺(tái)宣布將整合過(guò)往產(chǎn)業(yè)實(shí)踐和技術(shù)積累,,推出產(chǎn)業(yè)版ChatGPT:ChatJD,。
不過(guò)這個(gè)產(chǎn)品也許八字還沒(méi)一撇,其通稿公布的信息中,,參數(shù)量用的是“預(yù)計(jì)”為千億級(jí)別的字眼,。
在此前的采訪中,京東方面曾透露過(guò)自研領(lǐng)域知識(shí)大模型K-PLUG的消息,,稱(chēng)其生成的商品文案覆蓋了京東3000+品類(lèi),,累計(jì)生成30億字,帶來(lái)超過(guò)3億元GMV。
就算新產(chǎn)品發(fā)布了,,也和普通網(wǎng)友沒(méi)什么關(guān)系,,因?yàn)槠涠ㄎ坏念I(lǐng)域是零售和金融,服務(wù)于京東相關(guān)領(lǐng)域,。
字節(jié)跳動(dòng)方面發(fā)力較晚,。據(jù)公開(kāi)報(bào)道,到今年2月,,ChatGPT已經(jīng)火遍半邊天了,字節(jié)還只是“正在大模型方面布局”,。知情人士表示,,字節(jié)跳動(dòng)語(yǔ)言大模型團(tuán)隊(duì)在今年組建,探索方向主要為與搜索,、廣告等下游業(yè)務(wù)的結(jié)合,,語(yǔ)言大模型團(tuán)隊(duì)的預(yù)期是在今年年中推出大模型。
另外還有華為,。2021年4月,,華為發(fā)布了盤(pán)古大模型,包括30億參數(shù)的視覺(jué)(CV)預(yù)訓(xùn)練模型,,以及與循環(huán)智能,、鵬城實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā)的千億參數(shù)、40TB訓(xùn)練數(shù)據(jù)的中文語(yǔ)言(NLP)預(yù)訓(xùn)練模型,。
不過(guò)無(wú)論是從當(dāng)時(shí)公布的布局,,后續(xù)通稿,還是近期的回應(yīng)來(lái)看,,華為似乎都沒(méi)有推出類(lèi)似ChatGPT這樣面對(duì)普通網(wǎng)民的通用應(yīng)用的意愿,。也許未來(lái)我們可以在鴻蒙的車(chē)機(jī)上體驗(yàn)到華為的技術(shù)實(shí)力。
還有部分大廠,,沒(méi)有公布模型方面的信息,,專(zhuān)攻應(yīng)用層面。
比如網(wǎng)易有道方面稱(chēng),,未來(lái)或?qū)⑼瞥鯟hatGPT同源技術(shù)產(chǎn)品,,應(yīng)用場(chǎng)景圍繞在線教育。
三六零在互動(dòng)平臺(tái)上表示,,正計(jì)劃盡快推出類(lèi)ChatGPT技術(shù)的demo(試用版本)應(yīng)用,。
科大訊飛2月在投資者互動(dòng)平臺(tái)回應(yīng)稱(chēng),公司在該方向技術(shù)和應(yīng)用具備長(zhǎng)期深厚的積累,�,?拼笥嶏wAI學(xué)習(xí)機(jī)將成為該項(xiàng)技術(shù)率先落地的產(chǎn)品,將于今年5月6日進(jìn)行產(chǎn)品級(jí)發(fā)布。
有意思的是,,去年12月,,他們的董秘還說(shuō)“目前沒(méi)有類(lèi)似ChatGPT的產(chǎn)品計(jì)劃”。
3,、勝負(fù)未分
必須強(qiáng)調(diào)的是,,雖然行業(yè)的領(lǐng)先者已經(jīng)出現(xiàn),但是長(zhǎng)期來(lái)看,,生成式AI其實(shí)還在萌芽階段,,未來(lái)競(jìng)爭(zhēng)格局依然可能生變。
Gartner《2022年人工智能技術(shù)成熟度曲線》報(bào)告預(yù)測(cè),,廣闊的應(yīng)用場(chǎng)景和需求空間吸引大量資本和技術(shù)投入,,預(yù)計(jì)將在2-5年內(nèi)實(shí)現(xiàn)規(guī)模化應(yīng)用,。
![]()
根據(jù)Precedence Research,,生成式AI將在2022年后迎來(lái)應(yīng)用的爆發(fā),市場(chǎng)空間預(yù)計(jì)由2022年的108億美元上漲至2032年的1181億美元,,未來(lái)10年的CAGR高達(dá)27%,。
![]()
在細(xì)分領(lǐng)域,目前生成式AI還主要應(yīng)用在媒體與娛樂(lè)上,,市場(chǎng)份額占比34%,。
不過(guò)在此以后,商業(yè)和金融服務(wù)部門(mén)預(yù)計(jì)將以最快的速度增長(zhǎng) 36.4%,,該行業(yè)的市場(chǎng)擴(kuò)張歸因于人工智能 (AI) 在行業(yè)中越來(lái)越多地使用,,以阻止欺詐、保護(hù)數(shù)據(jù)并滿足金融服務(wù)中各利益相關(guān)者不斷變化的需求,。
總而言之,,這個(gè)行業(yè)才剛剛起步,機(jī)會(huì)很多,,不確定性也很大,。
但有一點(diǎn)可以確定,之前國(guó)內(nèi)大廠的功利主義和商業(yè)KPI導(dǎo)向在此刻將會(huì)得到教育,,接下來(lái)可以預(yù)期,,行業(yè)對(duì)AI成果商業(yè)化的預(yù)期會(huì)更加寬容和長(zhǎng)期主義,對(duì)于AI生產(chǎn)力和增長(zhǎng)曲線的認(rèn)知也會(huì)更加清晰和堅(jiān)定,。
前瞻網(wǎng) |