【博覽】李飛飛團(tuán)隊(duì)《學(xué)術(shù)頭條》:2024年人工智能指數(shù)報(bào)告——10大趨勢,揭示AI大模型的“喜”與“憂”
作者:本站編輯
2024-05-10 18:52:13
17
剛剛挨厚,由李飛飛聯(lián)合領(lǐng)導(dǎo)的斯坦福大學(xué)以人為本人工智能研究所(Stanford HAI)發(fā)布了《2024 年人工智能指數(shù)報(bào)告》(Artificial Intelligence Index Report 2024)尸诽。這份長達(dá) 300 多頁的報(bào)告是 Stanford HAI 發(fā)布的第 7 份 AI Index 研究鬼雀,追蹤了 2023 年全球人工智能的發(fā)展趨勢。Stanford HAI 官方介紹道常挚,“這是我們迄今為止最全面的報(bào)告作谭,而且是在人工智能對社會的影響從未如此明顯的重要時(shí)刻發(fā)布的⊙僬保”Stanford HAI 研究項(xiàng)目主任 Vanessa Parli 表示折欠,“我認(rèn)為最令人興奮的人工智能研究優(yōu)勢是將這些大型語言模型與機(jī)器人或智能體(agent)相結(jié)合,這標(biāo)志著機(jī)器人在現(xiàn)實(shí)世界中更有效地工作邁出了重要一步吼过∪袂兀”《2024 年人工智能指數(shù)報(bào)告》下載地址:
https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf
與往年不同,Stanford HAI 今年擴(kuò)大了研究范圍,更廣泛地涵蓋了人工智能的技術(shù)進(jìn)步酱床、公眾對該技術(shù)的看法等基本趨勢羊赵。新報(bào)告揭示了 2023 年人工智能行業(yè)的 10 大主要趨勢:1.人工智能在某些任務(wù)上勝過人類,但并非在所有任務(wù)上扇谣。人工智能已在多項(xiàng)基準(zhǔn)測試中超越人類昧捷,包括在圖像分類、視覺推理和英語理解方面冕咒。然而撑葡,它在競賽級數(shù)學(xué)、視覺常識推理和規(guī)劃等更復(fù)雜的任務(wù)上依然落后于人類彭理。2.產(chǎn)業(yè)界繼續(xù)主導(dǎo)人工智能前沿研究艾抠。2023 年,產(chǎn)業(yè)界產(chǎn)生了 51 個(gè)著名的機(jī)器學(xué)習(xí)模型凝顿,而學(xué)術(shù)界只貢獻(xiàn)了 15 個(gè)惑妒。2023 年,產(chǎn)學(xué)合作還產(chǎn)生了 21 個(gè)著名模型哆卓,創(chuàng)下新高。此外逝惑,108 個(gè)新發(fā)布的基礎(chǔ)模型來自工業(yè)界岂苏,28 個(gè)來自學(xué)術(shù)界。根據(jù) AI Index 的估算限禀,最先進(jìn)的人工智能模型的訓(xùn)練成本已經(jīng)達(dá)到了前所未有的水平。例如祷安,OpenAI 的 GPT-4 估計(jì)使用了價(jià)值 7800 萬美元的計(jì)算資源進(jìn)行訓(xùn)練姥芥,而谷歌的 Gemini Ultra 的計(jì)算成本則高達(dá) 1.91 億美元。相比之下汇鞭,幾年前發(fā)布的一些最先進(jìn)的模型凉唐,即原始 transformer 模型(2017 年)和 RoBERTa Large(2019 年),訓(xùn)練成本分別約為 900 美元和 16 萬美元霍骄。2023 年,61 個(gè)著名的人工智能模型源自美國的機(jī)構(gòu)读整,超過歐盟的 21 個(gè)和中國的 15 個(gè)簿训。美國也仍然是人工智能投資的首選之地。2023 年米间,美國在人工智能領(lǐng)域的私人投資總額為 672 億美元强品,是中國的近 9 倍。然而,中國依然是美國最大的競爭對手的榛,中國的機(jī)器人安裝量居世界首位琼了;同樣,世界上大多數(shù)人工智能專利(61%)都來自中國蝶映。5.嚴(yán)重缺乏對 LLM 責(zé)任的可靠和標(biāo)準(zhǔn)化評估巍坦。AI Index 的最新研究顯示,負(fù)責(zé)任的人工智能嚴(yán)重缺乏標(biāo)準(zhǔn)化擦斑。包括 OpenAI腿若、谷歌和 Anthropic 在內(nèi)的領(lǐng)先開發(fā)商主要根據(jù)不同的負(fù)責(zé)任人工智能基準(zhǔn)測試他們的模型。這種做法使系統(tǒng)地比較頂級人工智能模型的風(fēng)險(xiǎn)和局限性的工作變得更加復(fù)雜才昔。盡管去年人工智能私人投資整體下降,但對生成式人工智能的投資激增峰礁,比 2022 年(約 30 億美元)增長了近八倍漠恰,達(dá)到 252 億美元。生成式人工智能領(lǐng)域的主要參與者鞠洪,包括 OpenAI蹲自、Anthropic、Hugging Face 和 Inflection乏唤,都獲得了一輪可觀的融資颗介。7.數(shù)據(jù)顯示,人工智能讓打工人更有生產(chǎn)力苇经,工作質(zhì)量更高赘理。2023 年,多項(xiàng)研究評估了人工智能對勞動力的影響扇单,表明人工智能可以讓打工人更快地完成任務(wù)商模,并提高他們的產(chǎn)出質(zhì)量。這些研究還表明蜘澜,人工智能有可能縮小低技能和高技能工人之間的技能差距施流。還有一些研究警告說,在沒有適當(dāng)監(jiān)督的情況下使用人工智能可能會起到負(fù)面作用鄙信。8.得益于人工智能嫂沉,科學(xué)進(jìn)步進(jìn)一步加速。2022 年扮碧,人工智能開始推動科學(xué)發(fā)現(xiàn)趟章。然而,2023 年慎王,與科學(xué)相關(guān)的更重要的人工智能應(yīng)用啟動——使算法排序更高效的 AlphaDev蚓土、促進(jìn)材料發(fā)現(xiàn)過程的 GNoME、可在一分鐘內(nèi)提供極其準(zhǔn)確的 10 天天氣預(yù)報(bào)的 GraphCast、成功對 7100 萬種可能的錯(cuò)義突變中的約 89% 進(jìn)行分類的 AlphaMissence澄俘。如今棱硝,人工智能現(xiàn)在可以完成人類難以完成的、但對解決一些最復(fù)雜的科學(xué)問題至關(guān)重要的粗暴計(jì)算酸儿。在醫(yī)療方面着届,新的研究表明,醫(yī)生可以利用人工智能更好地診斷乳腺癌昵鳍、解讀X射線和檢測致命的癌癥抢必。9.美國的人工智能法規(guī)數(shù)量急劇增加。2023 年难宋,全球立法程序中有 2175 次提及人工智能耗鲸,幾乎是上一年的兩倍。美國人工智能相關(guān)法規(guī)的數(shù)量在過去一年大幅增加乙闰。2023 年懒潘,與人工智能相關(guān)的法規(guī)有 25 項(xiàng),而 2016 年只有 1 項(xiàng)互墓。僅去年一年必尼,人工智能相關(guān)法規(guī)的總數(shù)就增長了 56.3%。其中一些法規(guī)包括生成式人工智能材料的版權(quán)指南和網(wǎng)絡(luò)安全風(fēng)險(xiǎn)管理框架篡撵。10.人們對人工智能的潛在影響有了更深刻的認(rèn)識判莉,同時(shí)也更焦慮。來自市場研究公司 Ipsos 的一項(xiàng)調(diào)查顯示酸休,在過去一年中骂租,認(rèn)為人工智能將在未來 3-5 年內(nèi)極大地影響他們生活的人祷杈,比例從 60%上升到 66%斑司。此外,52% 的人對人工智能產(chǎn)品和服務(wù)表示焦慮但汞,比 2022 年上升了 13 個(gè)百分點(diǎn)宿刮。在美國,來自皮尤研究中心(Pew)的數(shù)據(jù)顯示私蕾,52% 的美國人表示對人工智能的擔(dān)憂多于興奮僵缺,這一比例比 2022 年的 38% 有所上升。附:來自AI Index 聯(lián)合主任 Ray Perrault 的一封信十年前踩叭,世界上最好的人工智能系統(tǒng)也無法以人類的水平對圖像中的物體進(jìn)行分類磕潮。人工智能在語言理解方面舉步維艱,也無法解決數(shù)學(xué)問題锋辩。如今暖经,人工智能系統(tǒng)在標(biāo)準(zhǔn)基準(zhǔn)上的表現(xiàn)經(jīng)常超過人類。2023 年,人工智能進(jìn)步加速缕沟。GPT-4姚菱、Gemini 和 Claude 3 等先進(jìn)模型展示出了令人印象深刻的多模態(tài)能力:它們可以生成數(shù)十種語言的流暢文本,處理音頻葛暇,甚至可以解釋備忘錄皂汞。隨著人工智能的進(jìn)步,它也越來越多地進(jìn)入我們的生活尼软。公司競相打造基于人工智能的產(chǎn)品熄晕,普通大眾也越來越多地使用人工智能。但是尔减,當(dāng)前的人工智能技術(shù)仍然存在重大問題赠粘。它無法可靠地處理事實(shí)、進(jìn)行復(fù)雜的推理或解釋其結(jié)論缓艳。人工智能面臨兩個(gè)相互關(guān)聯(lián)的未來校摩。第一個(gè),技術(shù)不斷改進(jìn)阶淘,應(yīng)用日益廣泛衙吩,對生產(chǎn)力和就業(yè)產(chǎn)生重大影響。人工智能的用途有好有壞溪窒。第二個(gè)坤塞,人工智能的應(yīng)用受到技術(shù)局限的制約。無論是哪一種澈蚌,政府都越來越關(guān)注摹芙。政府正在積極參與,鼓勵(lì)人工智能的發(fā)展宛瞄,比如資助大學(xué)研發(fā)和激勵(lì)私人投資浮禾。政府還致力于管理潛在的不利因素,如對就業(yè)的影響份汗、隱私問題盈电、錯(cuò)誤信息和知識產(chǎn)權(quán)。在技術(shù)方面伤刑,今年的 AI Index 報(bào)告稱探快,2023 年全球發(fā)布的新大型語言模型數(shù)量比上一年翻了一番。三分之二的模型是開源的入撇,但性能最高的模型來自擁有封閉系統(tǒng)的行業(yè)參與者榨狐。Gemini Ultra 成為首個(gè)在大規(guī)模多任務(wù)語言理解(MMLU)基準(zhǔn)上達(dá)到人類水平的 LLM;自去年以來晤裆,模型在該基準(zhǔn)上的性能表現(xiàn)提高了 15 個(gè)百分點(diǎn)咱漱。此外橘抵,GPT-4 在綜合語言模型整體評估(HELM)基準(zhǔn)上取得了令人印象深刻的 0.97 平均勝率分?jǐn)?shù)。雖然全球?qū)θ斯ぶ悄艿乃饺送顿Y連續(xù)第二年減少彰茉,但對生成式人工智能的投資卻急劇上升甲脚。財(cái)富 500 強(qiáng)企業(yè)財(cái)報(bào)電話會議中提及人工智能的次數(shù)比以往任何時(shí)候都多,而且新的研究表明垮登,人工智能明顯提高了打工人的生產(chǎn)率帽拘。在政策制定方面,全球在立法程序中提及人工智能的次數(shù)前所未有疙岂。美國監(jiān)管機(jī)構(gòu)在 2023 年通過的人工智能相關(guān)法規(guī)比以往任何時(shí)候都多坡疼。盡管如此,許多人仍對人工智能生成深度偽造等能力表示擔(dān)憂衣陶。公眾對人工智能有了更多的認(rèn)識柄瑰,研究表明,他們的反應(yīng)也是焦慮的剪况。https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdfhttps://hai.stanford.edu/research/ai-index-reporthttps://hai.stanford.edu/news/inside-new-ai-index-expensive-new-models-targeted-investments-and-morehttps://hai.stanford.edu/news/ai-index-state-ai-13-chartshttps://hai.stanford.edu/news/ai-index-five-trends-frontier-ai-research.