在 2023 年,產業界制造了 51 個顯著的機器學習模型,而學術界只貢獻了 15 個。此外,2023 年還有 21 個由產業界和學術界合作產生的顯著模型,這是一個新高。
在 2023 年,共發布了 149 個基礎模型,是 2022 年的兩倍多。在這些新發布的模型中,65.7% 是開源的,相比之下,2022 年只有 44.4%,2021 年為 33.3%。
根據人工智能指數報告的估計,最先進 AI 模型的訓練成本已達到前所未有的水平。例如,OpenAI 的 GPT-4 的估計使用了價值 7800 萬美元的計算資源來訓練,而 Google 的 Gemini Ultra 的計算成本為 1.91 億美元。
在 2023 年,來自美國的機構開發了 61 個顯著 AI 模型,遠超歐洲聯盟的 21 個和中國的 15 個。
從 2021 年到 2022 年,全球 AI 專利授權數量急劇增加了 62.7%。自 2010 年以來,授權的 AI 專利數量已增加超過 31 倍。
2022 年,中國在全球 AI 專利領域以 61.1% 的占比位居首位,遠超美國的 20.9%。從 2010 年開始,美國在 AI 專利的比例已從 54.1% 逐漸下降。
從 2011 年的 845 個到 2023 年的約 180 萬個,GitHub 上的 AI 相關項目數量持續上升。尤其是 2023 年,這一數量猛增了 59.3%。同時,這些項目的總星級數也在同年增至 1220 萬,比前一年增加了三倍以上。
在 2010 至 2022 年間,AI 相關的發表文獻數量近乎增加了三倍,從約 88,000 篇增至 240,000 篇以上,而最近一年的增長僅為 1.1%。本年度人工智能指數報告對 AI 的技術進展進行了全面總結,從高層次概述 AI 技術性能的整體演進開始,深入探討了當前 AI 各領域的能力,如語言處理、編程、計算機視覺(圖像及視頻分析)、推理、音頻處理、自動化智能體、機器人和強化學習等。章節還詳細介紹了過去一年中 AI 研究的重要突破,包括使用提示技術、優化和微調等方法來增強大語言模型,并最終探討了 AI 系統對環境的影響。
在圖像分類、視覺推理和英語理解等多個基準測試中,AI 的表現已超越人類。然而,在競賽級的數學、視覺常識推理和計劃等復雜任務中,它仍舊處于追趕狀態。
傳統的 AI 系統通常只擅長單一領域——語言模型擅長文本理解,圖像模型擅長視覺處理。但現在,如 Google 的 Gemini、OpenAI 的 GPT-4 等先進的多模態模型能夠同時處理圖像、文本乃至音頻,展現出前所未有的靈活性。
隨著 AI 在如 ImageNet、SQuAD 和 SuperGLUE 等傳統基準測試上達到性能極限,研究者們紛紛推出更具挑戰性的新標準,如編程的 SWE-bench、圖像生成的 HEIM、綜合推理的 MMMU、道德推理的 MoCa、基于智能體的行為的 AgentBench 和幻覺評估的 HaluEval。
SegmentAnything 和 Skoltech 等新興 AI 模型通過專門生成圖像分割和 3D 重建等任務的專業數據,不僅增強了現有的 AI 能力,也為未來更復雜任務的算法優化鋪平了道路。
在生成式 AI 生產高質量的文本、圖像等內容的背景下,基準測試逐漸開始重視人類評價,如 Chatbot Arena Leaderboard,不再單純依賴計算機評估,如 ImageNet 或 SQuAD。公眾對 AI 的態度正在變得越來越重要,成為評估 AI 進步的一個關鍵因素。
語言模型和機器人技術的結合推動了機器人系統的靈活性,例如 PaLM-E 和 RT-2。這些機器人不僅能力增強,還能提出問題,這是向著與現實世界更有效互動的機器人發展的一個重要步驟。
創建能在特定環境自主工作的 AI 智能體一直是一個挑戰,但最新研究顯示,這些智能體的表現在不斷提升?,F在,它們不僅能玩好 Minecraft 等復雜游戲,還能在實際任務中表現出色,比如在線購物和研究支持。
在 10 個主要 AI 基準測試中,封閉型模型的性能普遍比開放型模型高出 24.2%。這一差異對 AI 政策的討論具有重要意義。隨著 AI 技術的快速發展,它已經開始影響我們生活的每一個角落。教育、金融和醫療等關鍵領域中,重要的決策越來越多地依賴于算法提供的深度洞見。這種趨勢不僅預示著巨大的優勢,同時也伴隨著一定的風險。因此,過去一年中,如何負責任地開發和部署 AI 系統成了一個重點問題。AI 社區也在不斷地評估這些系統可能帶來的影響,并盡力為那些可能受到影響的人減少風險。
本章將詳細探討在負責任的 AI 領域內的幾個關鍵趨勢,包括隱私與數據管理、透明度與可解釋性、安全性與保安以及公平性。特別是在預計 2024 年將有四十億人參與全球投票的背景下,本章還將介紹 AI 在選舉中的作用及其對政治過程可能產生的廣泛影響。
人工智能指數報告的最新研究顯示,當前負責任 AI 報告的標準化程度非常低。領先的開發商如 OpenAI、Google 和 Anthropic 主要使用不同的負責任 AI 標準來測試他們的模型,這使得全面比較頂級 AI 模型的風險和局限性變得更為困難。
這類偽造內容已開始在全球范圍內影響選舉,最新研究表明,現有的 AI 深度偽造識別技術的效果參差不齊。此外,像 CounterCloud 這類新興項目清楚地展示了 AI 如何能夠輕松制作和散播虛假信息。
過去,人們嘗試通過邏輯上直觀的對抗性提示來對 AI 模型進行紅隊測試。而今年,研究人員找到了些更隱蔽的方法來誘導大語言模型表現出危險行為,例如讓模型不停地重復無意義的詞匯。
最近的一項全球負責任 AI 調查顯示,企業最關注的 AI 相關問題是隱私、安全和可靠性問題。雖然許多組織已開始采取措施來降低這些風險,但全球大多數公司至今僅部分解決了這些問題。
許多研究者指出,流行的大語言模型 (LLM) 生成的內容中可能包含了諸如《紐約時報》的文章片段或電影中的場景等有版權的內容。這是否構成了版權侵權,已經逐漸成為法律界關注的核心問題。
新推出的基礎模型透明度指數表明,AI 開發者在公開訓練數據和研發方法上做得不夠好。這種缺乏透明度正在阻礙對 AI 系統穩定性和安全性的深入了解。
最近一年中,AI 界內部對于關注即時模型風險(例如算法歧視)還是更長遠的存在威脅展開了激烈的討論。判定哪些問題具有科學基礎并應成為政策制定的依據變得越來越困難,尤其是在短期內已經顯現的風險與長期的理論威脅形成鮮明對比的情況下。
根據 AI 事件數據庫,2023 年共有 123 起與 AI 濫用相關的事件,比上一年增加了 32.3%。自 2013 年以來,這類事件已經增加了二十多倍。其中一個著名案例是關于泰勒·斯威夫的性相關 AI 偽造視頻廣為流傳。
研究人員發現 ChatGPT 對美國民主黨和英國工黨有明顯偏好。這項發現引起了人們對于該工具可能影響用戶政治立場的擔憂,尤其是在一個充滿重大全球選舉的年份里。隨著 AI 被融入經濟體系,人們對其帶來的影響和可能性提出了許多重要問題。雖然有觀點認為 AI 會促進生產力增長,但具體影響還未可知。人們特別關注的是,大規模的勞動力可能會被替換——究竟有多少工作會被 AI 取代或是得到 AI 的增強?全球不同地區的公司已在多個行業中采用 AI,而投資更多的地區似乎更傾向于自然語言處理和數據管理這樣的 AI 子領域。
本章通過分析 Lightcast, LinkedIn, Quid, McKinsey, Stack Overflow 和國際機器人聯合會 (IFR) 提供的數據,深入探討了 AI 在經濟中的趨勢。首先是對 AI 相關職業的研究,包括勞動力需求、招聘趨勢、技能應用和人才供給。章節接下來討論了企業對生成式 AI 的投資焦點,評估了企業如何采納 AI 以及開發者如何使用這些技術。最后,分析了 AI 在當前及未來經濟中的作用以及在各個行業中的機器人應用情況。
雖然去年 AI 領域的私人投資總體有所減少,但生成式 AI 的投資卻呈爆炸式增長,總額達到了前年的八倍,高達 252 億美元。在這一領域,包括 OpenAI、Anthropic、Hugging Face 以及 Inflection 等主要企業均完成了巨額融資。
2023 年,美國的 AI 投資額達到了驚人的 672 億美元,是第二大投資國中國的近九倍。與此同時,China and the European Union (including the UK) saw significant drops in their AI investments, while the U.S. enjoyed a robust increase of 22.1%.
2023 年,美國的 AI 相關職位占比由上一年的 2.0% 下降到 1.6%。這一下降主要是因為主要 AI 公司發布的職位減少以及科技職位的比重降低。
根據麥肯錫的最新調查,42% 的企業表示通過應用 AI (包括生成式 AI),他們成功降低了運營成本,而近 60% 的企業實現了收入增長。與上年相比,更多企業反映 AI 有助于減少成本,這反映出 AI 正在有效提升企業的經濟效益。
盡管私人對 AI 的投資總額比前一年有所減少,但新注冊的 AI 公司數量卻從上一年的增長了 40.6%,達到 1812 家。
根據 2023 年麥肯錫的報告,現在有超過半數的企業(55%)在至少一個部門中應用了 AI 技術,比去年的 50% 和五年前的 20% 都有顯著增長。
自 2013 年超越日本成為最大的工業機器人安裝國以來,中國的市場份額已從當年的 20.8% 激增至 2022 年的 52.4%。
自 2017 年以來,參與工作的協作型機器人比例已從 2.8% 增加到 9.9%,服務型機器人的應用也在所有領域普遍增加,醫療領域除外。這顯示了機器人的廣泛應用及其在面向人類服務角色上的增長。
在 2023 年,多項研究評估了 AI 對勞動力的影響,顯示 AI 幫助工人更快完成任務并顯著提高了工作輸出質量。這些研究還指出 AI 能有效縮小低技能和高技能工人之間的技能差距。同時,還有研究提示,如果沒有適當的監督,使用 AI 可能會導致工作效果反而下降。
2023 年中,AI 在 394 次財報電話會議中被提及,幾乎涵蓋了 80% 的財富 500 強公司,比 2022 年的 266 次有了顯著的增長。自 2018 年以來,這一數字幾乎翻了一番。最頻繁的討論主題是生成式 AI,占到了所有電話會議的 19.7%。今年的人工智能指數報告新增了關于 AI 在科學和醫學領域的章節,反映了 AI 在這些領域中的關鍵作用。2023 年,AI 幫助實現了多項科學突破,如 GraphCast 的高級天氣預報和 GNoME 的材料發現技術。本章還詳細介紹了 AI 在醫學上的應用,如 SynthSR 和 ImmunoSEIRA 的創新案例,以及 FDA 對 AI 醫療設備的批準動態。
2022 年,AI 開始加速科學的發現進程。到了 2023 年,我們見到了更多影響深遠的科學相關 AI 應用的誕生,例如 AlphaDev (使算法排序更高效) 和 GNoME (簡化材料發現流程)。
2023 年,多個重要的醫學系統被推出,例如 EVEscape (提升對疫情的預測能力) 和 AlphaMissence (助力于 AI 驅動的突變分析)。AI 的應用在醫學進步中的角色越來越不可或缺。
最近幾年,AI 在 MedQA 基準測試中的表現持續優異,這是一個測試 AI 臨床知識的重要標準。2023 年的明星模型 GPT-4 Medprompt 的準確率達到了 90.2%,比 2022 年的最高記錄提高了 22.6 個百分點,自 2019 年以來,AI 的表現提高了近三倍。
2022 年,FDA 批準了 139 個 AI 相關醫療設備,比前一年增加了 12.1%。從 2012 年開始,這一數字已經增長了超過 45 倍,顯示了 AI 在現實世界醫療應用中的廣泛使用。本章探討了人工智能和計算機科學教育的發展趨勢,著重分析了參與學習的人群、學習地點以及這些趨勢如何隨時間演變。面對對 AI 在教育中影響的增加擔憂,本章還研究了教師和學生如何使用 ChatGPT 等新興 AI 工具。
分析首先對美國和加拿大的大學及其后教育中的計算機科學與人工智能課程現狀進行了概述,此部分數據來源于計算研究協會的年度 Taulbee 調查。接著,本章回顧了 Informatics Europe 提供的關于歐洲計算機科學教育的最新數據。今年的報告中新增了一個章節,展示了 Studyportals 提供的關于全球 AI 相關英語教學項目的統計數據。
本章最后總結了 Code.org 提供的關于美國 K–12 教育階段計算機科學課程的洞見,并介紹了 Walton Foundation 的調查結果,這項調查探討了 ChatGPT 在學校中的應用情況。
過去十年里,本科生人數穩步上升,但選擇繼續深造的學生比例未見明顯增加,2018 年后,碩士和博士生數量略有下降。
從 2011 年的數據來看,當時有近半數的 AI 博士選擇了工業界或學術界。但到了 2022 年,70.7% 的博士選擇加入工業界,而只有 20% 選擇了學術界,顯示出大學和研究機構向工業界的人才流失正在加劇。
在過去幾年中,從工業界轉戰學術界的 AI 專家比例在逐年下降,2022 年這一數字降至 7%,顯示出學術界吸引行業精英的能力正在減弱。
2022 年,從本科到博士階段,國際學生的比例較前一年有明顯下降,特別是碩士階段的國際生數量顯著減少。
2022 年,AP CS 課程的考試人數達到 201,000。從 2007 年起,參考人數已增加超過十倍。但是,最新數據顯示,大型高中和郊區的學生更可能有機會學習計算機科學。
從 2017 年起,提供英語教學的 AI 相關高等教育課程已增至三倍,過去五年持續呈現年增長趨勢。世界各地的大學正在增設更多以 AI 為核心的學位課程。
在信息學、計算機科學、計算機工程和信息技術的新學士、碩士和博士生產量方面,英國和德國領先于歐洲其他國家。按人均計算,芬蘭和愛爾蘭分別在生產學士及博士生和碩士生方面領先。隨著 AI 能力的增強,越來越多的政策制定者開始關注這一領域。在過去一年中,多個國家和政治組織,如美國和歐洲聯盟,制定了多項重要的 AI 相關政策。這些政策的增加反映了政策制定者對于如何規范 AI 發展及其在本國的潛力利用的深入認識。
本章首先回顧 2023 年的全球 AI 政策制定重要時間線,接著分析全球及美國的 AI 立法動態,探討立法提及情況,并分析立法者對 AI 的看法和討論。章節進一步概述了美國和歐洲聯盟的國家 AI 策略和監管措施。最后,本章通過研究美國在 AI 上的公共投資作為結束。
過去一年和五年來,美國的 AI 相關法規數量顯著增加。2023 年,AI 相關的法規數量達到 25 項,而 2016 年只有 1 項。僅在去年,相關法規增加了 56.3%。
2023 年,歐美雙方的政策制定者們提出了重要的 AI 監管方案。歐洲聯盟在 AI 法案上達成一致,該法案是 2024 年通過的一項標志性立法。同時,拜登總統簽署了一項重大的 AI 行政命令,成為當年美國最突出的 AI 政策。
2023 年,美國聯邦層面的 AI 相關議案數量激增,提案總數從 2022 年的 88 項增至 181 項,增長超過一倍。
在全球范圍內,AI 在立法討論中的提及次數幾乎翻了一番,從 2022 年的 1247 次增至 2023 年的 2175 次。49 個國家在立法中提到了 AI,至少每個大洲的一個國家在去年討論了 AI,這體現了 AI 政策討論的全球性。
2023 年,參與 AI 監管的美國監管機構從前一年的 17 家增至 21 家,顯示出越來越多的機構對 AI 監管抱有關切。2023 年,首次參與 AI 監管的機構包括交通部、能源部及職業安全健康管理局。通常,AI 開發者與最終用戶的背景存在差異。例如,很多知名 AI 公司及其使用的數據集大多來源于西方國家,反映出西方的視角。這種多樣性的缺失可能會導致社會不平等和偏見的持續甚至加劇。
本章探討 AI 領域內的多樣性趨勢。章節開頭引用了計算研究協會 (CRA) 的數據,分析了美國和加拿大計算機科學 (CS) 領域的多樣性現狀。今年的分析中新增了來自 Informatics Europe 的數據,這些數據展示了歐洲計算機科學教育的多樣性趨勢。章節還涉及了 NeurIPS 每年舉辦的女性在機器學習 (WiML) 研討會的參與情況,并通過 Code.org 的數據,揭示了美國中學計算機科學教育的多樣性現狀。
AI 指數努力提高本章中數據的詳盡程度。尤其是在性取向等方面的人口統計數據非常有限。AI 指數呼吁與 AI 相關的各方面力量,共同努力,更好地跟蹤和記錄 AI 領域的多樣性趨勢,并期望在未來的報告中能夠提供更全面的數據。
雖然白人學生在所有三個學位層次的新畢業生中仍占最大比例,來自其他族群的學生,比如亞裔、西班牙裔以及黑人或非洲裔美國人的比例也在不斷上升。比如,自 2011 年起,亞裔計算機科學本科生比例增加了 19.8 個百分點,西班牙裔本科生比例提高了 5.2 個百分點。
調查顯示,在歐洲各國的信息學、計算機科學、計算機工程及信息技術學位中,男性畢業生比女性多。盡管過去十年間大多數國家的性別差異已有所減少,但縮減速度緩慢。
從 2007 年至 2022 年,參加高級計算機科學考試的女性比例從 16.8% 增長到 30.5%,亞裔、西班牙裔/拉丁裔及黑人/非洲裔學生的參與率也持續上升。在人工智能逐漸融入我們的日常生活的今天,了解公眾如何看待這一技術的變化顯得格外重要。這種對公眾情緒的理解,對預測 AI 將如何影響社會,以及這一技術在不同國家和不同人群中的融合方式會有何異同,都是非常關鍵的。
本章從全球、國家、人口統計和種族多個層面,全面審視了公眾對 AI 的態度。本章的分析依托于多種數據源:包括 Ipsos 進行的時間跨度上的全球 AI 態度縱向調查數據;多倫多大學對公眾如何看待 ChatGPT 的調查數據;以及 Pew 對美國民眾 AI 態度的調查。本章最后通過分析 Quid 提供的 Twitter 數據,討論了重要 AI 模型在社交媒體上的討論情況。
據 Ipsos 調查,去年認為 AI 在未來三至五年極可能重塑生活的人數比例,從 60% 上升到了 66%。同時,有 52% 的人對 AI 產品和服務持懷疑態度,較 2022 年增長了 13%。在美國,根據 Pew 的數據,52% 的美國人對 AI 感到的擔憂超過了興趣,這一比例較去年的 38% 有所上升。
2022 年數據顯示,德國、荷蘭、澳大利亞、比利時、加拿大和美國等發達西方國家對 AI 的正面感受較少。但從那以后,這些國家中每一個都有更多人開始看到 AI 的積極面,尤其是荷蘭的變化最為明顯。
在一個 Ipsos 的調查中,僅 37% 的人認為 AI 會改進他們的工作情況。只有 34% 的人認為 AI 會推動經濟發展,32% 的人認為會改善就業環境。
在看待 AI 提升生活品質的潛力時,不同年齡層的看法各有不同,年輕人通常更加樂觀。比如,有 59% 的 Z 代人認為 AI 會豐富娛樂選擇,相比之下,只有 40% 的嬰兒潮一代人持相同看法。同時,收入和教育程度較高的群體更傾向于認為 AI 會在娛樂、健康和經濟上帶來積極影響,這一點與低收入及教育程度較低的群體形成了鮮明對比。
來自多倫多大學的國際調查數據顯示,63% 的受訪者知道 ChatGPT,其中約有一半的人表示他們每周至少使用一次 ChatGPT。本文參考鏈接:2024 年人工智能指數報告 —— 由斯坦福大學人工智能研究院發布 [譯]