hwyzw 发表于 2025-3-30 23:52:09

2024年人工智能指数报告:内容超往年,反映AI在日常生活重要性的各章节概要

    今年的版本与往年不同,在内容方面超过往年,在规模方面超过往年,在范围方面也超过往年,这反映出人工智能在人类日常生活中越来越重要。

    以下为《2024 年人工智能指数报告》内容按章节内容概要:

    第一章:研究与发展

    2023 年,人工智能产业开发出 51 个著名的机器学习模型,而学术界仅贡献了 15 个。2023 年,还出现了 21 个产学合作的著名模型,这一数量创下新高。产业在 2023 年继续主导前沿人工智能研究。

    2023 年发布了 149 款基础模型,比 2022 年发布的数量多两倍多。其中有更多的基础模型和更多的开源基础模型。在这些新发布的模型里,65.7%是开源模型,这个比例高于 2022 年的 44.4%以及 2021 年的 33.3%。

    前沿模型的价格变得更高了。《人工智能指数报告》估计,最为先进的人工智能模型的训练成本达到了前所未有的高度。比如,GPT-4 训练时使用了约 7800 万美元的算力,谷歌的 Ultra 训练则花费了 1.91 亿美元的算力。

    美国在顶级人工智能模型的主要开发国家中处于领先地位,领先于中国、欧盟和英国。2023 年,有 61 款著名人工智能模型来自美国机构,而欧盟只有 21 款,中国有 15 款,美国的数量远远超过了欧盟和中国。

    人工智能专利数量呈现出激增的态势。在 2021 年到 2022 年期间,全球人工智能专利的授权量有了大幅的增长,增长幅度达到了 62.7%。并且从 2010 年开始,获得授权的人工智能专利数量增长了超过 31 倍。

    图注:2010 年到 2022 年期间,全球人工智能专利授权量呈现出大幅增长的态势,增长幅度达到了 31 倍以上。

    中国在人工智能专利数量方面处于领先地位。2022 年,中国在全球人工智能专利来源国中占比 61.1%并处于领先。美国占比 20.9%,中国大幅超过美国。自 2010 年起,美国人工智能专利的份额从 54.1%持续下降。

    图注:中国在人工智能专利数量上处于遥遥领先的地位

    开源人工智能研究呈现爆炸式增长态势。2011 年之后,在软件项目托管平台上,与人工智能相关的项目数量一直处于增长状态。2011 年时为 845 个,到 2023 年约有 180 万个。尤其值得关注的是,仅在 2023 年这一年,人工智能项目的数量就有了大幅度的增长,增长幅度达到 59.3%。2023 年,该人工智能项目获得了更多的 Stars。Stars 主要用于衡量项目的受欢迎程度。2022 年该项目的 Stars 数量为 400 万,2023 年增加到了 1220 万,增加的数量超过了两倍。

    人工智能刊物的数量在不断上升。2010 年到 2022 年这段时间里,人工智能刊物的总数增长迅猛,增加了将近两倍。2010 年约有 8.8 万份,到 2022 年则超过了 24 万份。去年的增长幅度大约为 1.1%。

    第二章:技术表现

    图注:2023年发布的著名大模型列表。

    人工智能在某些任务上战胜了人类,然而却不能在所有任务里都战胜人类。

    人工智能在一些基准测试方面超越了人类的表现,其中包含图像分类、视觉推理以及英语理解等。然而,在更为复杂的任务上,人工智能依然落后于人类,像竞赛级数学、视觉常识推理以及规划等。

    2、多模态人工智能出现。

    传统上,人工智能系统的功能存在局限性。语言模型在文本理解方面较为出色,然而在图像处理方面表现不佳;反之,图像处理方面的模型在语言理解方面也表现不佳。不过,最近取得的进步推动了强大的多模态模型的发展,像谷歌的和 GPT-4 这样的模型。这些模型展现出了强大的灵活性,既能够处理图像,又能够处理文本,在某些情况下甚至还能够处理音频。

    更严格的基准开始显现。在 SQuAD 等既定基准方面,人工智能模型已达到性能极限,这使得研究人员不得不去开发更具挑战性的基准。2023 年出现了一些具有挑战性的新基准。其中有用于编码的 SWE-bench,有用于图像生成的 HEIM,有用于一般推理的 MMMU,有用于道德推理的 MoCa,还有用于基于智能体行为的以及用于幻觉的。

    图注:近年来出现的更严格的基准

    更好的人工智能意味着需要更好的数据,这也就意味着会有……乃至更好的人工智能。像等新的人工智能模型正在被运用,为图像分割和 3D 重建等任务生成专门的数据。数据对于人工智能技术的改进有着极为重要的作用。利用人工智能去创建更多的数据,既增强了当前的能力,又为未来的算法改进奠定了基础,尤其在更困难的任务方面。

    人类的评估工作开始了。因为生成式模型能够产出高质量的文本和图像等,所以基准测试逐渐开始把纳入 Arena 排行榜等人工评估当作重点,不再仅仅依赖或 SQuAD 等计算机化排名。公众对于人工智能所抱有的情绪,正在成为追踪人工智能发展进程的一个越发重要的考量因素。

    大型语言模型使得机器人变得更为灵活。语言建模与机器人技术相互融合,从而产生了诸如 PaLM-E 和 RT-2 这样更灵活的机器人系统。这些模型除了能提升机器人的功能之外,还具备提问的能力,这意味着机器人在朝着能够与现实世界更高效互动的方向迈出了重要的一步。

    对 AI 智能体进行更多的技术研究。计算机科学家一直面临着创造能在特定环境中自主运行的 AI 智能体这一挑战。然而新的研究显示,自动的人工智能智能体的性能在不断提升。当前的智能体能够掌握诸如这样的复杂游戏,并且能有效地处理像在线购物等现实世界的任务。

    闭源大语言模型在性能上明显比开源大语言模型更出色。在 10 个经过精心挑选的人工智能基准测试里,闭源模型的表现要优于开源模型,其平均性能比开源模型高出 24.2%。闭源和开源模型之间的性能差异,在人工智能政策辩论中有着重要的意义。

    第三章:负责任的AI

    https://img0.baidu.com/it/u=1065239095,2623937669&fm=253&fmt=JPEG&app=120&f=JPEG?w=500&h=707

    目前对大语言模型负责任的可靠且标准化的评估极为匮乏。人工智能指数的新研究显示,在负责任的人工智能(AI)报道方面严重缺少标准化。像、谷歌等在内的领先开发公司主要依据不同的负责任的人工智能基准来测试其模型。这种行为使得系统地对顶级人工智能模型的风险和局限性进行比较的努力变得复杂。

    政治“深度伪造”()极易产生,且难以察觉。政治“深度伪造”正在对全球各国的选举产生影响。最近的研究显示,现有的人工智能“深度伪造”方法其准确性存在差异。另外,此类新项目展现了人工智能能够轻松地创建并传播虚假内容。

    研究人员在大语言模型里发现了更为复杂的漏洞。之前,人工智能模型红队的大部分精力都放在测试对人类直观而言有意义的对抗性提示上。今年,研究人员找到了能让大语言模型展现出有害行为的不那么明显的策略,例如要求模型不停地重复随机单词。

    全球企业对人工智能带来的风险表示担忧。一项针对负责任的人工智能的全球调查着重指出,企业最为关注的人工智能相关问题涵盖了隐私、数据安全和可靠性等方面。调查表明,各个组织已经着手采取行动以降低这些风险。然而在全球范畴内,多数公司到目前为止仅仅降低了一小部分这样的风险。

    大语言模型能够输出受版权保护的内容。多名研究人员指出,流行的大语言模型所生成的输出内容或许包含受版权保护的部分,像《纽约时报》的摘录或者电影里的场景。而这种输出是否构成侵权正成为一个关键的法律问题。

    人工智能开发人员在透明度方面的得分较低,这对研究产生了影响。新引入的基础模型透明度指数显示,人工智能开发人员缺乏透明度,尤其在披露训练数据和方法方面。这种开放性的缺失阻碍了进一步了解人工智能系统鲁棒性(即系统或算法在面对各种随机噪声、异常情况和攻击等干扰时的抗干扰能力)和安全性的努力。

    很难对极端的人工智能风险进行分析。在过去的一年中,人工智能学者和从业者针对算法歧视等即时模型风险以及潜在的长期生存威胁展开了一场激烈的争论。难以分辨哪些主张是有科学依据的,哪些主张应当为决策提供依据。相较于现实威胁的理论性,已经存在的短期风险使得这一困难进一步加剧了。

    人工智能突发事件的数量呈现出持续上升的态势。从追踪与滥用人工智能相关突发事件的人工智能突发事件数据库来看,在 2023 年有 123 起突发事件被报告出来,相较于 2022 年,增加的比例达到了 32.3 个百分点。并且从 2013 年开始,人工智能突发事件已经增长了 20 多倍。值得注意的例子有人工智能生成的女明星泰勒·斯威夫特的露骨性感照片,这些照片在网上被广泛分享。

    图注:近年来人工智能突发事件的数量不断攀升

    研究人员发现存在带有政治偏见的情况,且明显偏向美国民主党以及英国工党。这一发现使得人们开始担忧该工具会影响用户的政治观点,尤其是在今年全球大选年的背景下。

    第四章:经济

    生成式人工智能的投资呈现飙升态势。去年人工智能私人投资总额虽有下降,但对生成式人工智能的投资却大幅提升。自 2022 年起,其投资增长了近八倍,达到 252 亿美元。像、、Face 和等生成式人工智能领域的主要参与者,都进行了融资。

    美国已处于领先地位,在人工智能私人投资方面走得更远。2023 年,美国的人工智能投资达到 672 亿美元。美国的人工智能投资比第二大投资国中国高出近 8.7 倍。中国的私人人工智能投资下降了 44.2%。欧盟(包括英国)的私人人工智能投资下降了 14.1%。自 2022 年以来,美国在同一时期经历了 22.1%的显著增长。

    图注:2013 年到 2023 年期间,全球企业在 AI 领域的投资情况对比图。

    美国的人工智能工作在减少,全球的人工智能工作也在减少。2022 年,人工智能相关职位在美国所有职位发布中占 2.0%。2023 年,这一数字降至 1.6%。人工智能职位列表下降,是因为领先人工智能公司发布的职位减少了,并且这些公司内技术职位的比例也下降了。

    图注:2014 年到 2023 年期间,全球人工智能相关的招聘职位在所有职位中所占的百分比。

    人工智能使成本得以降低,同时让收入有所增加。麦肯锡的一项新调查表明,有 42%的受访组织称部署人工智能技术降低了成本(其中包含生成式人工智能),59%的组织称收入实现了增长。与上一年相比,报告成本下降的受访者增多了 10 个百分点,这意味着人工智能正在促使业务效率大幅提升。

    人工智能私人投资总额再度下降,同时新资助的人工智能公司数量有所增加。全球私人人工智能投资连续第二年呈现下降态势,然而其跌幅相较于 2021 年和 2022 年要低。新投入资金的人工智能公司数量急剧上升至 1812 家,与上一年相比增长了 40.6%。

    麦肯锡 2023 年的一份报告表明,目前有 55%的组织在至少一个业务部门或职能部门运用人工智能(包含生成式人工智能),这一比例高于 2022 年的 50%以及 2017 年的 20%,从而体现出人工智能组织采用率呈现上升态势。

    中国在工业机器人技术方面处于主导地位。从 2013 年起,中国超越了日本,成为工业机器人的主要安装国。之后,中国与最接近的竞争对手之间的差距明显拉大。2013 年时,中国的安装量在全球总量中占 20.8%,而到 2022 年,这一比例将提升至 52.4%。

    2017 年,协作机器人在所有新工业机器人安装中所占比例为 2.8%。到 2022 年,这一比例攀升至 9.9%。2022 年,除医疗机器人外,所有应用类别的服务机器人安装量都有所上升。这一趋势显示,机器人安装数量整体在增加,并且越来越注重部署机器人以扮演面向人类的角色。

    人工智能能让工人更具效率,还能带来质量更高的工作。在 2023 年,众多研究对人工智能给劳动力带来的影响进行了评估,显示人工智能使工人能够以更快的速度完成任务,并且提升了他们产出的质量。这些研究也证实了人工智能在缩小低技能与高技能工人之间技能差距方面的潜力。其他研究警告,尽管如此,在没有适当监督的情况下使用人工智能或许会致使性能下降。

    《财富》500 强公司开始较多地谈论人工智能,尤其是生成式人工智能。2023 年,《财富》500 强公司在 394 次财报电话会议中提及了人工智能,此比例占所有公司的 80%,与 2022 年的 266 次提及相比有显著增加。自 2018 年起,《财富》500 强企业在财报电话会议中提及人工智能的次数几乎增长了一倍。生成式人工智能是常被提及的主题,在 19.7%的所有财报电话会议中都有出现。

    第五章:科学与医学

    人工智能的崛起使得科学进步的速度变得越来越迅猛。在 2022 年,人工智能才开始被正式应用于科学发现领域。但是,仅仅过了一年,从优化算法排序效率的方面,到革新材料发现流程的 GNoME 等,我们都见证了更为重要的、与科学相关的人工智能应用的诞生。

    图注:在优化算法长度时,与人类基准对比

    人工智能助力医学取得了重大进展。2023 年,我们看到了多个具有里程碑意义的医疗系统被推出。这些系统显著提升了大流行病的预测能力,同时也协助人工智能进行突变分类。人工智能正逐渐成为推动医学进步不可或缺的力量。

    医疗人工智能知识渊博,已悄然降临。过去几年里,人工智能系统在 MedQA 基准上的表现极为出色,而 MedQA 基准是评估人工智能临床知识的重要测试。2023 年,GPT-4 模型在 MedQA 基准上达到了 90.2%的准确率,相较于 2022 年的最高分提升了 22.6%。2019 年该基准推出后,人工智能在 MedQA 上的性能提升较为明显。

    图注:四种人工智能模型在子基准测试中的性能表现

    FDA 批准的与人工智能相关的医疗设备数量在不断增加。2022 年,有 139 种此类医疗设备获得 FDA 批准。2022 年比 2021 年增长了 12.1%。从 2012 年开始,FDA 批准的人工智能相关医疗器械数量增长了 45 倍多。人工智能在现实世界的医疗目的中的应用越来越多。

    第六章:教育

    https://img2.baidu.com/it/u=307345620,1651558747&fm=253&fmt=JPEG&app=138&f=JPEG?w=800&h=1422

    在美国以及加拿大,计算机科学学士学位的毕业生数量在稳步上升。同时,计算机科学硕士学位的毕业生数量保持着较为稳定的状态,而博士学位的毕业生数量有了一定程度的增长。在过去的十多年间,美国和加拿大计算机科学专业的本科毕业生人数持续增多,然而,选择继续进行深造的研究生数量却处于停滞不前的态势。2018 年之后,计算机科学硕士毕业生的人数有了轻微下滑。同时,计算机科学博士毕业生的人数也出现了轻微下滑。

    人工智能博士向产业界流动的趋势仍在加快。2011 年时,人工智能博士在产业界的就业比例为 40.9%,在学术界的就业比例为 41.6%,二者大致持平。但到了 2022 年,这一比例出现了很大的变化,毕业后进入产业界的人工智能博士比例达到了 70.7%,而进入学术界的比例仅为 20.0%,远低于进入产业界的比例。过去一年,人工智能博士流向产业界的比例上升了 5.3 个百分点。这显示出人才从大学流向产业界的趋势在不断加剧。

    图注:2010 年至 2022 年期间,美国的 AI 博士毕业生就业趋势以及加拿大的 AI 博士毕业生就业趋势

    2019 年,美国和加拿大新入职的人工智能教师中,有一部分来自产业界,比例为 13%。到 2021 年,这一比例下降到了 11%。到 2022 年,更是进一步下滑至 7%。这表明从 2019 年到 2022 年,高水平人工智能人才从产业界向学术界的迁移在逐渐减少,即学术人才从产业界向学术界的转移较少。

    美国的计算机科学教育正逐渐变得不那么国际化,2022 年毕业的国际计算机科学硕士和博士比例低于 2021 年。加拿大的计算机科学教育也正逐渐变得不那么国际化,2022 年毕业的国际计算机科学学士、硕士和博士比例低于 2021 年。其中,硕士课程中,美国和加拿大的国际学生数量的减少尤为明显。

    越来越多的美国高中生选修计算机科学课程,然而获取信息方面存在问题。2022 年,美国有 20.1 万人次参与了 AP CS 考试。从 2007 年起,参加这些考试的学生人数增长了十多倍。但近期的证据显示,规模较大的高中以及郊区的学生在获取计算机科学课程方面更有优势。

    图注:美国要求所有高中提供计算机科学基础课程的州

    在国际上,与人工智能相关的学位课程有明显上升态势。从 2017 年开始,与人工智能相关的英语高等教育学位课程数量增长了两倍,并且在过去五年里一直保持着稳定的增长态势。与此同时,世界各地的大学都在提供更多以人工智能为重点的学位课程。

    图注:教育领域用户对的看法

    在人均基础上,爱尔兰在硕士毕业生培养方面领先。

    第七章:政策与治理

    美国人工智能法规数量有急剧增加的态势。过去一年和五年间,人工智能相关法规数量大幅上升。到 2023 年,人工智能相关法规从 2016 年的一项增至 25 项。仅去年一年,人工智能相关法规的总数就提升了 56.3%。

    美国和欧盟展开具有里程碑意义的人工智能政策行动。2023 年,大西洋两岸的政策制定者给出了推动人工智能监管的实际性建议。欧盟针对《人工智能法案》的条款达成了一致,此为 2024 年颁布的一项具有重大意义的立法。美国总统拜登签署了一项行政命令,该命令是关于人工智能的。这一举措在美国的人工智能政策中是最为引人注目的。

    人工智能引起了美国决策者的关注。在 2023 年,美国联邦一级有关人工智能的立法明显增多。立法者提出了 181 项提案,此数量比 2022 年的 88 项多出了一倍多。

    全球范围内,政策制定者们对人工智能的讨论越发热烈。在全球立法程序中提及人工智能的次数几乎翻倍,从 2022 年的 1247 次增长到 2023 年的 2175 次。2023 年,人工智能在 49 个国家和地区的立法程序中被提及,且每个大洲都至少有一个国家在这一年对人工智能相关的政策议题进行了讨论。这凸显了人工智能政策话题在全球的真正影响力。

    越来越多的监管机构开始关注人工智能。2022 年发布人工智能法规的美国监管机构有 17 个,到 2023 年增加到了 21 个,这种增长体现了美国监管机构对人工智能监管的担忧在不断增加。2023 年,像交通部、能源部和职业安全与健康管理局等一些新的监管机构也首次颁布了与人工智能相关的法规。

    第八章:多样性

    加拿大的计算机科学学士、硕士和博士生种族也越来越多样。在所有这三个教育层次的新毕业生中,白人学生依旧占据主要地位,然而其他种族学生的比例在逐步上升,像亚裔、西班牙裔、黑人或非裔美国人等群体的比例不断增长。从 2011 年起,亚裔在计算机科学领域获得学士学位的毕业生比例上升了 19.8 个百分点,西班牙裔在该领域获得学士学位的毕业生比例上升了 5.2 个百分点。

    在欧洲所有教育水平的信息学、计算机科学、计算机工程和信息技术毕业生当中,性别差距是较为显著的。每个被调查的欧洲国家都表明,在信息学等相关领域的学士、硕士和博士课程里,男性毕业生的数量比女性多。尽管在过去的十年间,大多数国家的性别差距有所减小,然而缩小的速率是相对较为缓慢的。

    图注:在 2011 年至 2022 年期间,美国以及加拿大的计算机科学专业、计算机科学与信息学院的学生性别情况(占学生总数的百分比)

    美国 K-12 计算机科学教育呈现出越来越多样化的态势,这反映了在性别和种族代表性方面的积极转变。2007 年女学生参加 AP CS 考试的比例为 16.8%,到 2022 年上升到了 30.5%。与此同时,亚裔学生、西班牙裔学生、拉丁裔学生以及非裔美国学生参加 AP CS 考试的人数都在逐年增多。

    第九章:公众舆论

    在全球范围内,公众对于人工智能的潜在影响有了更深刻的认知,并且还伴随着越来越强烈的紧张情绪。益普索开展的最新调查表明,在过去的一年里,那些认为人工智能会在未来三到五年内对自己的生活产生深刻改变的受访者的比例从 60%提升到了 66%。此外,公众对人工智能产品和服务感到紧张的比例显著上升,达到了 52%,比 2022 年增加了 13 个百分点。并且在美国,皮尤研究中心的报告表明,52%的美国人对人工智能的担忧远远超过对其的期待,此比例相较于 2022 年的 38%有了明显的增长。

    图注:2023年全球对人工智能对当前工作影响的态度

    西方国家对人工智能的看法较为保守,不过近些年有了改善。2022 年,德国、荷兰、澳大利亚、比利时、加拿大和美国等几个西方发达国家,它们对人工智能产品和服务的态度大多比较悲观。然而,随着时间的推进,这些国家中开始意识到人工智能益处的受访者的比例都在上升,其中荷兰的转变最为突出。

    公众普遍对人工智能的经济影响持悲观态度。益普索的调查数据表明,只有 37%的受访者觉得人工智能能够改善他们的工作状况。并且,在人工智能能否促进经济发展和改善就业市场这两个方面,公众的乐观程度也比较低,其中仅有 34%的受访者认为人工智能能促进经济发展,仅有 32%的受访者认为人工智能能改善就业市场。

    图注:在 2021 年至 2023 年期间,美国人对于在日常生活中逐步增加使用人工智能这一情况的感受变化状况

    不同人群在对人工智能的乐观态度方面存在明显差异。尤其在看待人工智能改善生计的潜力方面,年轻一代的态度更为乐观。比如,有高达 59%的 Z 世代受访者觉得人工智能会改善娱乐选择,然而在婴儿潮一代中,持这种观点的仅占 40%。高收入群体倾向于看到人工智能在娱乐等方面的积极影响,高教育水平群体也倾向于看到人工智能在健康等方面的积极影响,同时高收入和高教育水平群体都倾向于看到人工智能在经济等方面的积极影响。

    多伦多大学的一项国际调查表明,63%的受访者知道其存在,且这已经广为人知并被广泛使用。在知道它的这些人中,大约有一半的人每周至少会使用一次。

    获取原文PDF请添加小编微信

    编 辑:高 洁

    责 编:段少敏

    审 核:李国庆
页: [1]
查看完整版本: 2024年人工智能指数报告:内容超往年,反映AI在日常生活重要性的各章节概要