《人工智能指数报告2024》(Artificial Intelligence Index Report 2024)是该系列报告的第七版,它提供了迄今为止最全面的人工智能(AI)领域分析。报告涵盖了技术进步、公众对技术的看法以及AI发展的地缘政治动态等关键趋势,并通过原始数据的增加,引入了AI训练成本的新估计、对负责任AI(Responsible AI)格局的详细分析,以及一个全新的章节,专注于AI对科学和医学的影响。
报告的主要使命是提供公正、经过严格审查、来源广泛的数据,帮助政策制定者、研究人员、高管、记者和公众更全面和细致地理解AI这一复杂领域。AI指数报告被全球公认为数据和洞察力最可信和权威的来源之一,过去的版本在包括《纽约时报》、彭博社和《卫报》在内的主要报纸上被引用,并在学术界获得了数百次引用。
报告指出,十年前,世界上最好的AI系统还不能在图像中对物体进行人类水平的分类,AI在语言理解上存在困难,无法解决数学问题。然而,今天的AI系统在标准基准测试上的表现已经超越了人类。2023年,新一代的系统如GPT-4、Gemini和Claude 3在多模态能力上取得了显著进步,能够用数十种语言生成流畅的文本、处理音频,甚至解释梗图。尽管AI取得了显著进步,但它在处理事实、进行复杂推理或解释其结论方面仍存在显著问题。
报告强调,AI的发展面临两个相互关联的未来。一方面,技术持续进步并被越来越多地使用,对生产力和就业产生重大影响,可以用于好的和坏的目的。另一方面,AI的采用受到技术限制的制约。无论哪种未来成为现实,政府越来越关注。他们正在介入以鼓励积极面,例如资助大学研发和激励私人投资。政府还旨在管理潜在的负面影响,例如对就业的影响、隐私问题、错误信息和知识产权。
报告详细介绍了AI在技术进步、社区和投资、公众舆论以及政策措施方面的进展。在技术方面,2023年全球新发布的大型语言模型数量是前一年的两倍。其中三分之二的模型是开源的,但表现最好的模型来自拥有封闭系统的行业参与者。Gemini Ultra成为首个在大规模多任务语言理解(MMLU)基准测试上达到人类水平性能的大型语言模型;自去年以来,该基准测试的性能提高了15个百分点。此外,GPT-4在包括MMLU在内的全面语言模型评估(HELM)基准测试上取得了令人印象深刻的0.96平均胜率。
尽管全球私人对AI的投资连续第二年下降,但对生成性AI的投资却飙升。财富500强的收益电话会议中提到AI的次数比以往任何时候都多,新的研究表明AI显著提高了工人的生产力。在政策制定方面,全球在立法程序中提到AI的次数前所未有地高。2023年,美国监管机构通过了比以往任何时候都多的与AI相关的法规。尽管如此,许多人对AI生成深度伪造(deepfakes)和影响选举的能力表示担忧。公众对AI的认识不断提高,研究表明他们对此感到紧张。
报告还提供了以下要点:
- AI在某些任务上超越了人类,但在所有任务上并非如此。AI在包括图像分类、视觉推理和英语理解在内的一些基准测试上超越了人类的表现。然而,在更复杂的任务上,如竞技水平的数学、视觉常识推理和规划方面,它仍然落后。
- 工业界继续在前沿AI研究中占据主导地位。2023年,工业界产生了51个值得注意的机器学习模型,而学术界仅贡献了15个。此外,2023年还有21个值得注意的模型来自工业界与学术界的合作,创下了新纪录。
- 前沿模型的训练成本变得非常高。根据AI指数估计,最先进AI模型的训练成本达到了前所未有的水平。例如,OpenAI的GPT-4训练使用了估计价值7800万美元的计算资源,而谷歌的Gemini Ultra的计算成本为1.91亿美元。
- 美国在顶级AI模型的来源方面领先于中国、欧盟和英国。2023年,61个值得注意的AI模型源自美国机构,远远超过了欧盟的21个和中国的15个。
- 负责任的大型语言模型(LLM)的健全和标准化评估严重缺乏。
- 生成性AI投资激增。尽管去年整体AI私人投资下降,但对生成性AI的资助激增,从2022年增长了近8倍,达到252亿美元。
- 数据显示:AI使工人更有生产力,工作质量更高。2023年,几项研究评估了AI对劳动力的影响,表明AI使工人能够更快地完成任务,并提高他们的工作质量。这些研究还证明了AI的潜力,可以弥合低技能和高技能工人之间的技能差距。然而,其他研究表明,如果没有适当的监督,使用AI可能会导致性能下降。
- 科学进步进一步加速,这要归功于AI。2022年,AI开始推进科学发现。然而,2023年,我们看到更多重要的与科学相关的AI应用的推出——从AlphaDev,它使算法排序更加高效,到GNoME,它促进了材料发现的过程。
- 美国AI法规数量急剧增加。在过去一年和过去五年中,美国的AI相关法规数量显著增加。2023年,有25项与AI相关的法规,比2016年的1项有所增加。仅在去年一年,AI相关法规的总数就增长了56.3%。
- 全球各地的人们更加意识到AI的潜在影响——也更加紧张。Ipsos的调查显示,在过去一年中,认为AI将在接下来的三到五年内大幅影响他们生活的人的比例从60%增加到66%。此外,52%的人对AI产品和服务感到紧张,比2022年上升了13个百分点。在美国,Pew的数据显示,52%的美国人对AI比对它感到兴奋更感到担忧,比2022年的37%有所上升。
报告还详细介绍了AI在经济、教育、政策和治理、多样性以及公众舆论方面的影响。例如,在经济领域,报告分析了AI相关职业的需求、企业投资趋势、AI在企业中的应用以及AI对劳动力市场的影响。在教育领域,报告探讨了计算机科学毕业生的数量、AI博士生向工业界的迁移以及高中阶段AI教育的普及情况。在政策和治理方面,报告审查了AI法规的数量和类型、政策制定者对AI的关注以及全球范围内AI政策的讨论。在多样性章节中,报告讨论了AI领域的性别和种族多样性,以及在教育和工业中的差异。最后,在公众舆论方面,报告分析了人们对AI的意识、对AI经济影响的看法以及不同人群对AI的乐观态度。
此外,报告还涉及了负责任AI的关键领域,包括隐私和数据治理、透明度和可解释性、安全性和安全性以及公平性。报告特别关注了AI在政治过程中的潜在影响,包括深度伪造的生成和检测、LLM的政治偏见以及AI对选举的更广泛影响。
整体来看,《人工智能指数报告2024》提供了一个全面的视角,展示了AI技术的发展、应用以及它对社会、经济和政策的深远影响。报告的数据和分析为理解AI生态系统提供了宝贵的资源,并为未来的研究和政策制定提供了指导。
完整报告下载地址:https://aiindex.stanford.edu/wp-content/uploads/2024/05/HAI_AI-Index-Report-2024.pdf