《人工智能指数报告2024》让我们更加了解人工智能当下进展与趋势

《人工智能指数报告2024》（Artificial Intelligence Index Report 2024）是该系列报告的第七版，它提供了迄今为止最全面的人工智能（AI）领域分析。报告涵盖了技术进步、公众对技术的看法以及AI发展的地缘政治动态等关键趋势，并通过原始数据的增加，引入了AI训练成本的新估计、对负责任AI（Responsible AI）格局的详细分析，以及一个全新的章节，专注于AI对科学和医学的影响。

报告的主要使命是提供公正、经过严格审查、来源广泛的数据，帮助政策制定者、研究人员、高管、记者和公众更全面和细致地理解AI这一复杂领域。AI指数报告被全球公认为数据和洞察力最可信和权威的来源之一，过去的版本在包括《纽约时报》、彭博社和《卫报》在内的主要报纸上被引用，并在学术界获得了数百次引用。

报告指出，十年前，世界上最好的AI系统还不能在图像中对物体进行人类水平的分类，AI在语言理解上存在困难，无法解决数学问题。然而，今天的AI系统在标准基准测试上的表现已经超越了人类。2023年，新一代的系统如GPT-4、Gemini和Claude 3在多模态能力上取得了显著进步，能够用数十种语言生成流畅的文本、处理音频，甚至解释梗图。尽管AI取得了显著进步，但它在处理事实、进行复杂推理或解释其结论方面仍存在显著问题。

报告强调，AI的发展面临两个相互关联的未来。一方面，技术持续进步并被越来越多地使用，对生产力和就业产生重大影响，可以用于好的和坏的目的。另一方面，AI的采用受到技术限制的制约。无论哪种未来成为现实，政府越来越关注。他们正在介入以鼓励积极面，例如资助大学研发和激励私人投资。政府还旨在管理潜在的负面影响，例如对就业的影响、隐私问题、错误信息和知识产权。

报告详细介绍了AI在技术进步、社区和投资、公众舆论以及政策措施方面的进展。在技术方面，2023年全球新发布的大型语言模型数量是前一年的两倍。其中三分之二的模型是开源的，但表现最好的模型来自拥有封闭系统的行业参与者。Gemini Ultra成为首个在大规模多任务语言理解（MMLU）基准测试上达到人类水平性能的大型语言模型；自去年以来，该基准测试的性能提高了15个百分点。此外，GPT-4在包括MMLU在内的全面语言模型评估（HELM）基准测试上取得了令人印象深刻的0.96平均胜率。

尽管全球私人对AI的投资连续第二年下降，但对生成性AI的投资却飙升。财富500强的收益电话会议中提到AI的次数比以往任何时候都多，新的研究表明AI显著提高了工人的生产力。在政策制定方面，全球在立法程序中提到AI的次数前所未有地高。2023年，美国监管机构通过了比以往任何时候都多的与AI相关的法规。尽管如此，许多人对AI生成深度伪造（deepfakes）和影响选举的能力表示担忧。公众对AI的认识不断提高，研究表明他们对此感到紧张。

报告还提供了以下要点：

AI在某些任务上超越了人类，但在所有任务上并非如此。AI在包括图像分类、视觉推理和英语理解在内的一些基准测试上超越了人类的表现。然而，在更复杂的任务上，如竞技水平的数学、视觉常识推理和规划方面，它仍然落后。
工业界继续在前沿AI研究中占据主导地位。2023年，工业界产生了51个值得注意的机器学习模型，而学术界仅贡献了15个。此外，2023年还有21个值得注意的模型来自工业界与学术界的合作，创下了新纪录。
前沿模型的训练成本变得非常高。根据AI指数估计，最先进AI模型的训练成本达到了前所未有的水平。例如，OpenAI的GPT-4训练使用了估计价值7800万美元的计算资源，而谷歌的Gemini Ultra的计算成本为1.91亿美元。
美国在顶级AI模型的来源方面领先于中国、欧盟和英国。2023年，61个值得注意的AI模型源自美国机构，远远超过了欧盟的21个和中国的15个。
负责任的大型语言模型（LLM）的健全和标准化评估严重缺乏。
生成性AI投资激增。尽管去年整体AI私人投资下降，但对生成性AI的资助激增，从2022年增长了近8倍，达到252亿美元。
数据显示：AI使工人更有生产力，工作质量更高。2023年，几项研究评估了AI对劳动力的影响，表明AI使工人能够更快地完成任务，并提高他们的工作质量。这些研究还证明了AI的潜力，可以弥合低技能和高技能工人之间的技能差距。然而，其他研究表明，如果没有适当的监督，使用AI可能会导致性能下降。
科学进步进一步加速，这要归功于AI。2022年，AI开始推进科学发现。然而，2023年，我们看到更多重要的与科学相关的AI应用的推出——从AlphaDev，它使算法排序更加高效，到GNoME，它促进了材料发现的过程。
美国AI法规数量急剧增加。在过去一年和过去五年中，美国的AI相关法规数量显著增加。2023年，有25项与AI相关的法规，比2016年的1项有所增加。仅在去年一年，AI相关法规的总数就增长了56.3%。
全球各地的人们更加意识到AI的潜在影响——也更加紧张。Ipsos的调查显示，在过去一年中，认为AI将在接下来的三到五年内大幅影响他们生活的人的比例从60%增加到66%。此外，52%的人对AI产品和服务感到紧张，比2022年上升了13个百分点。在美国，Pew的数据显示，52%的美国人对AI比对它感到兴奋更感到担忧，比2022年的37%有所上升。

报告还详细介绍了AI在经济、教育、政策和治理、多样性以及公众舆论方面的影响。例如，在经济领域，报告分析了AI相关职业的需求、企业投资趋势、AI在企业中的应用以及AI对劳动力市场的影响。在教育领域，报告探讨了计算机科学毕业生的数量、AI博士生向工业界的迁移以及高中阶段AI教育的普及情况。在政策和治理方面，报告审查了AI法规的数量和类型、政策制定者对AI的关注以及全球范围内AI政策的讨论。在多样性章节中，报告讨论了AI领域的性别和种族多样性，以及在教育和工业中的差异。最后，在公众舆论方面，报告分析了人们对AI的意识、对AI经济影响的看法以及不同人群对AI的乐观态度。

此外，报告还涉及了负责任AI的关键领域，包括隐私和数据治理、透明度和可解释性、安全性和安全性以及公平性。报告特别关注了AI在政治过程中的潜在影响，包括深度伪造的生成和检测、LLM的政治偏见以及AI对选举的更广泛影响。

整体来看，《人工智能指数报告2024》提供了一个全面的视角，展示了AI技术的发展、应用以及它对社会、经济和政策的深远影响。报告的数据和分析为理解AI生态系统提供了宝贵的资源，并为未来的研究和政策制定提供了指导。

完整报告下载地址：https://aiindex.stanford.edu/wp-content/uploads/2024/05/HAI_AI-Index-Report-2024.pdf