问题引发了广泛关注。随着技术的发展,数据作为关键资源的重要性日益凸显,而
2024年以来,美国关于大模型人工智能训练所面临的“数据资源枯竭”问题引发了广泛关注。随着技术的发展,数据作为关键资源的重要性日益凸显,而围绕数据资源的有效利用和持续积累将成为决定人工智能未来发展的重要因素。
目前,中美均位于人工智能发展的“第一梯队”。两国高度重视人工智能对数字经济的推动作用,来自Tortoise Intelligence的一项研究佐证了这一点,该机构表明,美国和中国的人工智能在研究、编程平台、投资和政府支出等方面居于全球领先水平。数据显示,仅中美两国所拥有的数字平台就占世界70个最大数字平台市值的90%。但美国依然在人工智能领域具有领先优势。据Stanford HAI《2024年人工智能指数报告》显示,2023年美国在人工智能领域的私人投资额达到了672亿美元,这一数额几乎是中国的9倍。此外,源自美国机构的顶级人工智能模型数量为61个,中国则仅有15个。
尽管如此,中国依旧是美国最大的竞争对手。据Stanford HAI《2024年人工智能指数报告》显示,世界上61%的人工智能专利都来自中国,且中国的机器人安装量位居世界首位。这表明中国在技术创新和知识产权保护方面取得显著进展的同时,在人工智能技术的实际应用方面也走在了世界的前列。深究这一成就的背后原OD体育官方网站因,离不开超大规模市场和可用数据资源的优势。
然而当前发展人工智能的数据资源面临着两大挑战。一是数据量的增长速度难以满足大模型训练的需求;二是已有的数据集在重复使用过程中可能会导致性能下降,即所谓的“数据损耗”。针对这一问题,业内专家提出了不同的见解。有人认为,尽管面临挑战,但大规模的数据资源依然是推动人工智能发展的关键所在。
人工智能需要数据来建立其智能,特别是机器学习。具体来说,人工智能技术能够从大数据中挖掘出有价值的信息,这些信息往往被隐藏在看似杂乱无章的数据之中。
例如,通过对社交媒体、交易记录、传感器数据等多种来源的数据进行分析,人工智能可以揭示出用户行为的趋势、市场的潜在需求或是设备的运行状况等,从而辅助决策者做出更为准确和智能的决策。
随着人工智能技术的快速发展以及大数据的不断积累,深度学习和强化学习等先进的算法也在不断地优化和演进。因此,大数据与人工智能之间的结合越紧密,人类越可以借助人工智能技术高效地分析和利用大数据,从中提取出有价值的洞见,从而推动科学研究、商业创新和社会进步。
中国在数据资源方面具有天然的优势。其庞大的互联网用户群体和活跃的数字经济生态为人工智能算法提供了源源不断的训练材料。
根据国务院发布的《“十四五”数字经济发展规划》,中国已建成全球规模最大的光纤和第四代移动通信(4G)网络、第五代移动通信(5G)网络系统;据CNNIC第53次《中国互联网络发展状况统计报告》显示,截至2023年底,中国网民规模达10.92亿人,较2022年新增网民2480万人,互联网普及率达77.5%。数据规模预计2025年将增至48.6ZB,中国已成为数据量最大、类型最丰富的国家之一。
庞大的数据背后蕴藏着巨大的资源宝藏。中国的大型互联网公司阿里巴巴、腾讯和百度等,通过其业务积累了海量的用户行为数据、交易数据和社交数据等。这些企业自有数据为人工智能的应用提供了实际场景下的数据支持。例如,阿里巴巴旗下的“鹿班”AI设计师,在短短1秒内就可以设计8000张海报,极大地提高了电商平台的设计效率和服务能力。
那么对于中国而言,在人工智能这一前沿科技领域,是否能够凭借海量的数据资源成为与美国竞争的关键优势呢?
据《全国数据资源调查报告(2023年)》显示,2023年,中国数据生产总量达32.85泽字节(ZB),同比增长22.44%,但生产总量中仅有2.9%的数据被保存;数据存储总空间为2.93泽字节(ZB),但存储空间利用率仅为59%。
中国的数据规模无疑是庞大的,其潜在的巨大价值却尚未得到充分的挖掘和释放。据统计,企业一年未使用的数据占比约四成,而开展数字化转型的大企业中,实现数据复用增值的也仅为8.3%。
一方面OD体育app免费下载,我们面临着一个现实问题,那就是大量数据在实际应用中往往存在重复利用的局限性。这意味着,许多过程性数据在完成其特定任务或使命后,会被轻易地丢弃或覆盖,从而导致这些数据的潜在价值无法得到进一步的开发和利用。
另一方面,尽管当前的技术进步使得我们能够处理和存储海量数据,但受限于大模型和训练工具的发展水平,对这些海量数据进行深度开发和利用的成本远远超过了其存储成本。
新技术的迭代能否转化成生产力的进步,是衡量一个国家竞争力的关键指标。在人工智能领域,只有将技术运用在实体产业上,才能为人工智能的发展提供更多的应用场景。
据《中国新一代人工智能科技产业发展报告2024》显示,中国人工智能企业数量已经超过4000家,人工智能已成为新一轮科技革命和产业变革的重要驱动力量和战略性技术,加速科技成果向实际生产力的转化。
例如,在制造业领域,通过引人物联网技术和数据分析工具,可以实时监测设备运行状态,不仅提高了生产效率,还产生了大量的工业数据,这些数据可以用于优化生产流程、预测维护需求等方面,进而反哺人工智能技术的发展。同样,在农业领域,精准农业技术的应用不仅提升了农业生产效率,还将收集大量的农业数据,为农业智能化提供宝贵的数据资源。
中国有着全球最大的单一市场,这为人工智能技术的应用提供了广阔的舞台。早在2018年,中国就有约32%的企业使用了人工智能相关技术,远超过美国的22%和欧盟的18%。并据相关预测,到2035年,我国人工能产业规模将达到1.73万亿元,在全球占比达30.6%。无论是智慧城市、智慧医疗,还是智能制造、金融科技OD体育app免费下载,中国都有着广泛的实验场和落地机会。
例如,在医疗领域,百度研发的AI医生能够协助医生进行诊断和开具治疗方案,提高了医疗服务的效率和准确性;在智慧城市领域,中国多个城市正在积极部署基于人工智能的城市管理解决方案,从交通监控到环境保护,从公共安全到公共服务,人工智能的应用正逐渐深人到城市管理的各个层面。
加快实体产业的数字化转型不仅是经济发展的“基本要义”,也是中国在人工智能领域的优势所在。
信息技术与创新基金会创始人兼总裁罗伯特·阿特金森就曾在其文章中表示,“加速美阈”是不够的,同时也需要“放慢中国”,美国需要限制中国从工业竞争中获利的能力,否则难以避免其在先进行业中的竞争地位受损。恰恰从侧面反映出实体产业的发展在竞争中的重要性。
中国政府高度重视实体经济与数字经济的融合发展,如《“十四五”数字经济发展规划》旨在大力推进数字化转型的同时,提高数字化赋能实体经济的效率。通过推进数字产业化、产业数字化等方式,使实体经济在技术水平、大数据管理、数字化应用等方面实现质的提升。
有效利用庞大的实体产业反哺数字经济的发展,对重塑工业体系、大力推进新型工业化的关键支撑效应正逐渐显现。中国在发展人工智能领域的积极布局,具有高度集中的战略规划和协调能力,为其加速迭代升级创造了良好的内生动力和优越的外部环境,进一步为国家的经济发展注人了新的动力。
正如古语所言,“风起于青萍之末,浪成于微澜之间”,人工智能的广泛应用,必将成为点燃第四次科技革命的新底层通用技术。
清华大学人工智能国际治理研究院(Institute for AI International Governance, Tsinghua University,THU I-AIIG)是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势,研究院面向人工智能国际治理重大理论问题及政策需求开展研究,致力于提升清华在该领域的全球学术影响力和政策引领作用,为中国积极参与人工智能国际治理提供智力支撑。