(本文作者王鹏为北京市社会科学院研究员,数据资产化研究院执行院长)
截止2023年5月,中国已成功发布超过79个拥有10亿以上参数的基础大语言模型,相同等级模型下,美国发布数量达到100个。全球范围内累计推出的10亿以上参数大语言模型总数为202个,其中中美两国所发布的模型总数占比近90%。相关数据体现国内于大型语言模型开发领域已跻身领先行列,本文将通过中美大型语言模型发展比较深入了解发展现状。
一、融资水平
根据PitchBook以及Crunchbase的数据,2023年上半年全球AI领域共实现融资1387起,总额达255亿美元。同时,美国维持在AI投资上的增长势头,2022年投资额达243.5亿美元,年复合增长率为422.5%。在硅谷地区,2023年上半年共完成42起AI领域容词,涉资约140亿美元,占全球总额的55%,显示了其在AI领域融资中的主导地位。与之相应的,据国内商业信息服务平台企名片数据显示,2023年上半年国内人工智能领域共发生161起投融资事件,其中包括人工智能核心技术44起,人工智能基础支撑43起,人工智能应用场景40起,人工智能通用场景34起。相较去年投融资水平,同期下降153起,同比下降49%。此外,据钦媒体数据,2023年上半年,国内披露获得投资的大模型公司仅20家,融资额普遍为千万至数亿元之间。
二、基础大模型发展水平
2023年11月21日,《财富》杂志首都揭晓“人工智能创新者50强”名单,其中绝大多数为美国企业,包括Open AI、Meta、Google以及Microsoft等行业巨头,并涉及一批入Midjourney、Adept以及ARC等新型企业。相比较下,百度为唯一一家上榜的中国公司,凭借在处理多项中文特定任务中优于Open AI聊天机器人以及与ChatGPT在复杂度与功能上相媲美的“文心一言4.0”模型赢得认可。从《财富》榜单上班企业数量上看,中美于人工智能创新力方面仍存显著差距。恰如戴琼海教授所言,中国具备最大的人工智能应用市场,但在基础科技与人才培养方面仍然落后于世界领先水平。而中国大模型在基础发展水平上落后于国际领先水平,其根本原因在于构成大模型的四大要素,分别为数据、模型、算力和场景。
(一)数据总量缺乏以及数据质量精细化程度较低
大模型训练数据源于公开文档、资料以及数据。第一,从数据数量上看,公开英文数据占主导优势,中文数据开放程度相对较低;第二,从数据质量上看,由于国内于数据产业投入以及精细化程度有限,导致了可用训练数据的进一步减少。
(二)算力资源的缺乏
百川智能创始人王小川在2023腾讯ConTech大会上介绍调研信息,Open AI尝试将1000万块GPU相连以训练单个大规模模型。而英伟达年产量约为100万块GPU,训练GPT-4需要2.5万块GPU,国内对标GPT-3.5需要4000块GPU用于训练。资源层面上,国内大模型发展严重受限于算力劣势。
(三)场景渗透率有限
2023年9月,钛媒体国际智库发布的《2023AI大模型应用中美比较研究》报告综合了大模型行业渗透度、行业接受层度以及行业应用成熟度等维度,对部分AI应用主流行业进行现状分析。在办公、金融以及医疗领域均一定程度上落后于美国。但在文娱、教育、交通以及能源领域有望实现弯道超车。
虽然国内大模型发展受限于数据、算力以及场景渗透率的落后,但在具体技术层面仍有可喜之处,目前国内于自然语言处理领域学术成果斐然。2023年8月,集微咨询(JW Insights)推出的《ChatGPT掀起AIGC新一轮热潮的背后:从学术角度分析自然语言处理技术》报告对自然语言处理领域的学术论文进行全方位解析。从论文的整体区域分布看,中美实现学术领域断层领先,相关论文数量超过1.8万篇。从发表论文机构看,中国科学院以1971篇论文的数量排名全球第一。此外,中国自然科学基金会资助的论文量最高,为8335篇。但同时需要指出的是,在具体论文影响力、撰写质量、先进性综合分析中,前50名入选论文中国内论文仅占6篇。
三、应用层发展水平
总体而言,我国大模型发展于场景应用水平仍然处于跟随状态。办公领域,微软作为智能办公引领者,于2023年3月16日正式发布Microsoft 365 Copilot,并集成于包括Word、Excel以及Powerpoint等应用程序中。用户仅需通过向其发号指令,便可自动生成文字、表格、演示文稿等内容。国内企业中金山办公同样将公司产品逐步添加AI功能,例如智能美化、智能校对等,此外介入了多个大模型供应商以满足用户AI创作需求;金融领域,根据咨询公司 Evident 的最新数据,目前美国银行的招聘中,约 40%的空缺职位是与人工智能相关的职位,例如数据工程师和量化分析师,以及合规、道德治理等职位。美国于开发应用方面起步较早并且掌握核心技术。国内AI+金融同样进入应用阶段,同时我国于该领域开发投资积极性较高,叠加近期数据政策支持,有望于金融领域实现应用发展水平的追赶。相较基础大模型发展,国内大模型于应用层发展具备一定优势。“理想上慢一步,落地上快三步”是王小川针对当前中国大模型机会的诠释。我国在应用层方面具备市场和用户基础、多样化应用场景以及政府支持和推动的优势。
(一)庞大的市场和用户基础
中国拥有巨大的人口基数,这为大模型的应用提供了丰富的数据。例如,上海人工智能实验室开发的书生浦语大模型,涵盖了数十亿参数,能够有效结合算法、数据和算力。这种大模型是在中国丰富的数据环境中训练和优化的,反映了本土环境和语境的特点。
(二)多样化的应用场景
中国的经济和社会多样性为大模型提供了广泛的应用场景。例如,在智慧城市领域,基于多模态大模型和跨模态通用人工智能平台,研发了建筑工程全闭环智能应用系统,旨在显著提升建筑行业的智能化水平。此外,智慧医疗领域也见证了大模型的成功应用,例如云知声与北京友谊医院联合开发的门诊病历生成系统,显著提升了医生的工作效率。
(三)政府支持和推动
中国政府一直在积极推动人工智能产业的发展,为大模型的应用提供了有力的政策支持。例如,北京市科委和中关村管委会积极推动大模型技术产业的发展,征集人工智能行业大模型应用案例与行业应用场景需求,加快推动相关技术及产品的落地和应用。中国政府发布了《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,旨在加速人工智能的高水平应用,推动经济的高质量发展。尽管中国在大语言模型发展上于某些方面仍然面临挑战,但其在大模型技术的应用和市场发展方面表现出了显著的活力。中国政府在推动人工智能技术,特别是大型语言模型的发展上,显示出明确的方向和决心。结合庞大的市场和用户基础、多样化的应用场景,以及政府的积极支持,中国在大模型技术的发展和应用上具有独特的优势。这不仅促进了技术创新,还为各行各业的数字化转型提供了强有力的支撑。未来,随着技术的进一步成熟和应用的深入,预计中国将在人工智能领域实现更多突破,为经济社会的高质量发展注入新动力。
本文仅代表作者观点。
标题:2023国内大模型发展情况盘点(二)--中美大模型情况发展比较
地址:http://www.hmhjcl.com/bigualu/91389.html