纯阳书评第578期《纯阳子讲人工智能系列之五:当前大模型AI盘点和下一步趋势》
上一期讲了大模型AI的真正影响和本质意义,认为大模型绝不是有些观点所认为的只是又一种效率工具,而是一种蕴涵着改写人类发展轨道巨大能量的新生事物,将重塑知识创造模式,重塑知识传承模式,重塑生产力,重塑生产要素,重塑生产关系,未来还将重塑一切。本期简要梳理一下大模型AI的当前情况和下一步趋势。
中美两国是大模型研究的绝对主力,大模型的数量占到全球大模型数量的近90%。所以中美两国的大模型研究现状就约等于全球的大模型研究现状。
第一、美国大模型率先突破,保持一路领先
美国作为科技领域的传统强国,其在大模型研究上的投入和成果一直走在世界前列所以率先取得实质性突破,且一路领先。这些大模型在自然语言处理、计算机视觉、语音识别等多个领域都有广泛应用,在AI芯片、云计算基础设施等方面也具有显著优势。
1、Open AI 的GPT和SORA大模型
作为最为著名的人工智能研究领域领军者之一,OpenAI公司推出了两大杀手级模型。其一是轰动一时的GPT系列,大家耳熟能详的ChatGPT就是GPT-3.5系列的一部分,因其自然语言对话、问题解答、内容生成、代码撰写和理解上下文的强大能力,一经上线就迅速引爆整个网络,成为人们关注的热点。
目前该系列最新版本是GPT-4系列,发布于2023年3月,是一个多模态大型语言模型,能够同时处理文本和图像输入。其视觉版本GPT-4V发布于2023年9月,专注于图像和视频内容的理解和生成。其高效版本GPT-4 Turbo发布于2023年11月,提供了更快的响应时间和更高的吞吐量。该系列模型在自然语言处理、学习和推理能力方面表现突出,能够理解和生成复杂的文本内容,处理多种语言任务。
另一个杀手级模型是该公司在2024年初推出的Sora视频生成模型,能够从文本指令生成长达60秒高清视频的能力,展现出了对三维空间的连贯性、长期性描述,对数字世界的写实性、连续性模拟。因视频效果震撼人心,远超预期,被广泛认为是大模型在视频生成领域的一项超重量级突破,成为2024年的第一个AI爆点。
2、Google 的Gemini大模型
Google公司在AI基础理论研究中的江湖地位不可撼动,稍有犹豫,就被Open AI抢了先,改弦更张后,就拿出了大手笔。
2023年12月发布了具有里程碑意义的多模态人工智能模型Gemini。这款模型设计用于理解和处理多种类型的数据,可以统合处理文本、图像、音频、视频和代码等多种模态,具备多模态原生的能力,可以跨越不同的模态进行学习和推理,从而实现了对复杂信息的统一理解和表达。
Gemini处理多模态数据时表现出了优越性能,在某些方面已经超越了Open AI当前最先进的GPT-4模型。
3、亚马逊公司的Titian大模型
亚马逊公司早已把IT技术能力当作了核心能力之一,所以在大模型AI训练上也紧跟潮流,利用其全球最大的云计算资源,积极布局。于2023年4月发布了Titian大模型,该模型包括多种版本,如Titan Text Express、Titan Text Lite、Titan Text Embeddings、Titan多模态嵌入和Titan Image Generator,可以分别针对不同的应用场景。
除了以上三家公司,Meta、Apple、Anthropic、微软等公司也积极布局大模型领域,均已取得不俗成果。
第二、中国大模型奋勇直追,发动百模大战
在美国大模型进步的牵引下,尤其在2022年12月ChatGPT横空出世的刺激下,中国以互联网巨头为主要核心的众多机构奋勇直追,掀起了百模大战的宏大场面。陆续发布大模型,到2023年6月份即达79个,4个月后的10月份竟达238个。
1. 百度的文心一言大模型
2023年3月16日百度发布了文心一言大模型,亮点是中国首个面向大众用户的大规模语言模型,旨在满足用户在文学创作、商业文案写作、数理逻辑推理、中文语境理解和多模态生成等多种场景下的需求。文心一言具备跨模态、跨语言的深度语义理解与生成能力,不仅能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感,还能够基于多轮对话进行推理与创作,辅助人类进行多轮任务处理。
2、阿里巴巴的通义千问大模型
阿里巴巴于2023年4月发布了通义千问大模型,具有多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能,融入了多模态的知识理解,能够续写小说、编写邮件。亮点是打造了业界首个AI统一底座,构建了大小模型协同的层次化人工智能体系,为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。
3. 华为的盘古大模型
2023年7月华为发布了盘古大模型3.0,该模型亮点是面向行业的大模型,采用三层架构,包括基础大模型、行业大模型和场景模型。重点面向政务、金融、制造、医药、矿山、铁路、气象等行业。盘古大模型包括盘古NLP、CV、多模态、预测和科学计算大模型,覆盖语言、视觉、跨模态信息、预测和科学计算等领域。目前已应用于多个行业,特别在气象领域,盘古大模型在台风路径预报和欧洲中期预报中心的实测中表现出色,精度超过传统方法,速度提升10000倍以上,展示了卓越的预测能力。
4. 腾讯的混元大模型
2023年9月,腾讯正式发布混元大模型,拥有超千亿参数规模,预训练语料超2万亿tokens,能够跨模态处理文本、图像、语音等多种类型的数据,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力,可以应用于各种智能对话场景。2024年4月该模型完成了技术架构升级,参数规模达万亿,擅长处理复杂场景和多任务场景。
5. 智谱华章的智谱清言大模型
智谱华章于2023年10月27日,推出了全自研的第三代基座大模型ChatGLM3,亮点是国内首个具备代码交互能力的大模型产品。ChatGLM3采用了独创的多阶段增强预训练方法,集成了自研的AgentTuning技术,激活了模型智能体能力,尤其在智能规划和执行方面有显著提升,支持图像处理、数学计算、数据分析等使用场景。
6、科大讯飞的讯飞星火大模型
科大讯飞于2024年1月发布了讯飞星火大模型V3.5,亮点是首个基于全国产化算力平台“飞星一号”训练的全民开放大模型。其中在语言理解、数学能力方面超过了GPT-4 Turbo,代码能力达到GPT-4 Turbo的96%,多模态理解达到GPT-4V的91%。拟于2024年6月发布的讯飞星火大模型V4.0,将全面对标当前的最高水平。
7、浪潮的源大模型
浪潮的“源”大模型是浪潮信息在人工智能领域的重要成果。亮点是源1.0早于ChatGPT,于2021年9月发布,模型参数量达到2457亿,超越GPT-3,一度成为当时全球最大规模的AI大模型。其在中文语言理解方面表现出色,尤其在CLUE榜单的零样本学习和小样本学习两类总榜中获得冠军。2023年11月27日正式发布源2.0,除了各方面性能提升外,“源2.0”采用全面开源策略,全系列模型参数和代码均可免费下载使用,有利于打破模型孤岛和加快商业化进程。
8、用友的YonGPT大模型
2023年7月27日在北京正式发布用友企业服务大模型YonGPT,亮点是业界首个专门针对企业服务领域的大型模型,覆盖了企业财务、人力资源和包括营销、研发、采购、制造、供应链、项目、资产营运等业务的多个企业生产经营与运营管理领域,是一个多领域融合化、多形态综合型的企业服务大模型。
除此之外,商汤科技、360、中科院、百川智能、上海人工智能实验室、京东、中国电信等组织也纷纷投资大模型研发,发布了自己的大模型。
第三、大模型的未来趋势
正是因为中美两国都看到了大模型AI的巨大能量和无限潜力,认识到大模型AI将会重塑生产力、重塑生产关系,重塑未来世界格局,所以一个猛卡,一个猛追。
《纯阳子讲人工智能系列之二:大模型AI为什么能?!》中讲到算力、算法和数据是大模型爆发的三要素,而算法是公开的,数据也不是问题,所以大家自然会在算力上博弈,由此可见美国猛卡中国半导体,猛掐中国芯片研发能力,表面上矛头指向芯片半导体,实质上指向了中国的算力,再往深里边走,目标是未来的AI智能体,其目的是要锁定中国的生产力。
今日中美两国的大模型相对优势,决定了未来大模型的趋势。
1、美国的优势
相对于中国,美国最明显的优势有两个,分别是技术领先优势和算力优势。
先说技术领先优势,美国拥有众多世界顶尖的科技公司和研究机构,如谷歌、OpenAI、微软、Meta、Apple等,这些公司在人工智能和机器学习领域投入巨大,技术积淀深厚,推动美国在大模型的研发和应用领域率先取得突破,并一直保持领先地位,这一点在短期内尚难以改变。
其次是强大的计算资源优势,正如第一期和第二期讲到算力是大模型训练的基础动力,没有足够算力,就无法开展大规模数据的模型训练,也就不可能基于大规模参数阈值的突破,去获得智能的系统性涌现,也就不可能不断取得ChatGPT和SORA级别的尖叫式突破。而美国相对于中国拥有某种芯片自由,可以无障碍的获取最新的GPU、TPU,所以美国的算力优势相当明显。
2、中国的优势
相对于美国,中国最明显的优势也有两个,分别是数据优势和人才优势。
先说数据优势,AI突破三要素,数据是AI突破的粮食,数据越多,数据质量越高,AI能学到的智能越多,AI发现的知识也就越多,所以数据对于AI的质量影响深远。那么数据来自于哪里?来自与生产和生活之中,中国作为全球生产制造的王者和超大规模消费市场的王者,这就意味着中国具有美国不可比拟的数据优势和场景优势。
道理很简单,同样一个应用,百万级用户的数据量和亿级用户的数据量不是一个档次,用这两种层次的数据去训练AI,得到的AI智能也就不在一个段位。
同样地,生产场景多和消费场景多,机器能够拿到的场景数据类型就多,细节才是魔鬼,魔鬼都在场景里,所以机器学到和发现的知识也就多。因此相对于制造业空心化和人口规模逊色的美国,中国的数据优势是强而有力的。
再说人才优势,现在正处于大模型AI取得初步突破,正在向通用AI进发的关键时期,所以亟需大量有理工科背景的专业人才,亟需工程师,这些人将成为AI进一步突破的助产士。而中国每年培养的理工科人才数量显著超过美国,预计到2025年中国每年将培养超过7.7万名理工科博士,而美国则大约为4万名左右,中国每年培养的理工科博士毕业生人数将是美国的接近两倍。理工科硕士和本科生中国同样具有优势。
所以在这场中美双雄博弈中,中国具有实实在在的人才资源优势。
3、未来的趋势
站在这里,远眺前方的那里,隐约能看到三点痕迹。
一是中美大模型性能差距会拉大,但不会拉很大。
业界普遍认为,中美之间的大模型差距大约为1-2年。鉴于美国已经在芯片半导体上下了狠手,而且预计未来还会越来越狠,而中国自主芯片完全跟上尚需一点时间,所以中国大模型算力上短期内会受一些不可避免的影响,有可能进一步拉开一定差距。另一方面,中国除了加快芯片研发进度之外,也会采取其他技术手段,变通弥补算力缺口,所以中美大模型差距又不会拉得太大。
二是中国将在垂直应用领域遍地开花。
通用大模型性能提升对算力要求很高,但是垂直领域大模型对算力要求就没有那么高了,而中国又在生产和消费领域中存在大量场景需求,既然算力不是问题,所以中国会在垂直应用领域中积极利用现有通用大模型成果反客为主,积极落地,取得实效,实现应用上的反超。
三是联袂前行,超越其他玩家
在任何高度竞争的科技领域中,当行业领头羊之间展开激烈的较量时,其产生的冲击波往往会对其他市场参与者造成深远影响。在中美两国在人工智能领域的角力对决中,双方均充分利用各自的优势资源,致力于弥补存在的短板,加大研发投入力度,以实现人工智能技术的快速迭代升级和广泛应用拓展。
美国依托其领先优势和强大的资源能力,在人工智能的基础理论研究、关键技术突破和高端应用场景上不断刷新纪录。与此同时,中国也凭借其海量的数据资源、庞大的市场规模,在人工智能领域奋起直追,取得了诸多重要成果。
中美双雄争霸的过程中,双方不断攀登技术高峰,挖掘应用场景,双方都将收获技术突破和产业升级的果实,这固然会极大地推动全球人工智能产业的整体进步和发展,但对于其他玩家而言,无疑意味着巨大的挑战和压力,面临着被边缘化甚至被淘汰出局。他们在竞争中可能会遭受排挤,应有份额可能被巨头夺取。在技术创新方面,由于资源有限,难以跟上中美的足迹,难以在竞争激烈中寻找到属于自己的立足之地。