自行业先驱OpenAI公司于2018年推出全球首个AI大模型GPT1、于2022年推出首个“爆款”模型ChatGPT3.5以来,全球各国掀起了大模型研发浪潮,众多大型科技企业、初创企业、研究机构等纷纷投入通用大模型的研发中,形成“百模大战”。
相比早期的AI模型产品,现阶段的AI大模型是“通用”大模型,已经初步脱离特定任务“工具”层面、迈入通用智能阶段,不仅表现在其内容理解、内容生成、逻辑推理、知识记忆等基础能力获得重大提升,也表现在其基础能力具有良好的泛化性,可以就特定行业知识、特定任务类型进行优化调试,习得各行各业的细分技能,与人类劳动者的技能培训可塑性类似。
AI大模型的强大技术能力,使得其在各行各业具有广泛的应用潜能,相关技术及产业的持续发展,有望成为推动经济社会进一步发展、全要素生产率进一步提升的重要因素之一。本文就AI产业生态、发展现状及未来发展方向进行简要介绍与梳理,可作为读者了解AI产业的参考之一。
一、AI产业生态
AI即人工智能,指利用数字计算机或其控制的设备,通过感知环境、获取知识、推导演绎等方法,模拟、延伸和扩展人类智能的理论方法及技术系统。
AI产业生态由基础层、技术层和应用层构成。基础层提供算力、数据和算法支撑;技术层以通用大模型(以下简称“AI大模型”或“大模型”)为基础,通过算法开发形成底层技术能力,是AI系统的智力中枢;应用层以技术层和基础层的能力为基础,根据具体场景进行技术部署。
AI产业生态基础层包括算力、数据和算法框架。算力方面,主要由云计算、服务器等厂商基于芯片、网络设备等关键器件部件,提供云端调度或本地部署的算力硬件支持;数据方面,主要由数据服务商汇集数据资源,并进行清洗、标注等数据加工工作;算法方面,AI算法框架厂商为AI开发者开源提供算法框架。
AI产业生态技术层以通用大模型作为基础,垂直应用模型、其他技术模块作为补充。通用大模型分为生成式大模型和推理大模型两类,分别具备快速响应优势与逻辑推理能力优势。在模型训练阶段,通用大模型可作为垂直应用模型的基础,即在通用大模型的基础上结合特定场景微调得到垂直应用模型;在使用阶段,通用大模型和垂直应用模型或补充技术模块可并行使用、相互分工,由通用大模型解决通用类问题,由垂直应用模型解决相对复杂的专业类问题,由补充技术模块解决更细化的专业任务,并发挥后两者细分任务分析精度更高、算力要求更低、响应速度更快的优势。
AI产业生态应用层主要由智能软件系统与智能硬件系统组成,智能软件系统包括企业大脑类、智慧城市类、各领域办公软件等应用程序,能够集成AI大模型技术进行功能与性能的迭代升级;智能硬件终端包括消费电子产品及医护机器人、自动驾驶汽车等产品,通过集成AI大模型技术,提升认知层次与能力泛化性。
二、AI大模型技术优劣势评析
1.AI大模型技术优势:相比传统AI模型,在四大基础能力上有重大提升
与传统AI模型相比,AI大模型在知识记忆、内容理解、内容生成和逻辑推理方面,性能都有显著提高:
一是知识记忆方面,可将训练时使用的海量信息进行抽象化理解与吸收,通过建模转化为上千亿参数之间的数学计算逻辑,并通过计算方式提取,因此,其对信息的记忆与调用并不是“查字典”式的引用,而是基于自身的理解进行知识吸收与输出;
二是内容理解方面,对文字、图片和对话意图等内容的理解水平逐步接近人类,能够捕捉文本关键词或图片关键内容,分析关键部分对应的意义或情绪等;
三是内容生成方面,能够生成原创且连贯的文本,并根据现有数据生成新内容,其可基于大量文本数据的训练,抓取内在联系与人类使用模式,并通过基于对话回答问题、基于指令生成内容两种方式进行输出;
四是逻辑推理方面,实现“快、慢思考”两种模式,对于简单问题可根据统计概率论原理推算结果,对于复杂问题可将问题拆解为一系列有逻辑关系的多层思考步骤进行推演。
2.AI大模型存在的不足:相比人类智能,认知层次或存在根本性缺陷,同时存在多维度安全问题
AI大模型的认知层次或仍停留在统计概率层面,从而长期存在重大能力短板。国内外大量权威学者认为,现有AI大模型所输出的内容主要是对现有知识进行最符合统计概率分布的“拼图重组”,而根本性缺乏世界经验或人类般的思维模式和心智模型。若该观点属实,则AI在取得算法架构上的重大突破之前,将长期存在真实准确性、逻辑智力、创造能力等方面的深层次能力短板。
同时,AI大模型还可能遇到各式恶意操作者,带来多维度安全挑战。若不对相关安全隐患加以防范,可能造成全社会范围的安全威胁,而若对AI大模型的正常用途进行过严的限制,可能对模型的正常使用造成阻碍。主要的恶意操作者有:一是恶意网络黑客,或将AI大模型用于自动化攻击、深度伪造欺诈、对抗性攻击等领域;二是恶意使用者,或利用AI从事生成恶意代码、编写钓鱼邮件、密码破译等犯罪活动,甚至研发生物武器、策划恐怖行动、创作违法信息等其他犯罪行动;三是恶意开发者,或在大模型的后训练阶段篡改模型善恶取向等“价值观”,使模型系统性产出危险内容。
三、AI产业主要发展方向
未来,AI产业将呈现AI大模型技术持续提升、AI技术生态不断丰富、AI应用形态不断深化等主要发展方向。
1.通过拓展高质量数据、强化推理策略、创新算法架构等方式,促进AI大模型性能不断提升
AI大模型厂商将继续通过拓展高质量数据、强化推理能力、创新新型算法架构等方式,不断提升AI通用大模型的技术性能,有望推动大模型以“顿悟”的形式提升在逻辑智力等方面的根本性短板。
高质量数据拓展方面,大模型训练严重依赖互联网公开数据,经预测或在2026年濒临数据枯竭。未来技术发展路径有二:
(1)生成合成数据,即基于GANs算法、VAE算法等技术,按照现实场景数据规律生成能够模拟交互场景的虚拟数据,预计2030年合成数据会成为AI训练的主要数据来源;
(2)使用AI企业掌握的私有数据,如Google、Meta等企业拥有大量独家数据资源,有望获得一定优势。
推理能力强化方面,目前大模型仅能完成简单任务,对复杂任务和长文本分析等缺乏推理能力,需要多措并举,强化模型逻辑思维能力与可靠性:
(1)强化思维链训练、深度学习等方法提高模型推理能力;
(2)采用RAG检索增强技术,使大模型在内容生成过程中更严格地与信息来源进行校对,从而减少生成内容的“幻觉”等错误。
算法架构创新方面,原有的Transformer架构的模型计算成本高、效率低,且存在“幻觉”等问题,亟须研发全新算法,主要有三个路径:
(1)优化Transformer架构,如通过MoE结构等,优化算力调用效率;
(2)基于Transformer架构基础上进行微调,如结合Transformer与RNN、CNN形成混合架构;
(3)开发区别于Transformer的新型架构,如实验室阶段的GyberDemo、H20等。
2.打造并丰富垂直应用模型、小模型终端应用技术生态,促进AI技术广泛渗透应用
AI技术厂商将基于大模型,开发垂直应用模型、终端小模型应用等,形成大模型、垂直应用模型、终端小模型并存互补的技术生态,促进AI技术形成更高的专业知识精度和更小的算力成本,从而可以在细分产业、下沉应用领域进行广泛渗透。
开发垂直应用模型方面,当前AI大模型在部分专业行业领域的知识深度、结构多样性等方面尚无法满足使用需求,需要进一步开发垂直大模型以供专业行业领域使用。未来,业界有望以AI大模型为基础,使用特定领域标注数据进行监督式微调,增强模型对特定任务的理解和响应精度,研发形成行业专有大模型。
开发终端小模型方面,AI大模型在终端的应用存在算力需求量大、响应延迟等问题,难以在下沉场景广泛普及。未来,业界有望持续通过知识蒸馏、提示工程、高效微调技术等方法,从AI大模型中提取关键知识并训练应用于细分任务、算力需求较低的小模型,促进AI模型在终端场景的全面普及。
3.围绕终端工作场景,持续完善“AI员工”、具身智能等应用形态,扩展应用范围、加深应用层次AI下游应用厂商将依据各类脑力、体力劳动类工作岗位的能力要求,基于大模型等技术层提供的能力底座,持续迭代发展“AI员工”能力、开发AI具身智能技术,促进AI技术不断完善应用形态、扩展应用范围、加深应用层次,在经济社会的各个方面进行赋能。
迭代发展“AI员工”能力方面,脑力劳动类工作的分析、决策压力较大,需要部署AI进行辅助。未来,“AI员工”或将依据三个层次迭代演进,渐次强化应用深度与自主性:
(1)基于现有AI系统开发垂直模型增强模块,自动化完成部分标准化业务流程,如自动分析企业舆论风险、增强传统信贷评估模型的准确性与全面性;
(2)开发特定领域AI助手,依据指示协助完成碎片化工作流程的协助,如AI助手协助生成文案框架、润色语法错误、创作内容草稿等;
(3)发展AI智能体,自主调用其他AI助手、应用软件、数据接口等技术工具,独立完成复杂任务。
开发AI具身智能应用方面,人口老龄化趋势下,机械制造、货物搬运、建筑施工、养老照护等体力劳动工作岗位面临巨大劳动力缺口,亟须开发具身智能技术,解决现有AI技术“有脑无手”的问题。近年来,AI大模型驱动具身智能技术快速进步,能够将多个功能模块统一融合,具备多模态信息感知、理解与转换能力,极大提升了通用性和泛化性。目前具身智能的环境适应力、执行精度等方面仍不具备大规模商用化条件,业界正在围绕“感知+决策”“感知+决策+行动”等多条技术路线进行研发,有望在10年以内开启具身智能商业化应用进程。