01 AI行业探析
01 AI行业探析
引言
计算机技术是人类发明创造的巅峰之作,从巴贝奇和艾达·奥古斯塔基于纯机械工程设计的第一台计算机,到以图灵为代表的现代电子计算机的发展;从认为计算机只能按照人类编好的程序来执行既定任务,到提出计算机可以模拟出人类思维,可以像人一样“独立思考”。人类一直在人工智能(Artificial intelligence,AI)的发展方向上不断探索。
1.AI技术发展历程
1.1 AI技术的起源和发展历史
从 1956 年达特茅斯会议第一次提出 AI 概念以来,AI 技术的发展从未停止。人工智能经历了三次发展高潮,分别是 1956-1970 年代,1980-1990 年代和 2000 年代至今。
1959 年 Arthur Samuel 提出了机器学习,推动人工智能进入第一个发展高潮期。此后 70 年代末期出现了专家系统,标志着人工智能从理论研究走向实际应用。
80 年代到 90 年代随着美国和日本立项支持人工智能研究,人工智能进入第二个发展高潮期,期间人工智能相关的数学模型取得了一系列重大突破,如著名的多层神经网络、BP 反向传播算法等,算法模型准确度和专家系统进一步提升。期间,研究者专门设计了 LISP 语言与 LISP 计算机,最终由于成本高、难维护导致失败。1997 年,IBM 深蓝战胜了国际象棋世界冠军 Garry Kasparov,是一个里程碑意义的事件。
当前人工智能处于第三个发展高潮期,得益于算法、数据和算力三方面共同的进展。2006 年Geoffrey Hinton教授提出了深度学习的概念,极大地发展了人工神经网络算法,提高了机器自习的能力,随后以深度学习、强化学习为代表的算法研究的突破, 算法模型持续优化,极大地提升了人工智能应用的准确性,如语音识别和图像识别等。随着互联网和移动互联的普及,全球网络数据量急剧增加,海量数据为人工智能大发展提供了良好的土壤。大数据、云计算、边缘计算等信息技术的快速发展,GPU、NPU、FPGA 等各种人工智能专用计算芯片的应用,极大地提升了机器处理海量视频、图像等的计算能力。
1.2 AI技术的发展方向
在算法、算力和数据能力不断提升的情况下,人工智能技术快速发展。纵观其发展方向,经历了从决策式AI到生成式AI的过程。
在2010年之前,AI以决策式AI为主导,决策式AI学习数据中的条件概率分布,底具逻辑是AI提取样本特征信息,与数据库中的特征数据进行匹配,最后对样本进行归类,主要针对对样本的识别和分析。
2011年之后随着深度机器学习算法以及大规模预训练模型的出现,AI开始迈入生成式AI时代,生成式AI的特征是可以根据已有的数据进行总结归纳,自动生成新的内容,在决策式AI决策、感知能力的基础上开始具备学习、执行、社会协作等方面的能力。
当下人工智能在生成(Generation)和通用(General, 即Artificial General Intelligence,AGI)的双G主线上不断发展。
2. AI技术概述
2.1 AI技术的定义
人工智能(Artificial intelligence,AI)指使用机器代替人类实现认知、识别、分析、决策等功能,其本质是对人的意识与思维的信息过程的模拟,是一门综合了计算机科学、生理学、哲学的交叉学科。凡是使用机器代替人类实现认知、识别、分析、决策等功能均可认为使用了人工智能技术。
人工智能技术为千行百业赋能,实现各类应用场景落地,现阶段已发展成为主流趋势,AI 技术商业价值不断增长,产品形态和应用边界也在持续拓宽。
2.2 AI的行业驱动力
在AI发展的不同阶段,驱动力各有侧重,可以将AI的发展划分为三个阶段:技术驱动阶段、数据驱动阶段和场景驱动阶段。
2.2.1 技术驱动(算法+算力)
技术驱动阶段集中诞生了基础理论、基本规则和基本开发工具。在此阶段,算法和算力对AI的发展起到主要推动作用。
计算机视觉、自然语言处理和语音识别是 AI 技术落地需求最大、速度最快的三个方向,近些年来学界和业界在目标识别、对话交互等领域都有大量的投入和产出。
- 计算机视觉(computervision,CV)是指用计算机来模拟人的视觉系统,实现人的视觉功能以适应、理解外界环境和控制自身运动。主要解决的是物体识别、物体形状和方位确认以及物体运动判断这三个问题。计算机视觉关注目标检测与分类、迁移与小样本学习和行为识别,分别解决了“去背景”“是什么”、“干什么”的问题。其应用场景可以分为图形识别和人脸识别。
- 自然语言处理(Natural Language Processing,NLP)是人工智能和语言学领域的分支学科,探讨如何使计算机理解、解释和生成自然语言。自然语言处理领域的应用聚焦机器学习、对话交互系统和机器翻译。
- 语音识别是将语音转换为文本的技术,是自然语言处理的一个分支。前台主要步骤分为信号搜集、降噪和特征提取三步,提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码,最终把语音转化为文本,实现达到让机器识别和理解语音的目的。
现在主流应用的基于多层网络神经的深度算法,一方面不断加强从海量数据库中自行归纳物体特征的能力,一方面不断加强对新事物多层特征提取、描述和还原的能力。对算法来说归纳和演绎同样重要,最终目的是提高识别效率。
2016年的ImageNet测试结果显示,AI错误率低达3.5%,而人类对同一数据库识别错误率在5.1%。这说明,理想情况下,计算机图像识别能力已超越人类。
每年在ImageNet测试中错误率最低的算法模型都不尽相同(从NEC到ResNet),这也反映了人们对于算法的不断探究、更迭过程。
提高识别效率除依靠算法之外,也离不开算力的支持。算力可以分三个维度展开:芯片、超级计算机、云计算。
- 芯片:人工智能领域作为一个数据密集的领域,传统的数据处理技术难以满足高强度并行数据的处理需求。为解决此问题,继CPU之后,相继出现了GPU、NPU、FPGA、DSP等“AI”芯片。1999年NVIDIA公司发布了全球首款图片处理芯片GPU;2016年,寒武纪发布了全球首款深度学习专用处理器芯片NPU。芯片的更迭、进步可从根本上提高计算性能。
- 超级计算机:其基本组成组件与个人电脑的概念无太大差异,但规格与性能强大许多,是一种超大型电子计算机。我国自主超级计算机“神威·太湖之光”,其处理器为众核CPU“申威26010”,整台神威·太湖之光”共包含40960块处理器;打败李世石的AlphaGo共包含1202个CPU和176个GPU;打败柯洁的升级版AlphaGo使用到了TPU,但数量只有4颗。可以发现,真正用于人工智能的超级计算机芯片还只是处于CPU、GPU层,如何将更适用于网络神经算法的NPU、FPGA等芯片量产化并融合入超级计算机芯片矩阵,是在人工智能发展的第一阶段一技术驱动阶段应该重点努力的方向之一。
- 云计算:与主要应用于密集型计算的超级计算机不同,云计算依靠其灵活的扩展能力主要应用于社交网络、企业IT建设和信息化等数据密集型、I/O密集型的领域。
分析认为,当AI完成第一阶段——技术驱动阶段后,算法和算力将变成人工智能领域的基础设施。就目前看来,多项算法开源平台已将AI算法引入统一、公用阶段,运算力也必将向同样的趋势发展。云计算则是一个初步尝试未来,计算力的发展方向或将是云计算和超级计算机技术结合,为企业提供既可密集运算又可灵活扩展的计算服务,将人工智能赋能全行业。
2.2.2 数据驱动(描绘个性画像)
人工智能发展的第二个阶段,算法和计算力已基本不存在壁垒,数据将成为主要驱动力,推动人工智能更迭。此阶段,大量结构化、可靠的数据被采集清洗和积累,甚至变现。例如,大量的数据基础上可以精确地描绘消费者画像,制定个性化营销方案,提高成单率,缩短达到预设目标的时间,推动社会运行效率提升。
2.2.3 场景驱动(给予决策支持)
到了人工智能发展的第三个阶段,场景驱动作为主要驱动力,不仅可以针对不同用户做个性化服务而且可在不同的场景下执行不同的决策。此阶段对数据收集的维度和质量的要求更高,并且可实时根据不同的场景,制定不同的决策方案,推动事件向良好的态势发展,帮助决策者更敏锐的洞悉事件根本,产生更精准更智慧的决策。
3. AI的应用
3.1 构架
人工智能技术架构逻辑上分为基础层、技术层、能力层、应用层、终端层五大板块,其中核心技术层涵盖 AI 技术群和模型的融合创新,为各行业领域提供相关产品及服务。
- 基础层: 涉及硬件基础设施和数据、算力、算法模型三大核心要素。随着AI 大模型规模的不断扩大,对计算资源的需求也在增加。因此,高性能的硬件设备、海量场景数据、强大的算力基础和升级选代的算法模型成为了支持AI 大模型发展的关键。
- 技术层:主要涉及模型构建。目前,Transformer 架构在 AI 大模型领域占据主导地,Transformer类架构的发展带动多模态融合,为范式转变奠定基础。
- 能力层、应用层及终端层: 在基础层和技术层的支持下,AI 大模型拥有了文字、音频、图像、视频、代码策略、多模态生成能力等,具体应用于金融、电商、传媒、教育、游戏、医疗、工业、政务等多个领域,为企业级用户、政府机构用户、大众消费者用户提供产品和服务。
3.2 中国市场
中国人工智能行业近年来市场规模持续提升,2022-2027E 的年复合增速有望突破 34%,同时,中国AI开发平台的市场规模也在不断上升,2025 年市场规模有望突破 365.0 亿元。
近年中国AI开发平台的市场规模持续上升,算力、数据、模型调用和部署维护等细分市场快速增长。2016-2021年,中国AI开发平台营收规模快速扩张,2021年中国AI开发平台营收为234.8 亿元。在政策红利、行业渗透率以及芯片性能稳步提升的背景下,预计2025 年中国 AI 开发平台市场规模将达 365.0 亿元。
3.2.1 应用领域和场景
- 应用领域
当前我国正处于“弱人工智能”向“强人工智能”过渡阶段。感官上,类似互联网刚普及时,基础层和技术层逐步构建的阶段。长远来看,AI能够广泛应用于各行各业,未来人工智能的应用需求仍有望实现较大提升。
- 行业场景
易观分析
在制造行业和交通行业,AI的渗透率仍有较大增长空间 (头豹)
不同成长周期的最具增长潜力的重点行业:
萌芽期 - 医疗;成长期 - 智能制造;发展期 - 金融 (德勤)
人工智能能够赋能经济社会发展各领域,下游各个领域的产业升级对大模型的需求持续走高。据测算,2022 年中国人工智能行业市场规模为 3,716 亿人民币,预计 2027 年将会达到 15,372 亿人民币,有望在下游制造、交通、金融医疗等多领域不断渗透,实现大规模落地应用。人工智能基础数据服务应用于众多下游场景,AI解决方案从不同角度精准解决各场景的痛点。下游行业对人工智能需求呈现出碎片化、多样化的特点,从开发、精调、优化、迭代到应用都需要投入巨大的人力和财力,成本极高。
- AIGC类:我国AIGC产业发展目前已经发展出了两类主要业态,其一是主要面向C端用户 To C,提供的产品主要可以以模态划分为文本生成、图片生成、音频生成、视频生成、虚拟人生成等多样内容形态,其二是主要面向B端企业客户 To B,提供的产品更多是基于特定领域的专业服务目前布局较多的赛道包括游戏、媒体/影视、电商及广告营销等重内容赛道。未来相信AIGC将继续延展产业链,并在商业化场景上持续拓宽拓深,深入变革各个行业。
3.2.2 企业布局
当前中国人工智能相关企业可分为四大类:互联网巨头、传统软硬件厂商(包括集成商(SI)、独立软件开发商(ISV)和设备制造商(OEM)以及各垂直行业的领军企业等)、人工智能独角兽企业和人工智能成长型企业。
互联网巨头:此类巨头资金雄厚,人才集聚效应强,研发实力强大,结合自身业务优势,投入基础研究,建设技术平台,搭建生态圈赋能产业,代表企业如阿里、百度、腾讯等。在产业布局方面,互联网巨头切入人工智能市场是因为市场存在巨大的变革性机遇,未来人工智能将有望成为新的支柱性业务。大型企业主要分布在基础层搭建基础设施和技术平台。
2016-2020
百度:如果说百度的AI之路是从2013年大力投入自动驾驶技术开始,那么2017年则是百度AI战略转型的关键一年。在这一年百度将公司使命升级为与人工智能技术更匹配的“用科技让复杂的世界更简单”,向外界表达了其”All in A的决心。之后几年,百度不仅在国内首次推出了参数过亿的大语言模型文心1.0,还意识到了AI技术将从辨别走向生成,于是开始加注AIGC领域。
华为:一方面,早在2018年,第一届全联接大会上华为就提出了云服务2.0的概念,不仅发布AI战略与全栈全场景A解决方案,还首次提出要实现“普惠AI”,让普通人都能用得上好的、有用的技术。某种程度上说,全栈全场景AI是“方法”,普惠Al是“去向”,二者的结合为当时的华为打开了一条清晰独特的AI之路。另一方面,关乎大模型,华为早有准备。早在2020年,华为就在内部立项开始投入做大模型。并在2021年4月的华为开发者大会上发布了千亿级生成和理解中文自然语言处理大模型一一盘古大模型1.0。后来又在2022年4月升级到2.0版本,并于2023年7月正式对外发布盘古大模型3.0。盘古大模型3.0是一个面向行业的大模型系列,与百度的“文心一言”相比,华为的“盘古”更聚焦于工业端的应用。与OpenAl的GPT相比,它更能适应中文语境下的应用场景。比如金融、安全、出行等场景,或将成为华为AI落地的拓展应用。
阿里:2014年,刚刚在纽交所敲钟的阿里巴巴就开始对人工智能进行探索。从早期成立的数据科学与技术研究院 (lnstitute of Data Science & Technologies)起步到2017年正式成立阿里达摩院,阿里巴巴的人工智能技术体系不断完善。随着阿里巴巴整体业务发展需要,2019年阿里云智能提出了“ALL in Cloud”的战略,将“AI战略与云”相结合。而在大模型方面,今年4月阿里巴巴发布“通义千问”大模型,并宣布阿里巴巴所有产品未来将接入“通义千问”,进行全面改造。据了解,“通义千问”支持多轮对话、文案创作、逻辑推理、多模态理解、多语言支持,可以提升多种场景的工作效率。比如,视频会议中能够自动生成会议摘要;作为智能购物助手自动推荐品牌和产品等等。
腾讯:早在2016年腾讯就开始从公司层级投入AI基础研究,一年后腾讯提出了“Make A Everywhere”的战略愿景和“基础研究一场景共建一能力开放”的三层战略架构,并把人工智能定位为基础能力。2018-2019年腾讯建立了人工智能和前沿科技两大实验室矩阵,其AI研究的方向也聚焦到了更高层级的多模态研究和通用人工智能。此后,腾讯在AI领域不断探索,先是在2022年4月首次对外披露混元AI大模型的研发进展,8个月后也就是2022年12月正式推出国内首个低成本、可落地的NLP万亿大模型一一混元Al大模型。基于大模型,腾讯也成立混元助手项目组来研发类ChatGPT产品,并表示该产品之后将会被集成到微信、QQ、腾讯云等产品中服务于用户。腾讯拥有庞大的用户基数,长期积累的技术实力以及多元化的业务布局,可覆盖社交游戏、内容、广告、搜索、企业服务等多个领域的前端应用场景,这些都将成为腾讯在这场AI竞争中独一无二的优势
京东:从2014年成立云事业部门,到一步步组建人工智能研究院,打造AI团队,京东在云计算和人工智能技术领域不断深耕。2020年,京东关注到了深度学习模型和语言生成,于是开始研发语言模型。之后两年时间内,京东先后推出十亿级模型K-PLUG和百亿级模型Vega。今年7月13日,京东首次推出千亿级言犀大模型,以及预计8月正式上线的言犀AI开发计算平台。同时,依托京东言犀大模型,以及京东在产业和供应链侧的优势,京东推出了优加DaaS和言犀智能服务平台这两大服务平台,为零售、金融、城市、健康、物流五大领域提供解决方案。据了解,京东用于训练言犀大模型的数据库是由70%通用数据和30%供应链原生数据组成,相比于其他大模型,京东言犀更加具备天然的“产业基因”,而将大模型能力与产业应用的结合也是京东AI技术最大的亮点之一。
科大讯飞:“讯飞星火”大模型。讯飞星火采用“1+N”架构,“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。2023年4月24日,科大讯飞星火认知大模型官网正式上线,并开放需求调研。讯飞星火认知大模型围绕“知识问答、代码编程、数理推算、创意联想、语言翻译”等实用场景,通过海量文本、代码和知识学习,可实现基于自然对话方式的用户需求理解与任务执行。
网易:“玉言”大模型。“玉言”大模型脱胎于网易伏羲,训练语料主要来自小说、百科和新闻等,模型规模从最早的一亿参数增长至千亿参数,模型领域也从文本拓展到图文、音乐、行为序列等多种模态,其具备的自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等领域,甚至在多项任务上超过人类水平。曾拿下中文语言理解权威测评基准CLUE分类任务榜单冠军。“玉言”大模型相关技术已用于网易集团内的文字游戏、智能 NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
360:“360智脑”大模型。2023年6月13日,360集团公司正式召开“360智脑大模型”应用发布会,发布认知型通用大模型“360智脑4.0”,并宣布360智脑已经接入360旗下产品“全家桶”中。目前,360智脑已具备生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力,维度涵盖数百项细分功能,可覆盖大模型全部应用场景。
火山引擎(字节跳动):火山引擎(字节云)是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和应用工具开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。火山引擎的大模型变现路径规划:向大模型初创公司提供算力支持。
2023年6月28日,字节跳动旗下云计算服务平台火山引擎发布“火山方舟”,这是一个大模型服务平台,为企业提供模型训练、推理、评测、精调等全方位平台服务。这客观上降低大模型的使用门槛,推动大模型和大算力的应用落地,加快大模型在各行业发挥商业价值。也就说,火山方舟在起步阶段就集成多个大模型,供使用者直接对比,帮助客户为不同场景精调模型,“跑完最后一公里”。火山方舟作为模型提供方和模型使用者平台型粘合剂,已经提供了具体的“撮合路径”,促成“研究-训练-应用-变现-反哺研究”的正向循环。
具体来看,“火山方舟”基于大模型应用的工作习惯,打造了多个核心部分。“模型广场”会有不同的模型供应商提供不同版本和尺寸的模型,用户可以直接与模型交互,调用推理API,接入生产环境;“模型评估”是“火山方舟”重点打造的环节入口,用户可以基于业务需求设计一套可量化的评估指标,在模型评估后挑选最合适的模型;“模型精调”可以帮助客户利用自有数据进行持续训练,建设和积累自己的精调数据集,降低推理成本。
字节通过引入多家第三方大模型提供商,打造MaaS平台。一方面,模型提供方,通过 “火山方舟”能够以更低的成本触达海量客户,更小的代价在ToB市场实现规模化;另外一方面,对模型使用者来说,通过 “火山方舟”可以便捷地接触到众多高质量的基座模型,一站式对接多家模型提供商,为不同场景选择最合适的模型。
- 传统软硬件厂商: 这类企业行业耕耘时间已久,有着稳固的客户关系和渠道,通常以合作伙伴的形式,搭建产业生态,赋能产业联盟。通过硬件开发、软件开源的合作形式,提供高服务需求、强专业化的软硬件定制服务,发挥产业集群效应。在人工智能浪潮中,这类企业也积极地把握机遇在产品中加入 AI 元素,通过与人工智能结合来扩大市场增长空间,代表企业如东软、浪潮、亚信等。而出于风险控制和财务回报考虑,这类企业在人工智能人才招募、算法研究、基础设施等方面投入都相对保守,因此,和拥有先进人工智能算法的 AI公司合作是实现落地的捷径。
- 人工智能独角兽企业: 独角兽企业在特定领域有清晰的核心竞争力,且具有创始人的背景光环,凭借优秀的团队背景,领先的技术水平,借助资本市场活跃的东风,在特定 A 场景中形成了自己独特的优势。然而在繁华背后,独角曾企业普遍利润率偏低甚至亏损。面对同为技术平台型互联网巨头的挤压和日渐提升的人力成本,烧钱模式难以长久为继。此外,技术、产品商业化落地是独角兽企业普遍面临的瓶颈。
- 成长型 AI 企业:成长型 AI 企业数量庞大,依托其场景落地优势、灵活性和成长速度,在 AI 市场中将是强有力的一极。成长型 AI 企业成立之初往往在算法模型和行业深度方面有领先的优势,专注干行业需求,能将人工智能更深、更细致地落地于实际场景,这是成长型 AI 企业在人工智能发展中的重要作用。这类企业通常能更好的找到场景,更快速的去调整并找到技术和场景的适配的点,从这样一个切入点开始,去扩大自己的广度,然后不断发展形成自己独特的竞争优势。不同于前几类大型企业聚焦于搭建自己的生态系统和利用技术平台优势成长,如何找到一个合适的商业路径,把技术的价值逐步的释放出来,控制好产品与市场需求的节奏,是成长型 AI 企业都会遇到的挑战。
3.3 全球市场
据IDC最新数据显示,全球人工智能市场在2022-2026年预计实现18.6%的年复合增长率,2023年将突破5000亿美元,到2026年达到9000亿美元。该预计还称,包括软件、硬件和服务在内的人工智能市场全球营收额预计在2022年同比增长19.6%,达到4328亿美元,其中人工智能软件占据88%的市场份额,软件主导地位持续巩固。随着人工智能应用拓展和基础设施加快建设,硬件和服务市场增长速度加快,人工智能服务预计在未来五年内实现最快的增长,年复合增长率可达到22%。
综合来看,美国仍然是人工智能领域的领头羊,每年不仅向全球输出最前沿的 AI 应用概念,提供最接近市场需求的应用场景,同时也吸收着世界各地不断涌入的人才、数据资源和创意灵感。以英国、德国为代表的欧洲发展区和以中国、日本、新加坡、印度为代表的亚洲发展区整体实力相近,但走出了两条完全不同的路径,虽然欧洲储备了大量的 AI 人才,但市场活性不强,对于创新业务的发展并不友好,而亚洲虽然人才储备不充裕,但市场活力十足,对 AI技术充满了期待。
3.3.1 产业布局
全球视角下,不仅出现了众多独角兽公司,还形成了更为完善的产业体系。感官上看,类似互联网普及后各应用领域的百花齐放。
- AIGC:
目前,专注底层系统的公司估值更高。虽然相较应用研发商,基础设施研发商的商业模式尚未成熟,多数还在探索阶段,但因其应用场景更广,且掌握核心技术能力,在未能实现稳定盈利的情况下,估值相对更高。但同样可见,海外除底层算法开发公司以外,初创公司基于开源技术,仍可开发应用并开展TOC业务,具有一定商业化潜力。
- 底层系统:目前海外参与研发AIGC模型的公司主要包括Stability Al、OpenAl、Midjoumney,三家公司的AIGC模型均已正式向C端用户发布,谷歌和Meta等公司也正在研发文字转图片的AIGC模型,但仍未对外发布。
- 垂类应用:在图片AIGC领域,Stabiity Al推出了基于自有模型Stable Difusion的DreamStudio:在文本AIGC领域,应用开发商较多,且底层模型多是基于OpenAlGPT-3。
在技术应用层面,海外的文本AIGC工具研发商竞争较为激烈,已领先图片AIGC公司,快速实现C端商业化。各文本AIGC工具研发商的业务形态较为相似,产品主要基于开源的OpenAI GPT-3开发,业务主要是为用户提供广告文案、博客文章、社媒分享等文本的内容生成服务,用户只需输入简单指令,文本AIGC工具即可生成文本。
该子行业参与者较多,竟争较为激烈。jasper是一家为主要为营销从业人员、社媒运营人员等提供基于A1的文本生成工具的研发商,其他同类公司还包括Copy.ai、Copysmith、WriteSonic、Peppertype等。近年多家公司获得高额融资。2022年10月,Jasper完成1.25亿美元融资,估值达15亿美元,投资者包括CoatueBessemer Venture Partners、IVP等多家机构。其他同样基于OpenAI GPT-3、业务相近的初创公司获得较高融资,包括Copy.ai、Copysmith等。
由此可见,海外初创公司利用OpenAl、Stability AI等公司开发的开源技术,开发应用并开展TO C业务,仍可获得一定营收规模,并获得高额融资。大型AI公司在投入人力资源、算力资源开发大规模底层算法方面优势明显而中小型公司在垂直应用、客户资源、灵活适配等方面具有一定优势,可与大型公司合作获得算法支持在细分领域改进算法,提升用户体验,做出成绩。
海外AIGC产业分布如下:
https://base10.vc/post/generative-ai-mission-ritic/
https: //www.antler.co/blog/generative-ai
3.3.2 生态合作
- AI 联盟(Al aliance ):IBM 和 Meta 与全球 50 多个创始成员和协作者合作成立,涵盖了IT、金融、教育、医疗、制造和电信等多个领域。
4. AI的挑战和限制
4.1 技术挑战
数据质量、算法偏见和鲁棒性
- 关于数据质量,人工智能技术对高质量数据的需求很高,数据质量的不确定性可能会影响模型的性能和可靠性。
- 从算法层面看,现有的AI算法很脆弱,泛化能力差。这意味着,如果将算法运用到与训练场景区别很大的实际场景中,就会存在安全问题。以无人驾驶为例,人工智能训练的时候不可能穷尽所有的情境,当遇到新的突发事件便无法处理了,造成AI技术的误用。同时,这种脆弱性还使人工智能系统容易被攻击、被欺骗,给AI技术的滥用造成可乘之机。
- 深度学习算法在训练过程中会对数据的鲁棒特征和非鲁棒特征进行学习,并依据这些特征进行识别。而非鲁棒特征为模型能够理解的用于对训练数据进行拟合的特征。非鲁棒特征给模型的安全性带来了极大的挑战。通常的,可以在输入数据中加入人无法感知到的轻微扰动,激活模型的非鲁棒特征,从而导致模型给出错误的结论。人工智能算法具有脆弱的一面,可能因为外部的恶意攻击行为,或者无恶意的非平常情况而失灵
4.2 社会问题
隐私、就业和公平性
4.3 法律监管挑战
5. 发展趋势
5.1 技术趋势
- 科研与产业两端突围:中短期基于Transformer算法和结构优化仍是主流,长期可能被替代
学术界将通过扩大模型参数量、调整模型结构、局部算法优化等方式,进一步探索大模型的能力天花板,触碰AGI可能性,以各大企业为代表的产业侧,一方面从商业化落地角度追求更小模型参数下的高模型能力维持,以及解决大模型出现的知识幻觉问题,一方面也在积极研发探索新模型架构可能性,呈现“对外模型名称为厂商能力代号,但内含技术架构随时可能改变”的发展特征。产业与科研两侧的需求都已经暴露标准Transformer架构的巨大瓶颈,即“不可能三角”。各大机构与开发团队对Transformer架构的成功改进在快速推进,未来极有可能会出现具备推广价值的新Transformer架构。
- 软硬一体化:大模型低参版本的端侧应用,推动手机、机器人等物联网应用的升级进化
大模型在端侧的应用,软硬一体的结合带来广阔的应用场景。端侧的应用首先需要将大模型进行剪枝、稀疏化等处理,降低参数到十亿级规模,同时根据场景进行专属知识的训练和微调以适配专门的终端设备和软件。这对终端设备的功耗、内存、延迟、成本等都根出了新的要求。具休来看,目前在手机拍照、多终端语音助手、机器人具身智能指从第一人称视鱼出发,具备理解、推理并与物理世界互动的智能系统)等方面表现出应用前景,推动物联网应用的升级与进化。2023年8月,华为推出鸿蒙43入盘古AI大模型,在消费电子领域赋能,小米官宣13亿参数手机大模型,OPPO预计将与阿里云联合打造OPPO大模型基础设施。手机厂商纷纷入局轻量化手机大模型市场,以期为用户带来全方位智能化体验提升,也许不久将来大模型应用将成为用户体验变革换代的“新触点”。
5.2 社会影响
- 新一波自动化浪潮:AI成为基础设施,部分基础工作被替代,社会人力结构和分配方式重塑
技术的跃迁、生产效率的提升并不会自然带来社会整体福利水平的提升,相反往往以牺牲部分人的利益为前提,进而引发社会结构分配方式的重塑。AIGC交互界面的用户友好性、大模型开源及API价格的降低、插件服务带来的应用生态繁荣等,都使得A技术或将成为像水、电、网络一样的基础设施,渗透并改变干行万业。然而,大模型具有认知、分析、推理能力,不同于自动化浪潮下对蓝领的冲击,AIGC时代受A影响最大的可能是初级专业人士和技术人员,即部分白领。据Challenger报告显示,2023年5月,美国因AI替代造成的失业人数达3900人,且都发生在科技行业。以及据麦肯锡数据预测,到2045年左右,有50%的工作将被AI替代,比此前的估计加速了10年。与此同时,具有创造力、深度思考等高阶智力的人才,将享受到AIGC带来的效率优势,成为A的驾驭者,相应的工作需求也会增加。智力要素重要性的提升、附加值的提高,都将推动社会资源和财富向顶尖人才和组织聚集,但社会是一个整体,生产效率的提升并不代表着购买力的提升,被替代的普通职工才是购买力的最大来源,为了维持供需平衡,分配制度需要重塑。如美国总统竞选人杨安泽提出向大企业征收增值税,并向公民发放补贴,以及OpenAl创始人Sam Altman提出的世界币均等分配等,都通过反思并调整现有的分配方式,以驱动社会向更美好的方向演进
6. 参考文献
生成式人工智能的第二幕Generative AI’s Act Two(红杉资本)
7. 附件
7.1 AI专业术语
7.2 AI技术科普
OpenAI 联合创始人科普chatgpt模型训练和应用实例
ai知识库 技术科普资源全面,但更新不及时
7.3 相关信息和资料收集
知识付费社群:
知识星球:
小报童: