联系人:林经理
15595692856
2023人形机器人:大模型MR眼镜人形机器人NFT研究逻辑选股坐标轴
时间: 2024-01-01 15:08:38 | 作者: 企业动态
原标题:2023人形机器人:大模型MR眼镜人形机器人NFT研究逻辑选股坐标轴
今天分享的是人形机器人系列深度研究报告:《2023人形机器人行业报告:大模型MR眼镜人形机器人NFT研究逻辑及选股坐标轴》。(报告出品方:安信证券)
人工智能正在引领生产力的革命,与生产力变化相配套的是生产关系也会发生明显的变化。在前文,我们提到NFT作为一种流通机制,与变现直接挂钩,在产业逻辑上,与AIGC会相伴而生——AIGC的海量“产出”将由NFT来快速筛选出有价值的内容。NFT本质是围绕新生产力而构建的新生产关系,会带来盈利、商业模式的创新。
以重塑内容产业为例,AIGC与NFT的共同作用下,IP产业链将明显缩短、效率提升,创造力涌现进而有望将中国的IP产业变贫瘠为沃土。AIGC对内容产业的革新,虽然使得内容生产的成本变得极低,但流量会变得更贵,也会有新的商业模式或业务模式的产生。另外,还要考虑到有其他机制的加持下,内容变现链条的变化,比如在NFT的加持下,价值链发生的变化。
首先,AIGC对于流量模型的改变。长久以来,互联网的流量模型是一个三层的漏斗,“获客→留存→变现”。过去我们通过大规模广告投放获客,通过提供内容获得用户留存,然后通过广告、打赏、会员等办法变现,但是如今处于互联网的下半场,背后的成本大头是流量投放和内容采购。
首先,AIGC对于流量模型的改变。长久以来,互联网的流量模型是一个三层的漏斗,“获客→留存→变现”。过去我们通过大规模广告投放获客,通过提供内容获得用户留存,然后通过广告、打赏、会员等办法变现,但是如今处于互联网的下半场,背后的成本大头是流量投放和内容采购。
大模型重新定义人机交互对话:大模型本质上带来的是人机交互范式的转变,促使我们从图形用户界面(GUI)转向自然语言用户界面(LUI)。自从人类开始开发软件以来,人类一直在使用计算机能够理解的编程语言与交互界面去和机器进行交流。大模型的出现让计算机实际上能够用与人一样的自然语言与人交流,彻底改变了数字体验、人机交互。
插件可以将搜索和点击这样的手动操作转化为简单的对话操作。减少点击量(高效地完成交易)是电子商务的命脉,同时也是插件的重要部分。插件能处理各种灵活的需求类型并实现,足以改变游戏规则。这会替代许多企业,迫使它们改变商业模式。只要有足够的RLHF(人类反馈强化学习),ChatGPT就可以大幅度减少用户的点击量,以高效地达成交易、提升用户体验。
1.1.1.为何需要产业图谱?每一代计算平台的发展,囊括硬件及其产业链、软件应用及变现,是一个庞大的ECO。每一代生态系统的构建,均是建立在新生产力、新生产关系、新计算平台之上的,故过往的诸多产业链均会重新构建、链接过程中价值链亦会重新分配、竞争格局成型后的局面会有大变:甚至是产业链之间的连接也会有创新。具象来看,每一代硬件入口的交互方式完全不同,依托于交互方式的内容形态会明显改变,进而拉开基于新交互与新内容的社交与应用大创新变现方式也随之升级迭代。
每一代计算平台的加快速度进行发展,都会迎来一证券交易市场上的一轮大投资浪潮,一二级市场的投资目标均是能成功卡到关键生态位的龙头公司:关键生态位众多,贯穿于每一代计算平台的早中期。故,如何全面寻找众多关键生态位?如何在不同时间段瞄准不同的生态位?这就是产业图谱的及其重要的作用,即每一代计算平台的早中期投资,与一般行业成熟阶段的投资完全不同需要一张产业图谱作为“地图”,助力于投资者去理解每一代计算平台的“大航海时代”
产业图谱的初始版本不一定准确,但跟着时间的推移、关键事件的发生,产业图谱也会及时来更新; 产业图谱本质上是代表了当下这一时间节点,我们穷尽自己的认知所推演的演化图谱.在当下具备较为准确的参考性。
1.1.2.为何称其为“智能科技”产业图谱?近百年的科学技术进步,都呈现为“工具观”,由动力机械到电力通信,再到交互硬件,再到小型化交互硬件,硬件一直是产业皇冠上的明珠一一集成了每个时代最先进的技术突破、吸引了全球消费者追逐的目光。随之而来的是对全世界的物理探索、开拓、互联、全球化分工,向外探索、互联、协作。
智能科技最大的不同,就在于它的深远影响,重点不再是“向外”,而是“向内”,即向内去深刻影响人的意识。也就是说,智能科技时代的硬件入口仍然很重要,但更重要的是其新开辟的新虚拟空间,直至让人分不清虚拟与现实之间的边界。未来我们仍生活在现实物理世界里,只不过未来的虚拟现实,是囊括现实物理世界的。海外马斯克创立的新公司 XAI,其定位是“重新理解现实世界”,皆因 AI 或机器人会构建一套理解现实物理世界的、自己物种的语言体系(如机械语言),进而重新建立一套对现实物理世界的认知体系: 人的认知/意识,经过虚拟现实的一轮深远影响后,若让渡自己更多的决策权于 AI 或机器人,最终可能会顺从于 AI 或机器人的认知体系。
智能科技的产业图谱,看似也是基于硬件入口的演化,但实质上方向是相反的,是针对于意识层面、“向内”的演化动力。为何方向上与“对外”是截然相反的,会很重要、需要非常强调? 这涉及到投资脉络一一除了投资主线上的技术进化,投资副线、溢出效应、“卖铲子与水”与过往会截然不同,这一点值得大家重视与深思,如向外探索的过程即全球化成为“地球村“的过程,那向内探索呢?如向外探索将会带来地球环境的污染与治理,那向内探索的污染与治理呢?
2021 年自元宇宙起,科技产业内概念频出,我们第一步给出一个认知体系,将众多概念的层级先做一个界定。
由“认知体系”能够正常的看到,围绕智能科技的众多存在,并不是并列关系,而是最套关系。
认知体系之外,智能科技产业图谱的当下版本,包括 ChatGPT/大模型、MR 眼镜、人形机器人、NFT 等“现象级”应用或硬件,它们在产业图谱中卡位不同,大模型 (ChatGPT 是大模型的一个爆款) 是生产力的范畴、NFT 是生产关系的范畴、MR 眼镜与人形机器人都是空间计算平台/开辟新的空间。它们彼此之间有逻辑关系、相同卡位的存在有时间先后关系甚至有竞合关系。
大模型与MR 相辅相成。AIGC 提供内容,MR 提供新空间,两者需要结合在一起才能发挥出建设性作用(若无 MR,AIGC 在移动网络的当下更多发挥出存量博弈、修修补补的作用): MR 眼镜作为新空间、新计算平台,能以新产业链、新价值链、新格局的前景,发挥出 AIGC 的建设性作用、更先进生产力的效用。
MR 与人形机器人是并列关系的两个计算平台。两者作为并列关系,一是两者代表两种实现 AGI 过程中的技术路径(前者是重构时空、后者是混合平台),二是两者未来将携手去倒逼现实物理世界的数据交换: 此外,两者未来我们预计将存在一定的竞争关系,即抢夺用户时长与可支配收入;最后,两者的共同选代方向,我们预计或是脑机接口一一既是混合平台技术路径上的工程方案之一(以人为载体的混合平台),又能真正的完成虚拟现实 (在人的意识中重构时空)。
大模型与人形机器人是递进关系。按照唯识学,通用AI的实现有四层嵌套关系:第一层是符号学(大模型)、第二层是具身智能、第三层是构建一个观察点、第四层则涉及到智能动力学:大模型的爆款一 ChatGPT 作为大模型,归属于第一层符号学,而人形机器人归属于级别更高的第二层具身智能,故人形机器人在技术路径上,较大模型级别更高,两者是递进关系: 同时,未来智能科技产业图谱中一定会有第三层与第四层的新爆款 (类似于 ChatGPT、人形机器人) 出现,它们的技术层级愈来愈高。NFT/智能合约,作为生产关系,弹性最大。NFT 作为一种流通机制,与变现直接挂钩,在产业逻辑上,与AIGC 会相伴而生一-AIGC 的海量“产出”将由 NFT 来快速筛选出有价值的内容: NFT 本质是围绕新生产力而构建的新生产关系,且因 NFT 的金融属性,它将赋予筛选出的优秀品质的内容以流通性,给予优秀品质的内容以匹配的价值(价值重估),因而弹性最大。此外,AIGC与NFT 的共同作用下,IP 产业链将明显缩短、效率提升,创造力涌现进而有望将中国的 IP 产业变贫瘠为沃土。
大模型、MR、人形机器人、NFT,从投资角度,都可以视为产业图谱中的生态卡位点,即最关 键的部位。这些关键部位,相互借力、相辅相成,协同更多生态合作伙伴,齐心协力构建智 能科技的大生态圈。故,从研究的角度,单独研究大模型或单独研究 MR,只是最基础的第一 步,大模型与 MR 的乘数效应,则增生出更多新研究方向;大模型、MR、NFT 三者之间的乘数 效应,则对应着更多维度、更多层次的研究内容。纵横交错、层层嵌套才是生态圈应有的本 色,故建立在产业图谱上的研究,一定是成系列的(嵌套)、不同维度与层次的(纵横交错), 但共同特点是需要高频迭代——产业图谱需要“相机”而修补迭代甚至革新,建立在产业图 谱上的系列、维度、层次亦轻易会被推翻。
服务器+网络开启了人人“上网”的时代一一网络世界不亚于大航海时代所发现的新大陆: 算力+算法将开启供给端“上算”的时代一一AI 将作为新生产力,借助于数据/算法/算力,以新场景、新应用、新内容来重新定义供给端,进而创造出用户的新需求(供给创造需求),继而囊括现实物理世界成就真正的虚拟现实(虚拟现实是描述一种状态,即让用户在体验上,能模糊掉虚拟与现实之间的边界)。
对“上网”时代的投资布局,主线是硬件与网络两大方向,硬件以智能手机为代表有经典的产业链,网络则以基础设施与应用 (包括内容与场景,以及模式创新) 为景气上行。对“上算”时代的布局,将囊括硬件(硬件入口、智能交互硬件)、基础设施 (算力、算法)、应用(包括内容与场景,以及模式创新) 等。从“上网”到“上算”,由“网络世界”至“虚拟现实”,软硬一体化的趋势极为明显:“上网”时代的爆款逻辑是“消除信息不对称”,。“上算”时代的爆款逻辑我们判断为“消除认知不对称”。
1.2.“大模型 XMR 眼镜/人形机器人 X NFT”,接力“移动互联网”空间计算平台是苹果官宣 R 眼镜时所传达出的表述方式,我们大家都认为未来 R 眼镜里会标配大模型、NFT 这样的更先进生产力、生产关系,故我们本篇报告提到的“空间计算”,即大模型(作为生产力)、MR 眼镜 (作为硬件入口)、NFT (作为生产关系) 共同助力所构建的下一代计算平台。智能科技产业图谱中,人形机器人将来是与 R 眼镜所并列存在的另一种硬件入口、空间计算平台,故我们大家都认为空间计算的严格、技术性表述,应该是“大模型 x mR 眼镜人形机器人 X NFT”,即不同生态位之间的乘数效应。
2021 年的元宇宙提供了一种愿景描绘: 2023 年的 ChatGPT 是很重要的推动力,代表更先进的生产力、更高效率,但 ChatGPT/大模型在移动网络的旧有计算平台上,相较于 MR 未来新的计算平台,难以发挥出势如破竹的作用一一移动网络旧有格局已巨头林立,ChatGPT/大模型作为更先进生产力,只能发挥出存量博弈的替代甚至破坏作用,顶多在特定的环节修修补补。
对大模型或 ChatGPT 的理解,要置于智能科技的大框架下,以此深刻理解有、无MR 眼镜,对于产业与行情的“对齐”方式是不一样的一一在没有 眼镜之前,大模型是主体;R 眼镜推出之后,大模型就变成了景气上行,并且其中的核心就是新秩序、新规则。在当下的移动互联网时代,若无 MR 眼镜,则是存量博弈,现存的多数公司都会受到一定的冲击: 即使如此,在没有 MR 眼镜的存量博弈中,仍然可能会出现个别的爆款内容或应用,但更多的爆款应该出现在 MR 眼镜中。大模型是爆款工具,背后是 AIGC 的先进生产力,它们在移动互联网时代造成了存量博弈,也有一定的修缮作用,但难以构建出新秩序、新规则、新玩法。
只有在全新的空间中,例如 MR 眼镜这样的全新计算平台,大模型才能作为先进工具更容易地去系统性地构建新秩序、新规则、新玩法。因此,我们期待 2024年 MR 眼镜真正开始出货后,基于新硬件的新爆款将会呈现出来。同时,大模型与 MR 的结合也将带来新的内容形态。
技术突破常常以“非线性”方式得到人们的认知,AI产业正是呈现出非线 年引爆全球的大语言模型就是以“非线性”方式一下子进入了人类视野。人工智能技术的发展起始于 20 世纪60 年代,但前 50 年一直不温不火,直到进入 21 世纪,人工智能的发展进入快车道,诸多关键技术获得突破,且有应用落地所带来的正反馈效应。
2010 年代至今,表征学习与深度神经网络的机器学习方法得到普遍应用,多样化的机器学习任务得到了发展。神经网络和机器学习在 2016 年发生了一次“出圈”事件,即谷歌公司的AlphaGo 在各种围棋比赛中大获全胜,给全世界做了一次关于人工智能的科普。2017 年,注意力机制被加入到 Transformer 网络,用于语言建模,此后,Transformer 的出现取代了RNN在NLP 领域的地位。从商用角度,人工智能等有关技术一直在图像识别、无人驾驶、机器人等做持续探索,但A1 真正商业化落地应用还非常有限,未引起广泛的关注,直到 2023 年聊天机器人 ChatGPT 的破因。
在2022年11 月30 日的首次公开演示后,基于 GPT-3.5 的聊天机器人 ChatGPT 仅用四天时间就吸引了超过一百万的用户,2 个月后已拥有 1 亿的月活用户,成为AI诞生以来最快用户破亿的软件产品之一。随后在 2023年1月,微软宣布扩大与 OpenAl 的合作,并投入数十亿美元,以加速全球 AI 技术的突破。仅两个月后的 2023年3月 14日,OpenAl 发布了GPT-4.GPT-4 最重要的变化是拥有了多模态的解决能力,这进一步拉开了全球科技公司对 AI技术的角逐,大语言模型、多模态模型、生成式AI、AGI 等概念被广泛认知。
ChatGPT 的成功,源于以深度学习为代表的人工智能技术的长期积累。任何一个领域的研究都不是突然颠覆的,梳理 ChatGPT 的简要历史就会发现,在其诞生前,有无数技术的迭代,理论的发展为它铺路,其中最为相关的是自然语言处理 (NLP) 与大语言模型 (LLM) 这两种技术。
用户们在社会化媒体上分享的对话示例表明,ChatGPT 能完成包括编写代码、调试代码、翻译文献、写小说、写商业文案、创作莱谱、!完成作业、评估作业等一系列常见的文本输出任务。ChatGPT 比 GPT-3 更优秀的一点在于,前者在回答时更像是在与用户对话,而后者更善于产出长篇文章,但欠缺口语化的表达。
总结来说,简要回顾 ChatGPT 的发展历史,GPT-1/2/3 到 ChatGPT 都在不同阶段解决不同技术问题,其核心是建立在 GPT 模型的发展基础之上。GPT-2 提出的纯无监督预训练模式获得了学术界的广泛关注,GPT-3 在 GPT-2 的基础上,模型容量和能力逐渐增强,市面上基于GPT-3 的应用也如雨后春笋般出现。InstructGPT 出现后,更是引发了更广泛的关注。下一代的 ChatGPT 与lnstructGPT 是一对李生模型,虽然两者在模型结构和训练方式上相同,但其核心思想在于引入了人工反馈的强化学习来指导模型的训练,且 ChatGPT 数据量大了好几个量级。GPT-4 的多模态能力更是未来人工智能的发展大方向。
大模型是产业内预期 AI 将引发一场波及全行业的“平台转移”,类似于过去 15 年向智能移动电子设备与云计算平台上转移一样。透过大模型呈现的效果,能清楚看到 AI 开始从学习走向创造 (主要是自然语言处理 NLP 技术的突破),生成式 AI 对于更多业务场景的颠覆“改造”的雪球越滚越大,最终将引发新一轮产业革命,进而推动整个科技行业的商业格局都将会迎来大洗牌,行业的价值链也将相应发生变化。
我们已经正式从智能手机时代进入到大模型时代,大模型是新一代通用计算平台。参考 PC到智能手机平台的变化,随信息的组织效率和能力再度变强,大模型的浪潮下也一定能带来更大、更新的商业模式升级。未来AI产业的持续发展中,在新的计算平台上,大模型将扮演着逐渐重要的角色。未来的产业主线将变为大模型、大模型的落地应用以及大模型配套的生态合作伙伴。
应用层: 现阶段出现的现象级应用还不多,ChatGPT 是一个主要代表。
目前国内外的科技公司或互联网大公司均很看好大模型方向,也在推出各自的大模型,竞争非常激烈。除此之外,还有别的很多公司都声称在做大模型,但我们大家都认为大多数公司所做的模型是侧重于行业或是特定方向应用的中模型,不是真正意义上的通用大模型。
我们认为大模型的“大”代表的是通用性,预计未来少数的大型科技公司将专注于通用AI (AGI)的研发。从短期来看,由于目前大模型的能力还在不断的提高,形成了类似操作系统的下游生态过程。在这样的一个过程中,我们大家都认为价值占比最大的是形成生态壁垒的大模型公司。他们占据了价值链中最主要的环节。中长期来看,一旦大模型到达成熟期,能成为巨头的大概率只剩几家。因此,基础模型层的大模型平台公司的机会是巨大的,天花板会非常高,就像 PC 互联网时代的微软和移动互联网时代的谷歌一样。
目前,全球领先的大模型厂商以 OpenAl 以及谷歌母公司 Alphabet 下设的AI实验室DeepMind 为代表。OpenA 不仅是在大模型领域从基础模型到产品化、商业化进展最快的团队,且其基础模型能力边界还在不断的拓宽。我们以 OpenAl 为例去分析未来整个大模型的竞争格局。
类比新一代底层技术设施: 可以将大模型类比为 GPU、搜索入口或操作系统等数字基础设施。这些领域呈现出 9:1 的市场格局,头部垄断效应极强,而 OpenAl 现阶段的优势及其地位使其有机会获得 90%左右的市场占有率,开发者和生态将成为很强的壁垒:类比新一代公有云: penAl 的规划是专注于做一个通用的智能平台,为大模型之上的应用提供 Al 能力。OpenAl 的角色类似 AWS;
类比新一代终端:大模型时代最大的特征之一是人能够用自然语言与计算机进行交互。 自然语言操作机器的形式将产生新的交互,也就有了下一代终端的机会。可以借鉴定义 移动时代的 iPhone 和其他智能手机的竞争格局。
我们认为,未来 AI 产业链上,在模型层领域,大型科技公司将主要负责训练基础的通用大模型,这种基础能力会逐渐走向开放,类似于 iOS 与Android 的两大阵营,或是云计算的竞争格局,即未来会出现几个基础的大模型,开发者将基于这些基础模型开发各类 AI 应用。目前来看,在大模型层,海外公司以微软 (OpenAI) 与谷歌为主导,国内以百度、华为、阿里、腾讯等互联网或科技公司为主导,但整体国外公司的 AI 大模型能力优于国内公司。
因此,AI时代的平台型公司要被重新定义: 有自己大模型的才叫平台型公司,且能够在价值链中占据最主要的环节。以前移动网络产业链的最顶端是平台型公司,比如抖音、美团等。但随着大模型的陆续推出,平台型公司要重新被定义。这一轮AI产业趋势下,处于“食物链最顶层”的存在可能要被重新定义,也就是谁能够自建大模型,谁就有机会成为食物链最顶端的公司。
人工智能的三个核心要素是算力、算法与数据,这一些要素的发展都在酝酿着新的机会与竞争。纵观国内外公司在 AI 产业链上的布局,在算力、算法、数据各部位各有优势。目前国外的大模型厂商正在快速迭代其技术,全球领先的通用大模型厂商以 OpenAl 与谷歌为首,且微软是与 OpenAl 合作最深入的公司之一,他们在算力、算法、数据方面的综合优势领先。自ChatGPT 火爆以来,在国内各大互联网大公司与科技公司的发布会中,大模型都占据着焦点。百度、阿里、字节跳动、华为、腾讯等互联网巨头相继登台,展示了其在 AI 大模型领域的最新研究成果。国内大模型公司目前仍停留在模仿或学习阶段,短期内超越或接近 GPT4 模型水平的可能性不是很大,在算力、算法、数据方面仍有很长的路要走。但国内 AI 大模型相关厂商依据某方面的优势,也有实现部分应用落地。
算力方面: 全世界内竞争非常激烈,国内 AI 算力稀缺,今年生成式 AI 的加快速度进行发展更是推动智能计算迅速增加。海外尤其是美国在算力方面领先,从全球算力分部来看,根据信通院、中商产业研究院统计数据,2022 年美国、中国、欧洲、日本在全球算力规模中的份额分别为 34%、33%、14%、5%。在高端算力芯片上,中国与海外仍有巨大差距,核心参与者英伟达、AMD 竞争优势显著。
数据方面:作为新兴生产要素,是人工智能的重要驱动力之一。就数据而言,目前国内 高质量数据稀缺、数据生态不完善。但中国则在大规模数据的应用与场景化落地方面具 有一定的优势。在数据方面,未来中国可能拥有更多的机会,因为中国拥有丰富的人口、 市场和互联网数据。
AI 产业链最底层的基础设施最重要的包含算力、芯片、数据、云服务等,算力是 AI 的引警,AI芯片是 AI 算力的硬件支撑。AI 大模型带来了新的算力需求,以 ChatGPT 这类大模型为例,A1 算力需求最重要的包含两部分,一是模型训练的算力,二是模型推理应用所需要的算力。
训练算力: 大模型的训练需要大量算力,且随着大模型向更大参数、更大规模数据集方向发展,对于算力的需求呈现成倍增长的趋势,对应的 AI 训练成本也逐年高增。训练算力相关硬件主要是英伟达的 A100 与 H100 芯片。ChatGPT 的发布使得全球算力需求增加,以前算力的商业应用并没有特别多,主要是推理端像图像识别、语音识别等。后续大模型的爆发会导致训练的应用场景慢慢的变多,对训练算力的需求将大幅度增长。推理算力:大模型进行规模化应用后,若要支撑成百上千万用户的频繁使用,相应的算力成本也急剧上升。模型推理应用阶段,对于算力的需求,预计要远高于训练阶段。后续多模态大模型对于算力的需求更高,在训练与推理阶段相较文本类的 LLM,消耗的算力更多。
AI 模型训练的主要算力芯片是 GPU,因此,以 GPU 为核心的算力供给已成为大模型产业高质量发展 的关键基础设施,而英伟达是全球最大的独立 GPU 供应商,也是 AI 芯片市场的领导者。虽然 全球生成式 AI 应用热潮是 ChatGPT 引起的,短期来看最大的受益者并不只是 OpenAI,还包 括英伟达。长期以来,全球独立显卡市场被英伟达与 AMD 两巨头垄断,根据 3D Center 数据 显示,英伟达在 2022 年第二季度独立 GPU 市场份额为 79%,AMD 则占 20%的市场份额,两家 合计占比 99%。自 2023 年初 ChatGPT 火爆全球以来,受 AI 芯片需求旺盛的影响,英伟达数 据中心业务实现强劲增长,公司 2024 财年第二季度净利润达到创纪录的 62 亿美元,同比高 增 843%;收入也同比高增 101%至 135 亿美元;毛利率较去年同期增长约 26.6 个百分点,达 到 70%;相应的英伟达的市值从年初 4100 亿美元目前已增长至 12000 亿美元。
(2) 算法:国外以 OpenAl 为代表有先发优势,国内在特定场景有优势
算法方面的能力取决于团队水平。目前,国内外的大模型算法顶尖人才的水平接近,但人才梯队略有差距。此外,AI 算法如果没有强大的算力基础设施的支持,就无法发挥最大效用。未来,国内外的人才差距可能会随着算力差距的逐渐显现而逐步扩大。
因此,总体来看,目前大多数 AI 算法及其相关模型架构由美国的 OpenAl、谷歌等开创,国外公司先发优势显著。以 OpenAl 为例,其推出的 GPT 系列模型一直坚持 Transformer 架构路径,并在此基础上运用大量数据训练使得模型产生涌现能力,且 GPT-3 之后并未开源,因此 OpenAI 有先发优势。其他海国外内公司仍需时间去研发追赶并进行模型迭代。
除此以外,国内部分公司在特定领域拥有算法积累的先发优势,比如图像识别、语音识别等AI 算法技术,处于全球相对领先的水平,人工智能论文总量与高信引用的论文数量,也处在第一梯队。
数据是训练大模型的养料,尤其是高质量的数据是训练出优质大模型的关键。在人工智能早期发展阶段,美国拥有大量高质量的数据资源,美国的科技公司和研究机构可以获取全球范围内的数据,率先去投入大模型的训练。目前,中文数据的规模与质量与国外存在差距。根据 W3Techs 多个方面数据显示,英文网站占全球网站数的 63.6%,而中文网站只占比1.3%。这极大地限制了中文大模型的训练效果。
然而中文教据本身也孕育着新的机遇。长久来看,中国则在结构化数据的应用与场景化落地方面具有一定的优势。A1 大模型最终的目的是要落地应用与商业变现,且大模型需要落地场景产生新鲜数据,以此不断进行模型的反馈与迭代。由于中国市场的应用场景众多、人口基数庞大,以此产生的数据样本丰富。此外,目前国内很多行业数据、企业数据通常较为优质,且多为结构化数据,虽大多为私域数据、不对外开放,但是垂类或专属大模型便可利用此类数据,开发出特定的垂类模型。目前国内已经在结构化数据上取得了一定进展,数据最优质的行业将最先获得 AI 技术带来的生产力提升。
综上所述,首先,算力方面,国内高端芯片的竞争力不足,同时还面临着“卡脖子”问题,缺乏足够的算力支持:其次,算法方面,由于大企业具有经济实力与大量的 C 端用户行为数据,因此先进的算法大多分布在在头部公司、大型机构以及特定垂直行业的公司,这一些企业拥有算法优势: 最后,在数据方面,由于中国应用场景最为丰富,能够产生持续的新鲜数据有助于后续大模型的反馈与迭代,目前国内已在结构化数据方面取得了一定进展,但仍有提升的空间。
通过分析对比国内外在算力、算法、数据方面的优势,我们相对看好有平台建设经验、有数据能力 (用户行为数据、数据标注) 的,以及在 to C、to B 方向有深厚业务积累的大模型厂商(行业或细分方向前三),选出了以下几个不同方向的大模型厂商进行重点分析,分别为字节跳动、华为、网易、同花顺。其中,字节跳动与华为的算法相对来说比较强,且有经济实力去搭建算力; 网易与同花顺的优点是拥有结构化数据,也有一定的算法积累与算力自我支撑能力。
6 月28 日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向公司可以提供模型精调、评测、推理等全方位的平台服务(MaaS,即 Model-as-a-Service),目前集成了百川智能、出门问问、复旦大学MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI 等多家AI 科技公司及科研团队的大模型,类似于为各行各业提供了一个“大模型商场”。
字节跳动搭建一个聚合第三方生产商的大模型“商店”,连接供应商与使用方,最终凭借优化到极致的服务效率,成为产业生态中至关重要的一环,不失为一条成本更低、切入更快的路。在模型生产端,火山引擎已经通过优秀的算力系统和机器学习平台证明了自己,成为众多大模型企业的首选: 在模型应用端,面对多模型生态和企业 1+N 应用模式,同样需要出示更好的产品和方案,解决计算、安全、成本等通用问题。
除了做“大模型应用商店”,我们还看好字节跳动在抖音的内容服务场景下做出内容生成的垂类大模型。根据 Tech 星球,字节跳动正在内部测试一款 AI 对话类产品,目前暂时称作“Grace”Grace 是一个AI 对话类测试项目的内部代号,目前还处于初级阶段,用于内部体验测试。
7月7日,华为技术有限公司在华为开发者大会 2023 上正式对外发布人工智能 (AI) 大模型华为云盘古大模型 3.0。华为常务董事、华为云 CEO 张平安说:“盘古大模型是一个面向行业的大模型系列。要让每个行业、每个企业、任何一个人都有自己的专家助手,让工作更高效更轻松。”目前,华为云盘古大模型 3.0已在煤矿、铁路、气象、金融、代码开发、数字内容生成等领域发挥作用,提升生产效率、降低研发成本。国际顶级学术期刊《Nature》正刊北京时间 7月6日发表了华为云盘古大模型研发团队独立研究成果一一《三维神经网络用于精准中期全球天气预报》。
模型聚焦三层架构,赋能千行百业。3.0 版的盘古大模型是一个面向行业的大模型系列,具有“5+N+X”三层架构: 从 AI 能力的基础层,到行业的第二层,再到应用层面向场景的各个接口,华为围绕深耕行业面向开发者持续打造了新的竞争力。L0层包括 NLP、视觉、多模态、预测、科学计算五个基础模型,提供满足行业场景中的0多种技能需求。盘古 3.0提供了 100 亿、380 亿、710 亿和 1000 亿参数等基础大模型
以匹配不同场景、时延、响应速度的行业多样化需求。L1 层是多个行业大模型,华为云既能够给大家提供使用行业公开数据训练的行业通用大模型包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 LO 和L1 层上,为客户训练自有的专用大模型。L2 层提供了更多细化场景的模型,更专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
盘古大模型聚焦垂类行业应用,AI 向 B 端迈进。此次华为盘古大模型 3.0 的定位是“为行业 而生”,发布会现场也展示了多个典型的 B 端行业应用。我们大家都认为,盘古大模型的发布进一 步打开了 AI 在 B 端落地的可能性,未来 AI 大模型更广阔的应用场景应该在多个垂直行 业领域。
自2023 年初至今,AIGC 慢慢的变成了许多游戏厂商对未来最重要的押注之一。根据伽马数据近期发布的《中国游戏产业AIGC 发展前途报告》显示,中国游戏营收 TOP50 的企业中,64%已经布局了 AIGC 领域。
目前大模型在游戏领域的应用走得相对靠前,游戏是天然的新技术实验集成平台,在B 端的落地效采最明显。AI 在游戏中应用的价值大多数表现在两个方面:一是生产流程的提效,二是提升玩家体验。
提效方面,AI 大模型可以大幅度提升游戏设计的效率,AI 大模型赋能游戏的体现为,AI 能够迅速根据设计师的描述生成一个简单的草图,然后设计师在此基础上细化,直至接近理想的状态,这比人来反复沟通调整,效率高得多。此外,若用户的表达不清或过于简单,AI 大模型还能够在一定程度上帮助用户扩充提示词,帮助生成更详细的描述,这也能大幅度的降低沟通成本。根据霞光社采访信息,在网易雷火,设计师已经在用 AI 大模型设计一些角色的服装、图标的生成,成本直降 40%。
玩家体验方面,AIGC 可以推动游戏的玩法创新。我们大家都认为 AIGC 对游戏的创新催化大多数表现在全新游戏品类与游戏个性化定制两大维度。目前市场上还很少有游戏真的将 AI 渗透到使用者真实的体验端,近期公司上线的新手游《逆水寒》国产武侠游戏在内容方面的进步和创新,尤其是 AI 智能 NPC系统,增强了游戏的互动性。
同花顺作为国内领先的金融信息服务提供商,始终致力于为投资者提供全面、准确、及时的金融数据和信息。同花顺的数据库资源优势显著,为其AI算法训练、AI 大模型训练提供了坚实的数据基础。大模型产品的推出将逐步提升同花顺在金融行业的竞争力和服务水平。
目前,公司正持续加大 A1 技术应用研发,并强化现有的应用场景,加速 AI 大模型有关技术与现有产品、服务体系融合,深度赋能 i问财、同花顺 APP、iFind、爱基金和面向 B 端客户等应用场景,以提升客户使用体验,提升产品质量和竞争力。
2.2.大模型的生态合作伙伴我们大家都认为大模型的合作伙伴可大致分为三奏: 第一类是大模型的生态合作伙伴,比如文学、图片等细分、垂直领域的龙头公司,大模型联合这一些企业进行深度合作,一起探索如何重新定义细分方向的客户的真实需求(中模型)。同时,随着爆款应用的出现,还会出现一些工具类与变现奏的合作伙伴,这是第二与第三类合作伙伴,比如移动网络时代的支付宝(工具类)、直播电商(变现类)。
大模型的生态合作伙伴与工具类、变现类的合作方的不同之处在于,大模型的合作伙伴的核心是针对业务层面,而工具类与变现类的合作方的作用则是繁荣整个生态,类似于App Store 上的各类应用。
2.2.1.垂类方向的合作伙伴:定义垂类客户的真实需求是做通用大模型还是垂直大模型,这样的一个问题在“百模大战”下引发了诸多讨论,也是许多 AI入局方需要着重考虑的问题。与 2022 年底初迅速涌现的生产力工具方向的初创公司不同,2023 年下半年以来,更多的公司聚焦于底层技术的创新。大模型勇于探索商业模式的公司也开始分化,许多面向医疗、电商、科研、工业、无人驾驶和机器人等特定领域的垂直大模型公司开始出现。
1) 通用大模型缺乏行业深度,不能够满足企业级应用场景的垂直性、专业性问题,如某些专业领域对大模型的要求更加苛刻,数据要精确,大模型是一个概率模型,如果有错误信息进入其中,就非常有可能污染整个知识库,因此导致问题;
2) 通用大模型的训练成本过高、周期长,直接训练和部署千亿级参数大模型成本高。
我们认为未来真正拥有大规模模型参数的道用大模型公司数量将在 3-5 家左右。这一些企业的作用类似于互联网时代的运营商,角色定位为“公共底座”,最终目的是基于通用大模型服务本身拓展商业化。但道用大模型很难满足行业与企业的场景垂直化的专业需求。因此,对于大模型厂商而言,要想实现大模型的商业化,最好是在各垂直领域寻找合作伙伴,在业务层面进行深度合作,共同开发出针对特定行业的垂直类应用模型。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
微信扫一扫