“百模大战”未完 商业化仍在路上

北京商报

2023-12-28 08:13

站在2023年尾,OpenAI首席执行官阿尔特曼发出了一份感性十足的年终总结,他说这真是疯狂的一年,但更重要的是,“我很高兴2023年是世界开始认真对待AI的一年”。

这一年AI爆炸,凭借着ChatGPT的横空出世,OpenAI一跃成为全球科技圈最瞩目的新秀,其前所未有的智能涌现和自然语言交互能力以及衍生的巨大想象空间,不仅掀起了新一轮人工智能的热潮,也仿佛开启了下一个时代的序幕,全世界为之疯狂。国内,没人想错过这趟时代的列车。一场轰轰烈烈的“百模大战”随即开启,大厂、小厂、互联网老将、学术派纷纷下场。

和开始时不同,神话祛魅、激情正回归理性。依然像阿尔特曼所言,虽然人们对AGI(通用人工智能)的呼声超出了他的预期,但可能让大家失望的是,2024年仍无法实现这一目标。

追赶、分化与成型

2023年3月,英伟达的GTC大会上,CEO黄仁勋说,人工智能的“iPhone时刻”已经开启。

四个月前,OpenAI推出ChatGPT。不过短短两个月,ChatGPT月活用户过亿,成为历史上用户增长速度最快的消费级应用程序。

“AIGC卷起来的那一夜”背后是人工智能在ChatGPT的引导之下全面爆发,掌握着“算力命脉”的英伟达也一并走入聚光灯下。

而这“最卷一夜”的一周前,百度大语言模型产品“文心一言”正式发布,国内浩浩荡荡的百模大战也正式画出了一个起点。

ChatGPT的发布是故事的起点,也是准备期的起点。SuperCLUE联合创始人兼首席运营官朱雷对北京商报记者回忆说,那是一个又迷茫又震惊的阶段,但在那个阶段一种共识也迅速达成,就是大模型非常重要。

此后,以OpenAI发布GPT4.0、百度发布文心一言1.0、科大讯飞发布星火1.0等为代表,国内大模型进入成长期,数量和质量逐渐增长。

7月左右,各行各业开源、闭源大模型层出不穷,“百模大战”竞争态势越发明显。有数据统计,截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省市/地区,国内大模型总数达238个。

12月22日,国内首个官方“大模型标准符合性评测”结果出炉。阿里云、百度、360、腾讯四家企业旗下的大模型产品首批通过测评,代表着其在通用性、智能性等维度均达到国家相关标准要求。

但国内外大模型依然存在差距。GPT4-Turbo以89.79分的成绩领先,国内排名第一的文心一言4.0总分则为74.02分。整体而言,国外代表性模型平均成绩为71.23分,国内代表性模型平均成绩为60.48分。

近期,著名人工智能和大数据专家、清华大学电子工程系兼职教授窦德景也表示,国内大模型目前达到GPT-3.5水平,离GPT-4还有一定差距,但差距在缩小。

AI时代标志是原生应用

2023年11月初,OpenAI又放了大招。首届开发者大会上,除了堪称王炸的GPT-4 Turbo以及“加量不加价”的好消息外,真正可能影响未来的,则是GPTs的推出。

GPTs是AI Agent初期形态产品。用户仅仅通过跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成专属GPT。

在业内,这也被认为是继ChatGPT之后的又一个“杀手级应用”。更重要的是,定制化的GPT还能上线GPT Store,实现变现。

一个新的“iPhone时代”更近。

“人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。”百度创始人、董事长兼首席执行官李彦宏曾如此说道。“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”

如果说2023年初的焦点属于大语言模型,那么2023年末的焦点就一定是多模态大模型。多模态的意义在于为AI应用带来了更多可能性。

“多模态确实给了我们很多惊喜,尤其是在2023年下半年中,最大的惊喜莫过于文生视频要比预期的发展快得多。”在接受北京商报记者采访时,无界AI联合创始人马千里说道。在马千里看来,从未来的发展前景看,大语言模型因其更基础的属性可能会走得更广,但从商业化进程来看,多模态很可能领先。

朱雷预计,最快2024年上半年,大厂和创业公司都会补齐多模态的能力栈。“我们认为,未来的SuperApp绝不只是一个简单的文本,它可能会与各种智能设备做结合,这其中最核心的就是多模态能力,这也决定了未来的发展方向大概率是要把模型的通用能力或在固定场景中的能力拓展到某些实体或软件上。如果明年依旧找不到场景,很可能会淘汰一大批相关企业。”

商业化有多远

多模态也好,生态也好,最终的目标都是落地、都是商业化。

“当前中国的大模型领域发展很快,但同时也面临一个很大的挑战,即非常缺少已经很成功的C端应用。”不久前,网易执行副总裁周枫如此说道。

“真正掣肘的是模型整体的效果还没有达到能够孕育出SuperApp的程度。”朱雷称,目前国内的大模型仍与GPT4或GPT4-Turbo存在一定差距,限制了其落地的可能,而且即便是GPT4,在面临一些好的想法时也可能难以实现。

在to B领域,朱雷认为,主要是因为幻觉等问题的存在,导致大模型在一些较为复杂的工业流程中存在不稳定因素,影响了其大规模落地。

“整体来看,2023年还处于大模型的初期发展阶段,随着不可逆的、进步的迭代,一旦达到一个落地的平衡点,可能就会出现一些SuperApp,初步预计这个时间可能在2024年的6—7月。”朱雷称。

事实上,国内大模型的发展可能也陷入了一定程度的误区。香颂资本董事沈萌对北京商报记者分析称,大模型真正的意义在于颠覆人与机器或者人与网络之间的互动,让科技更好地渗透到整个生产生活当中,而不是盲目地在一个大模型上加入行业数据,或是利用一些接口调用底层功能,再与外部应用进行链接。

伽利略资本合伙人郑譞则提供了一个投资的视角:今年讲大语言模型故事的人很多,也不乏一些应用的出现,但整体看来,市场化机构出手并不活跃,除了受整体大环境影响外,也因为到了后期,大模型应用的逻辑已经脱离了大模型本身。

以妙鸭相机为例,郑譞称,这类AIGC产品整体上沿用的还是移动互联网时期的投资思路,遵循着获客成本、留存、DAU、天花板等成熟的公式进行推导,AIGC时代应用的载体和形式没有发生本质的变化。

AIGC似乎和元宇宙、区块链等热点一样,踏入了同样的河流。沈萌称,从2023年大模型的发展情况来看,其实与过去市场中科技类热点大同小异,基本都延续着国外热点爆发,引发国内市场狂潮,相关主体纷纷入局推出自有产品,并不断进行市场营销的路线,“而当市场被充分消化之后,各方主体在大模型上的狂躁,也逐渐开始回归到正常状态”。

大模型会是下一个时代的操作系统吗?这是科技圈目前给AI描绘出的最大的一幅愿景。“起码就目前的情况而言,应用的大规模推广还没有到来。”在郑譞看来,当下对于AIGC的投资已经不完全是一个烧钱的时代,但行业在哪一部分有更大的商业价值,哪一部分能更快实现商业化落地等方面还没有达成共识。

( 作者:杨月涵 编辑:王晨曦 )