撰文| 吴坤谚编辑| 王 潘
大模型在吟诗作画,我们在苦哈哈干活。
(资料图片)
一条流传甚广的段子道出大模型如今面临的落地困境:作为目前技术的最前沿,AI大模型迫切需要真实的可落地场景释放价值,才对得起军备竞赛中大小组织投入的人力与真金白银。
但段子终归只是段子,落地其实距离我们并不遥远。在现代人生活中必然接触的电商场景中,大模型已经走在落地之路上,重构相关业态。其中风头最盛的当属生成式内容(AIGC),包括但不限于文生图、文生视频、人机交互等。
只需简单列举,我们便不难得出一个重塑电商领域人货场的故事:B端应用智能客服、数字人直播提高人效,消费者获得24小时响应客服的体验;AIGC低成本生成全渠道内容,智能化搜索与选品为分发增效的同时缩短交易链路,提升ROI……
只是如今深度学习中流传的一句话道出了当下AIGC的困境:我们已经可以让机器像人一样说话,却很难让机器像人一样智能。面对电商场景强交互、重决策、弱链接的的特点,单纯的“拟人”难以形成完善的产品逻辑。
因此对于AIGC在电商领域的落脚点,玩家们通常寻求“在开放中求封闭”,走出一条自下而上的道路。
据知名公司沙利文最新发布的《2023年中国智能客服市场报告》显示,2022年中国智能客服市场规模已达到亿元,预计到2027年市场规模有望增长至亿元,预计五年内复合增长率可达到20%以上。
我们见证这条细分赛道朝百亿规模迈进,而电商普遍性应用智能客服正是赛道能保持高增长的主要原因。
首当其冲的是电商场景难以绕开的流量高峰以及流量带来的高并发售前咨询,双十一、618之类的购物节不提,电商商家每一天都有可能遇到多起并发咨询。在此情况下,无论是客服响应过慢导致的用户流失还是人工客服背后的高成本,都是已经步入红海的电商市场难以承受之重。
说白了,电商平台普遍应用智能客服是趋势所向,而且从时间看来,智能客服的普遍应用还早于大模型之前。如果说大模型是智能客服的二次跃升,那么智能客服的首次跃升是时代的NLP(自然语言处理)技术。
“大模型驱动的AIGC出来之前,行业内就已经有比较成熟的基于NLP的智能客服,而且应用很广”,智齿科技产品VP陈喆告诉光子星球,“而客服场景接受的咨询与问题大多是封闭性的,相比开放性场景更容易做出人效来”。
在尚未具备NLP自然语言处理技术之前,在线客服的产品形态是简单的QA,根据预先录入的关键词、句、段做出机械回答。做一个不算恰当的比喻,NLP技术前后的智能客服一个是传统RPG中机械反馈玩家的NPC,另一个是当下3A大作中根据玩家实时情况做出不同反馈的智能NPC。
换句话说,NLP是在线客服智能化的开始,其市场化也同步进入成熟期。那么大模型便是在线客服智能化的跃升,主要体现在高效化、个性化与更加智能化上。
陈喆用一则数据做了个不算准确的类比,假设NLP技术让智能客服可以准确回答100个客户问题中的50个,那么将大模型加入智能客服工作流后,目前可以做到准确回答75个,而且可以通过数据库的切换从而切换不同场景。
“提效的绝对值在20%~30%左右,相对值50%这样”,陈喆称。
大模型对智能客服的人效提升不仅存在于需求端,更存在于供给端。大模型现有的二开与外挂数据库范式让智能客服产品从头搭建的时间相对此前大大缩短了,投入的人力和时间成本呈现数量级的下降。而数据库、知识库的切换也确保了产品的独特性。
当大模型还在寻找落地场景时,50%的增效已经为行业带来了足够的确定性,无论是大模型结合现有智能客服产品或是大模型以客服形式直接在SaaS领域落地。
更值得行业深究的问题是,打造一个智能客服产品需要构建什么样的技术栈,以及接下来的商业化。
智能客服是AIGC在电商领域落地的急先锋,只是接入成本高昂的大模型能力却是一件急不来的事情。
于大厂而言,客服不过是电商平台中积重难返的成本损耗之一,一般不会在该领域投入太多资源;而中小厂商自然也没有能力从零构建模型底座。陈喆便直言智齿科技未构建自研大模型,而是调用领先模型以及互联网数据,从而在应用层打造产品。
换句话说,智能客服领域普遍存在投入资源的限制。底座缺失的情况下,智能客服目前大多遵循的是“选型调用——数据采集清洗——训练微调——部署应用”的范式,但问题也随之而来,且主要集中在数据层面。
一般来说,智能客服本身是应对客户降本需求的产品,自身的成本问题便更为突出。业内常见的调用成熟的数据库的做法的确可以极大缩短产品雏形的上线时间,却会影响到成品的使用体验。一个是准确率有可能因为数据偏差而下降,另一个是数据同步存在滞后性。
数据本身会经由厂商做结构化的采集清洗,能否完美贴合客户所在行业或领域却是另外一回事,因为其存在数据偏差导致的幻觉问题难以避免。陈喆告诉光子星球:“可回答率的提升也伴随着轻微的准确率下降,这在不少客户看来是不能接受的。比如法律、教育、金融等领域的客户。”
而数据同步更偏向于对智能客服供给与需求双端。一方面,客户需要及时上传有待用于训练微调的数据,另一方面,厂商也需要高频率的微调并更新产品。
陈喆称,智齿科技目前的更新频率是周更,在开放数据接口的情况下,客户需要及时传送最新数据,经历一段时间的语料学习后才能让“最新数据”的价值得以体现。
“你的需求是秒级、分钟级还是小时级都可以,数据前一秒push到我这,下一秒就会成为我们产品的训练语料。”
这不失为一个同步的好办法,但也较为依赖调用模型的学习能力,而且难以第一时间“消化”数据价值。
至于最初的成本问题,相对而言反而没那么重要了。智能客服场景的封闭性本就限制了数据量,从某家非头部厂商的视角看,智能客服目前既不需要“囤卡”或接入向量数据库来保障检索效率,也不需要在调用模型时过于考量tokens成本,只需要结合对应成本进行定价即可——无论如何,使用智能客服节约的人效都比目前的定价要高得多。
可以肯定的是,智能客服想做出一个demo来确实容易,但其距离落地之间的距离并不止投入一个调用或自研的模型。难以量化的成本或将成为未来智能客服赛道中,玩家们的护城河。
在讨论AIGC结合智能客服的可能性的同时,我们还需要考虑到智能客服并非由AI开拓的新赛道,而是一条有着十余年历史、业态为大模型所重构的老赛道。
于智能客服赛道而言,业态的重构包括从NLP升维至大模型的底层变动、从语义理解演变为多模态的功能跃升等,但非技术视角下的商业模式却未曾改变。
说白了,智能客服是一项以降本为核心目的的SaaS业务,这一点从《2023年中国智能客服市场报告》数据显示软件占据2022年中国智能客服市场%中可见一二。也就是说,智能客服厂商的生存空间在于客户与达成智能客服能力之间的距离,这一点在技术变迁的重要节点也未曾改变。
“如果大厂能在智能客服把我们打死的话,那么早在NLP时期我们就已经死了”,陈喆说。
更进一步,智能客服既然是SaaS业务中的一种,那么其增长范式也同样有因循逻辑。例如推出客服领域大模型的移动、联通等运营商与容联云,采用的便是产品驱动型增长(Product-led Growth)为主的增长模式,而对于未具备相应能力的非头部厂商而言,大多呈现更偏向于体验驱动型增长(eXperience-Led Growth)的模式。
并非腰部厂商以及他们的客户不在意产品表现,而是腰部厂商面对大厂在技术与资源上的倾轧,需要构建第二增长曲线来为自己拓宽生存空间。比较典型的是针对客户在应用产品时可能发生的问题做“预处理”,以及尽可能拓展主要业务之外的业务路线等。
以某腰部厂商为例,他们为自家产品专门建立了运营部门,“无所不用其极”来做客户支持,贴近客户。而运营部门的工作包括代客户写prompt、帮助客户做私域运营、甚至作为客户与厂商之间的“中转站”,以成员的形式撮合数字化整体解决方案等。
诚然,小厂能做的基本上大厂也能做,只不过需要投入一定时间与人力。只是两者对智能客服的认知以及展开业务的路线分野,也为腰部厂商挤出了不小的生存空间。
“大厂资源多投入高,自然想大口吃肉,盯着大客户开单。而且也免不了一些务虚的东西,比如让客户试跑模型来‘偷师’语料。我们是更接地气,尽可能让客户降本的需求在售前就能有清晰的感知”,某腰部厂商产品经理称。
况且,作为企业数字化转型众多项目中的一个,智能客服的盘口并不算大。一般大客户会选择打包的方式多方采购,防止一体化的风险,这其中也蕴含着非头部厂商的机会。
目前看来,如今的智能客服赛道还算得上“万类霜天竞自由”,只是随着智能客服与AIGC结合程度的加深,竞争白热化后的业态很可能再次改变。
最基本的幻觉问题导致生成内容质量不稳定摆在全行业面前,目前尚未有明确解法;而智能客服结合AIGC的业务进入成熟期后,从降本增效到更进一步的价值创造的趋势又在倒逼智能客服厂商加码技术迭代。比较典型的是电商领域的智能客服完全可以从客服延伸到导购。
此外,光子星球还自某头部大厂处了解到,AIGC在电商客服场景的应用存在时延,单纯语义检索难以保障用户满意度,引入向量数据库似乎是未来的必然。
智能客服以其自身的降本价值以及与大模型的耦合程度,已然成为大模型落地的确定性场景之一。而其大模型时期的发展才刚起了个头,勉强从“智障”变“智能”的客服面对复购、交叉销售等需求,还需要更多范式迭代。