去年有三个月,我每天打开后台看续约数据,那种感觉就像在等体检报告——明知道结果不会好,还是得看。最惨的一个月,到期客户续了不到四成。我们销售总监在周会上把投影仪关了,说:“直接聊吧,别看了。”
那段时间我们犯的错,现在说出来都觉得蠢——按 token 计费。
我们活活把生意做成了卖水表
2023 年下半年,我拍板把所有企业客户切到按 token 用量收费。当时的理由听起来特别“互联网”:用多少付多少,公平透明,客户初期成本低,用顺了自然会加量。嗯,写到这我犹豫了一下——当时没人拦我,其实是因为整个团队都被这种“看起来先进”的定价洗脑了。
后果来得比预期快。一个做母婴电商的客户,接了我们一套客服 agent,双十一当月 token 消耗翻了四倍。我们的后台自动出了账单,比平时多了近三万块。客户的技术负责人直接在群里发了句:“你们这 AI 是喝油的吗?”
他没说错。从他们的视角看,那个月销量涨了 30%,但客服团队的人没少,退货率没降,唯一明显涨了的,是给我们的钱。他后来跟我私下说:“每次看你们的账单,都觉得自己家水龙头没关紧。”
这就是 token 计费的本质——你把客户的注意力全部引到了消耗量上。他们不再讨论“这个 agent 有没有帮到业务”,而是开始抠每一千 token 的价格,开始比较哪家基础模型更便宜,开始要求我们提供 token 消耗的明细报表。我们从一个“帮客户解决问题的团队”,变成了“提供算力消耗明细的供应商”。
那个母婴客户没续约。走的时候说了一句:“你们挺好用的,但我没办法跟老板解释为什么 AI 客服的费用比真人客服培训费还高。”
项目包年 + 模块化,救了我们一命
今年年初,我们把定价彻底翻了。现在给客户的方案就一句话:一个场景一个模块,按年一口价。比如客服 agent 一年多少钱,数据清洗 agent 一年多少钱,超出约定调用量我们兜底——客户不用看表。
这个改动内部吵了两个月。最核心的反对声音是:“万一客户猛用,我们岂不是亏死?”我当时的回答现在看也不一定对,但倾向于这样:如果客户猛用到能让我们亏钱的程度,说明这东西对他们真的有用。 那种情况我们该做的是涨价或者扩场景,而不是在用量上设卡。
实际跑下来,情况比我预想的好得多。同一个母婴电商客户——对,我们把他请回来重新谈了一次——我直接说,按年一口价,包客服场景,调用量不设上限,唯一条件是他每个月跟我们开一次业务复盘会。他签了。三个月后他主动加了第二个模块,选品推荐 agent。他说了一句我到现在都记得:“现在我知道这一年要花多少钱,剩下的就是逼你们把东西做管用。”
续约率从不到四成,爬到了接近九成。这个数字我犹豫了一下要不要写出来——显得像在吹——但它就是事实。而且不是因为产品突然变好了,是定价让客户考核我们的指标变了。他们不再问“这个月为什么用了这么多 token”,转而问“下个季度你们能不能帮我把客服转人工率再降一点”。客户问的这个问题,才是我们该赚的钱。
我现在认的账
回头看,按 token 计费那个决策,根子上是我对客户要买什么判断错了。我以为他们买的是“AI 能力的使用权”,其实他们买的是“一个确定的结果,一个不用操心的交付”。token 用量是成本结构的问题,是企业内部该吞下去的复杂度,不是该摊给客户看的账本。
我打个赌——不是特别有把握,但倾向这么看:两年内,企业服务里按用量计费的 AI 产品会退潮一大半。尤其是那些结果不确定、效果依赖场景调优的服务,客户根本不认“用量”这件事。你让他们看表,他们就跟你算账。你让他们看结果,他们才跟你谈续约。
这个判断我自己也犹豫过。模块化包年不是万能药。客户会要求更苛刻的交付标准,项目边界也容易扯皮。但至少,我们现在在跟客户扯“这个需求是不是包在模块里”,而不是扯“这个月 token 为什么是上一周的三倍”。前者是商业问题,后者是水电费。我们不想再做水表了。