小拇指目前在抖音本地生活、职人视频、门店账号、官方账号、外包客服私信等渠道中产生大量评论与私信线索。这些线索并非普通留言,而是已经被内容激活的潜在客户在做决策前释放出的真实信号。
当前这些线索的处理方式存在以下问题:
因此,双方决定以 Pilot 方式,先验证一套「用户决策结构 → slots → Flow/NBA → AI 策略回复 → Eval/Trace」的决策智能体运行方式,判断其是否具备进一步团队化运行和生产级系统化落地的价值。
↑ 返回阅读导航本项目分为三个阶段:
本协议仅覆盖 Phase 1。Phase 2 与 Phase 3 是否启动、具体范围与费用,由双方基于 Phase 1 结果另行签署补充协议或新协议确认。
↑ 返回阅读导航Phase 1 的核心目标不是「上线一个 AI 客服」,而是回答以下关键问题:
Phase 1 以「结构验证」和「初步业务 uplift」为核心,不承诺最终成交归因,不承诺覆盖所有业务场景,不承诺替代甲方现有客服团队。
↑ 返回阅读导航Phase 1 工作范围包括但不限于:
目标:完成任务定义与第一版结构/slots 抽取。
主要工作:
说明:Contract 不是形式文档,而是后续人工 Runtime 和 AI 工作台的治理层。后续所有策略、话术和评估都必须服从该 Contract。
为便于甲方理解,本项目中的几个关键概念说明如下:
因此,Week 1 的工作不是简单「看截图」,而是建立第一版线索心智地图:哪些用户决策结构是稳定存在的,哪些 slots 真正影响下一步策略。
目标:形成第一版可运行的策略结构。
主要工作:
说明:Week 2 不是承诺 AI 已经自动学会最优策略,而是完成第一版「AI 辅助生成 + 业务 owner 确认」的半人工策略蒸馏。
这里的策略并非凭空编写 SOP,而是来自三类输入:
换句话说,Week 2 做的是 Decision Mining,而不是普通客服话术整理:从历史对话里抽取局部有效策略,再由甲方业务负责人判断哪些策略可以刻进系统。
Week 1-2 结束时,应形成第一版决策卡库与策略 Flow。Week 3 起,才基于该卡库开展人工辅助运行验证。
目标:在真实线索上运行第一版决策卡库。
主要工作:
说明:Phase 1 不建设完整自动化系统。Week 3 的本质是由乙方搭建带 Contract、卡库、slots、Flow 的 AI 工作台,由人工输入真实线索,AI 输出结构判断、NBA 和建议话术,再由人工审核并发送。
该人工 Runtime 可理解为第一版 Decision Runtime,基本结构如下:
目标:记录运行结果,观察初步效果。
主要工作:
目标:对典型线索形成完整行为轨迹复盘。
主要工作:
Week 5 的交付物包括:
Trace 表字段包括但不限于:线索 ID、来源、原始问题、匹配决策卡、关键 slots、AI 建议动作、实际发送话术、用户反馈、下一步动作、最终状态、复盘判断。
说明:Phase 1 的 Trace 以人工记录和样本复盘为主,不承诺接入抖音、门店、CRM 等系统完成全链路自动归因。
目标:判断是否值得进入下一阶段。
主要工作:
说明:Week 6 不承诺增长曲线一定大幅拐点,而是完成「是否值得上生产」的复盘与演示。
本阶段结束后,乙方将提交下一阶段「团队运行验证 / 生产级落地」建议方案。是否进入第二阶段,由双方基于 Pilot 结果另行确认。
Phase 1 最终交付物包括:Pilot 复盘报告、是否进入 Phase 2 的判断建议、Phase 2 扩展验证方案、初步生产级路线图。
↑ 返回阅读导航Phase 1 完成后,乙方将交付:
双方确认,Phase 1 不包含以下内容:
Phase 1 验证的是「结构有效性」和「初步业务 uplift」,不是完成全业务生产系统。
↑ 返回阅读导航甲方需配合乙方完成以下事项:
如因甲方未及时提供必要数据、业务规则或执行配合,导致 Pilot 时间延误,双方应协商顺延项目周期。
↑ 返回阅读导航Phase 1 项目费用为人民币 150,000 元整。
建议付款方式:
付款账号:
上海多看人工智能科技有限公司
招商银行 上海分行 上海张江支行
账号:121988083310001
如双方另行约定,也可采用以下付款方式:
Phase 2 不包含在本协议费用中,需另行确认。
Phase 2 的定位不是「再做一轮简单 Pilot」,而是把 Phase 1 中由 Grant + AI 验证过的结构,从 20-30 条样本扩大到 100-300 条真实线索,并让甲方团队在更真实的业务节奏中运行,验证这套体系是否可以从「Grant 人肉跑通」进入「团队可复制执行」。
Phase 1 证明的是:Grant + AI 能否把评论/私信中的用户决策结构化,并生成更好的首轮策略回复。
Phase 2 需要证明的是:小拇指的外包客服、职人、门店或运营团队,是否能在统一结构下稳定执行,并产生可观察的转化改善。
因此,Phase 2 的核心问题不是「多跑几条线索」,而是回答上生产前的三个问题:
Phase 2 的复杂度高于 Phase 1,原因在于:
建议周期:4-6 周。
建议费用:人民币 200,000-300,000 元,具体依据样本量、参与账号数量、参与人员数量、培训深度、抽样审核频次与复盘深度另行确认。
Phase 3 不包含在本协议费用中,需另行确认。
Phase 3 的目标不是建设一个普通客服 SaaS,而是建设一套「小拇指抖音线索决策运行平台」。该平台可暂称为 bingo,其本质是 AI 原生的线索决策 Runtime,用来把抖音评论/私信从混乱对话转化为可判断、可执行、可追踪、可优化的任务链。
普通客服 SaaS 主要解决「人如何回复」;bingo 要解决的是「每一条线索进入系统后,AI 如何判断、选择动作、生成回复、记录反馈并持续学习」。因此,生产系统的复杂度不仅来自传统 SaaS 的数据、权限、账号、接口、看板,也来自 AI Agent 系统本身的运行机制,包括:任务 Contract 如何被系统 enforce、slots 如何自动补齐、Flow / NBA 如何被模型调用、模型输出如何受业务规则约束、Eval / Trace 如何自动记录、token 与模型调用成本如何控制、低风险与高风险场景如何分流、人工审核如何嵌入 Runtime。
生产系统与 Phase 1/2 的最大区别在于:Phase 1/2 主要依靠 Grant 和甲方团队人工运行 20-300 条线索;Phase 3 要让系统在可获得数据范围内持续处理 1,000、10,000 甚至更多评论/私信。也就是说,生产系统要把人工 Runtime 变成可扩展的 AI Agent Runtime。
Phase 3 至少需要处理以下 AI Agent 特有问题:
这些工作是传统客服 SaaS 团队通常不具备的 AI Agent specific 能力,也是生产系统建设成本与价值所在。
生产系统不应一开始假设必须自研全部 Agent 框架,也不应直接绑定某个单一供应商。更合理的方式是先完成技术选型评估,再根据小拇指的数据接入条件、账号规模、团队能力和安全要求,决定采用「自研 Runtime、开源框架、商业 Agent 平台,或混合方案」。
技术选型至少需要评估以下问题:
因此,Phase 3 的生产建设应包含「Agent Runtime 技术方案设计」这一交付项,而不是只做传统 SaaS 的页面、字段和报表。该方案将评估自研、开源框架、商业平台或混合架构的可行性,并给出推荐路线。
本协议阶段不预设最终技术路线。Phase 1/2 的目标是先形成可验证的决策结构与运行证据;Phase 3 再基于验证结果选择最合适的 Agent Runtime 技术路线。
考虑到本项目主要运行在国内业务环境中,Phase 3 的 Agent Runtime 技术选型应优先评估国内可部署、可合规、可持续运维的模型与平台生态,包括但不限于字节系、阿里云、腾讯云、智谱、Kimi、MiniMax 等大模型与智能体平台。
其中,抖音评论/私信属于本项目最关键的数据入口。若未来存在与抖音企业号、抖音开放平台、服务市场工具或字节系 Agent 平台更顺畅的接入方式,应优先评估其可行性。但本项目不预设「字节系方案一定可获得平台级特权」,也不把抖音全量接口开放作为 Phase 3 的唯一前提。
国内平台适配至少需要评估以下问题:
因此,Phase 3 的技术方案不应提前绑定某一家模型或平台,而应在 Phase 1/2 验证业务有效性后,基于数据接入条件、账号规模、平台权限、成本、安全与可维护性,选择最合适的国内 Agent Runtime 技术路线。
目标:把散落在抖音里的线索变成可读取、可追踪的 lead。
可能涉及:
生产一期不一定要求一步到位接入全部数据。可根据数据可得性,从官方私信、外包客服已接触线索、高互动视频评论、职人主动筛选评论等高价值入口开始。生产一期的目标不是「抖音全量接入」,而是让可获得线索先进入决策运行闭环;如果业务效果成立,再逐步扩展数据入口、账号范围和自动化程度。
目标:让系统知道「这条线索现在处于什么用户决策状态,下一步应该做什么」。
可能包含:
目标:把 AI 策略真正用于业务回复和线索推进。
可分为三种成熟度:
生产系统不应从第一天就追求全自动回复,而应先建立可控、可解释、可回滚的半自动执行机制。
目标:记录每一次策略动作和用户反馈,让系统开始学习自己的经验。
可能记录:
最终形成运营看板,包括:哪类线索最容易转化、哪套话术更有效、哪个门店执行更好、哪些 slots 需要更新、哪些 Flow 需要调整。
A 档:轻量生产版
适用于抖音评论/私信无法稳定自动接入,但可通过人工、外包、批量导入方式获取高价值线索的情况。
可能包含:
建议费用:约人民币 1,000,000 元起,具体另行评估。
B 档:标准生产版
适用于可以通过工具、RPA、后台导出或部分系统接口持续获取评论/私信数据的情况。
可能包含:
建议费用:约人民币 2,000,000 元起,具体另行评估。
C 档:增强生产版
适用于多账号、多门店、多角色、多业务线并行运行,且甲方希望形成持续经营型 AI 决策系统的情况。
可能包含:
建议费用:人民币 3,000,000 元以上,具体依据系统边界与接入复杂度另行评估。
如 Phase 3 建设完成并产生明确业务增量,双方可进一步讨论长期合作模式,包括但不限于:
参考路径:
本项目的数据入口为抖音评论与私信。双方确认以下事实:
Phase 1 以交付物提交与复盘会议作为验收方式。
验收重点不是承诺最终成交结果,而是确认:
本项目采取分阶段方式推进,是因为生产级 AI Agent 系统建设具有明显的不确定性和工程复杂度。Phase 1 的价值不在于回避这些复杂度,而在于先回答最关键的问题:
当一条真实抖音评论/私信进入决策结构后,AI 生成的策略回复是否能比普通回复更好地推动用户继续往前走?
如果答案是否定的,则不应贸然进入生产系统建设;如果答案是肯定的,则说明后续数据接入、团队运行验证和生产系统投入具备业务依据。
因此,Phase 1 是生产系统建设前的必要验证,不是生产系统的替代品。Phase 2 是组织运行能力验证,Phase 3 才是系统化建设。
↑ 返回阅读导航普通 SaaS 通常围绕字段、流程、权限、报表展开;本项目的生产系统还需要处理 AI Agent 的任务运行问题:
这意味着,生产系统的核心不是「把 AI 接到客服窗口」,而是建立一个可以持续运行、持续记录、持续学习的线索决策 Agent Runtime。
↑ 返回阅读导航本项目不是建设一个普通 AI 客服,而是通过小拇指真实抖音评论/私信,验证一套「用户决策结构 → slots → Flow/NBA → AI 策略回复 → Eval/Trace」的决策智能体运行方式,判断其是否具备进一步团队化运行和生产级系统化落地的价值。
↑ 返回阅读导航