段韬

西安交通大学

从学术研究到产品实践:将调研方法论转化为服务中小融媒的增长飞轮模型,用 AI 语义理解重构求职匹配体验。

项目 ↓

西青融媒 · 轻量级内容运营体系

为 2000+ 中小县级融媒体中心设计的内容-分发-增长飞轮模型。不靠堆资源,靠让现有资源发挥数倍效果。

内容-分发-增长三层飞轮模型架构图

调研规模

127 份问卷 + 8 人深度访谈 + 260 篇内容量化分析

核心发现

本地内容互动量是非本地内容的 3.6 倍——同等平台、同等账号权重下的数倍差距

方法论验证

选题讨论会从「等上面分任务」变成了「这条选题关系度几分?」——团队行为转变是最真实的验证

查看完整文档 →

展开项目详情 ▾

背景与问题

2018 年以来,全国县级融媒体中心挂牌数量超 2585 个。但真正有能力建设"中央厨房"、获得专项财政支持的不足 20%。剩余 2000+ 个中小融媒中心面临典型的"资源鸿沟":年预算不足 300 万、无技术团队、全员不到 15 人。项目启动时,我带着一个从文献和政策文件里形成的假设——"中小融媒的核心瓶颈是资源不足,如果能帮他们争取更多资源,问题就能解决。"这个假设驱动了第一阶段的调研方向,但后来被数据和用户反馈彻底推翻。

  • 年预算低于 300 万的占 73%,无专职技术人员的占 68%——这是行业的沉默大多数
  • 核心矛盾:顶层设计要求"建强用好",但基层缺乏的是方法论,不是钱
  • 初始假设(资源瓶颈)→ 调研后证伪 → 真正拉开差距的是内容策略能力

竞品分析

我定义了三层竞品圈来系统扫描竞争格局。内层:天津市同城同级 4 家区级融媒横向对比——四家融媒在"资金"和"上级平台"这两个变量上基本一致(都接入津云,都依赖区级财政),但西青的篇均互动量是河西区的 2.2 倍。差异不在资源,在本地内容占比和原创率。中层:本地头部自媒体——优势在"快"和"近",但无公信力;融媒有官方信任背书却把它浪费在"公文式表达"上。外层:全国标杆。长兴靠机制创新而非堆资源,尤溪靠轻量化+内容聚焦做到抖音 200 万粉——两个标杆都不是靠钱砸出来的。

  • 四家融媒资源条件基本一致,但篇均互动量差距达 2.2 倍——资源不是决定变量
  • 融媒 vs 自媒体的核心差异:自媒体赢在"快"和"近",融媒手握"信"和"全"却不会用
  • 标杆验证:长兴靠机制创新,尤溪靠轻量化——都不是堆资源

用户调研

面向全国 127 个中小融媒中心发放问卷,对西青融媒中心进行 8 场半结构化深度访谈(覆盖管理层、采编人员、运营人员三个角色层),并完成 260 篇多平台内容量化分析。我抽象了四类核心用户画像:"迷茫的主任"——知道新媒体重要但不知道怎么做,预算有限不敢试错;"疲惫的记者"——一人兼多岗,选题全等上面分下来,做了好内容也得不到反馈;"焦虑的运营"——全凭直觉,各平台胡乱发,想学但没人带;"沉默的居民"——不是不看新闻,是不看和他们无关的新闻。一位一线采编的话让我印象深刻:"我们每天发的稿子,大部分是上面要求的。我知道这些没人看,但上面要发。我也不知道用户到底想看什么,因为我们不看数据,也没人看数据。"

  • 最大痛点排序:82%"不知道做什么内容用户爱看",排在 56%"没钱"前面——需求侧盲区才是真瓶颈
  • 仅 14% 的融媒选题包含用户反馈/数据,71% 认为"爆款靠运气"
  • 关键洞察:中小融媒有自媒体没有的核心资产(第一手信息+官方信任背书),但"产品形态"让这些资产无法发挥价值

数据分析与核心洞察

对西青、和平、南开三家融媒的 260 篇内容进行多维度量化分析(内容属性、本地关联度、传播效果、时效性)。核心发现:本地内容在所有效果维度上碾压非本地内容——篇均互动量是非本地的 3.6 倍,互动率 3.7 倍,评论率 4.5 倍。在同样的发布平台、同样的账号权重下,本地内容全面胜出。这个发现推翻了项目最初的"资源瓶颈"假设,指向了一个更深层的结论:中小融媒唯一不可替代的资产,不是技术、不是资金、不是政策通道,而是本地用户对你的信任。所有策略的本质目标,都应该是构建和加深这种信任。

  • 本地内容篇均互动量 1,847 vs 非本地 514,差异 3.6 倍——同等平台同等账号权重
  • 抖音单篇爆发力最强(篇均互动 4,891),微信长尾效应最好,微博/客户端 ROI 最低
  • 推翻初始假设:资源约束是同一起跑线上的常量,真正拉开差距的变量是策略能力
  • 产品核心价值主张:不依赖更多资源,让现有资源发挥数倍效果

策略方案:三层飞轮模型

基于调研发现,设计了一套以"本地关系度"为核心的「内容-分发-增长」三层飞轮模型。第一层·内容策略层:本地选题关系度评估法(地理相关性/情感共鸣度/实用信息量/时效紧迫性 4 维度加权评分,S/A/B 三级选题管理)+ 内容价值四象限(政务传播/本地经济/地域文化/民生服务)+ 6 环节标准化生产流程。融媒特有创新——"语态翻译"机制:把"关于调整我市基本医疗保险住院报销标准的通知"翻译成"你的医保多报了 15%,算算能省多少"。每个政务选题必须产出"翻译版"给新媒体平台,不许一稿通发。第二层·分发策略层:"1+2+N"平台矩阵(微信主阵地 40% + 抖音增长引擎 35% + 补充覆盖 25%)+ 语态适配体系——同一条医保新闻,在微信回答"怎么回事+我该怎么办",在抖音回答"跟我有什么关系"(3 秒内没答出就划走),在社区群回答"在哪办+找谁问"。第三层·增长飞轮层:15 项核心指标体系(内容/分发/增长/信任四层)+ 数据回流闭环(发布→1h/24h/72h 采数→周五复盘会→选题金库+避坑清单+语态参考库→指导下周选题)。这个闭环不依赖任何技术工具——一张 Excel 表格、一次 30 分钟周会,就可以运转。

  • 选题关系度评估:4 维度加权打分,≥4.0 分全平台分发,<2.0 分建议放弃
  • 核心设计原则来自一线声音:"我们需要的是一个我们能干得动的东西"
  • "语态翻译"是融媒特有的创新——不是格式适配,是语态适配
  • 整个体系的最低门槛:1 人版生存标准(只做 1 个平台、每天 1 条本地信息、每月看 1 次数据)

落地与验证

方案在西青融媒中心试点。推动落地的关键三步:① 用他们自己过去 3 个月的内部数据做"本地 vs 非本地内容效果对比"——看到自己的数据后,团队从"怀疑"变成了"那我们试试"。② 拉拢早期支持者——找到团队里对新媒体最有热情的两位采编先试跑选题方法论两周,他们的正向反馈成为团队推广时的最好背书。③ 把门槛降到最低——最初复盘模板只保留 3 个核心指标,一张 Excel 表 5 分钟填完。过程中遇到了几个预期外的问题:抖音爆款和其他平台内容脱节(团队把所有好选题押在抖音上)、复盘会变成了批斗会(调整措辞和流程后化解)、数据追踪成了额外负担(改由运营岗集中采集)。这些"遇到问题→调整"的细节,反而比完美落地更能体现 PM 的实战能力。

  • 推动策略:用内部数据说服 > 引用外部案例;拉拢早期支持者 > 自上而下推行
  • 选题讨论会从"等上面分任务"变成了"这条选题关系度几分?"——行为转变才是真正的验证
  • 三次重要迭代:分发齐头并进 / 复盘去批斗化 / 数据采集减负

反思与收获

如果重来一次:① 先做小范围验证再写完整方案(最初两周写的 SOP 第一周就发现多处不适用);② 更早引入数据可视化(纯文字呈现数据没人看,换成柱状图后说服力天差地别);③ 对"组织阻力"准备不足——"把选题权还给数据"触碰了既有权力结构,应在方案中预设缓冲机制。这个项目最核心的能力沉淀:把西青个案抽象为一套可复制的三层方法论工具包(自评诊断手册 + 三大 SOP + 15 项指标体系),让任何一家中小融媒都能"拿来就用"。

  • 核心教训:先验证再写方案,用图表说话,预设组织阻力缓冲机制
  • 从 1 到 N:将西青经验产品化为三层交付物,适配 1 人/3 人/5 人三种团队规模
  • PM 核心能力:把学术研究方法论——问题定义→调研设计→数据分析→策略输出——转化为产品语言

简程 AI

AI 驱动的求职匹配工具。用语义理解替代关键词匹配,告诉你不只投哪个、还告诉你怎么改。

简程 AI 产品首页截图

核心洞察

「数据分析」和「数据驱动」在关键词层面不相关,但在实际能力上是同一件事——这是产品存在的理由

设计突破

改写建议从「建议强调 AI 经验」变成「第二段第一句加入你用 API 的具体案例」——可执行,不废话

产品哲学

AI 出错时用户应该看到什么?答案——用户永远不应该知道 AI 出错了。LLM 的不可靠性在产品层消化

匹配过程截图
匹配过程:上传简历后实时语义解析与岗位匹配
匹配结果页面
匹配结果:三维度独立评分 + 具体推荐理由
改写建议页面
改写建议:位置 + 内容 + 理由三元组结构

查看完整文档 →

展开项目详情 ▾

产品概述

简程 AI 是一个 AI 驱动的求职匹配工具。求职者海投简历,却不知道哪个岗位真正匹配、简历该改哪里。简程用语义理解替代关键词匹配——上传简历后 3 分钟内,告诉你最值得投的 5 个岗位,并给出具体到"哪句话该改成什么"的改写建议。不是"建议强化 AI 经验",而是"在第二段第一句加上你用 API 做过的具体事情,因为 JD 里这个词出现了三次"。不再盲投。

  • 核心功能:语义匹配 Top 5 + 位置+内容+理由三元组改写建议
  • 全流程不超过 3 分钟
  • 技术栈:Next.js 16 + React 19 + TypeScript + DeepSeek API + Prisma + Vercel

用户画像与场景

典型用户小林,应届硕士。做过数据分析、写过 SQL、实习用过 Python。手里有 30 个 JD,每次看都觉得自己差不多符合、又不完全符合,纠结很久。她上传简历,告诉系统想找"上海 AI 方向产品岗,20k+"。系统返回 5 个岗位——每个都有评分和具体理由:"你的 Gemini API 经验直接对应 JD 第二条,但你没有提到跨部门协作,JD 反复强调这个,建议补一段经历描述。"她照着改完,20 分钟就投递出去了。

  • 核心痛点:岗位推荐不精准、简历修改缺乏指导、决策完全依赖直觉
  • 现有方案的根本局限:主流招聘平台匹配逻辑是关键词覆盖,而非语义理解
  • "数据分析"和"数据驱动"在关键词层面不相关,但在实际能力上是同一件事——这是产品存在的理由

关键设计决策

四个关键决策定义了产品的差异化和核心体验。决策①:偏好输入用自然语言而非表单——用户在求职初期往往没有清晰的方向画像,一个输入框降低使用门槛,同时给系统足够匹配信号。决策②:评分体系三维度分开(技能匹配/经验匹配/方向匹配),不合并为综合分——用户可能技能高度匹配但方向不对口,综合分会掩盖这个差异。分开打分,让用户自己判断。决策③:改写建议必须是"位置+内容+理由"三元组结构——调试 Prompt 时最大的教训:早期模型输出方向性建议("建议强调 AI 经验"),用户知道要改但不知道改哪里,等于没有输出。强制三元组后,建议从"方向"变成了"可执行指令"。决策④:用户永远看不到技术报错——每类技术错误都翻译成用户语言("简历格式好像有点问题,换个 PDF 试试?"而非"JSON parse error")。

  • 三元组改写:从"建议强调 AI 经验"→"第二段第一句加入你用 API 的具体案例"
  • 产品哲学张力:具体性是核心竞争力,但越具体对用户简历素材要求越高——已知待观察
  • 错误状态全覆盖:LLM 的不可靠性在产品层消化,用户永远不知道 AI 出错了

AI 产品设计

把不可靠的 LLM 变成可靠的产品,核心做了两层工作。Prompt 工程层·三层约束:角色锚定("资深面试官"而非"职业规划顾问"——角色不同,输出完全不同);禁用词表(禁止"建议""努力""可以考虑""加强""提升"等模糊动词);格式约束(强制输出"位置+修改内容+理由"三元结构)+ Few-shot 范例嵌入。关键经验:Few-shot 范例比纯文字约束有效得多。嵌入 2-3 个标准输出范例后,模型输出的可执行性显著提升——模型是通过模仿来学习的。产品兜底层·三层防御:Prompt 层(Few-shot + 严格格式约束)→ 预处理层(API 响应统一清洗,去 Markdown 标记、补全残缺 JSON)→ 降级兜底(友好提示,保留用户输入数据)。输出质量验证:对同一份简历+JD 连续调用 API 10 次,约 80% 输出在核心匹配结论上保持一致,剩余 20% 差异主要在措辞层面。AI PM 最核心的命题就是:当 AI 出错时,用户应该看到什么?答案——用户永远不应该知道 AI 出错了。

  • 三层 Prompt 约束:角色锚定 + 禁用词表 + Few-shot 范例嵌入
  • 三层产品防御:Prompt 层 → 预处理层(API 响应清洗)→ 降级兜底
  • Few-shot > 纯文字约束:模型通过模仿学习,嵌入范例后输出可执行性显著提升
  • 10 次一致性测试:80% 输出在核心结论上一致,发现"用户研究"被误归类为"客服经验"的 Badcase

MVP 阶段的取舍

MVP 聚焦验证一个核心假设:用户与 JD 的差距主要是表达性遗漏(做过但没写),而非结构性缺失(根本没做过)。三元组优雅地解决了前者,对后者无能为力。MVP 用 30 条覆盖多行业的模拟岗位验证匹配算法——聚焦一个问题:AI 能否理解"数据分析"和"数据驱动"是同一件事?做了:PDF 简历上传与 AI 解析、语义匹配+三维度评分、三元组改写建议、浏览器本地历史记录、错误状态全覆盖。主动没做——以及为什么:账户体系(MVP 验证的是匹配+改写有没有用,跨会话需求 v2.0 再引入);真实岗位爬取(先验证匹配算法有效性,v2.0 接入 RAG 获取实时岗位);简历模板/美化(聚焦内容匹配,不分散精力);社交/分享(核心链路跑通前,分支功能都是干扰)。这些"不做"和"做了什么"同等重要——PM 的核心价值之一是判断什么不该加、什么时候该加。

  • 核心假设:用户与 JD 的差距主要是表达性遗漏(做过但没写),而非结构性缺失(根本没做过)
  • MVP 用模拟岗位验证匹配算法,聚焦一个问题:AI 能否理解语义等价?
  • 主动没做 5 项功能,每项都有明确理由和时间规划
  • 三元组解决了"不会写",对"没东西可写"无能为力——v2.0 接入真实岗位后优先验证此假设

衡量体系

构建了三级衡量体系,上线后逐级验证。行为层:核心漏斗——上传简历→查看匹配结果(≥70%)→查看改写建议(≥65%)→点击投递(>30%)。如果"匹配→查看改写"转化率 <50%,先优化入口而非跑 A/B 测试。体验层:改写建议采纳率 ≥50%(按建议类型拆分追踪——快速改进大概率可执行,强化点取决于是否真做过,重新定位可能完全无法执行。不拆分就看不出是"格式问题"还是"根本没东西可写")。结果层:7 日回访率 >25%,跨会话留存独立追踪。提出"匹配成功"的三层定义——行为✅+体验✅+结果✅ = 强匹配成功;行为✅+体验❌+留存❌ = 最危险的虚假繁荣(推荐"腾讯 PM"给任何人都被点,体现的是岗位吸引力而非匹配能力)。

  • 核心漏斗四步,每步有目标和触发阈值——连续 3 天 <50% 启动全链路排查
  • "匹配成功"≠投递点击率高:三层交叉验证防止虚假繁荣
  • 按建议类型拆分采纳率,区分"格式不好"和"不可执行"两种不同病因
  • 阶段跃迁数据化:MVP→v1.1 需 ≥200 会话,v1.1→v2.0 需 ≥500 会话