西安交通大学
从学术研究到产品实践:将调研方法论转化为服务中小融媒的增长飞轮模型,用 AI 语义理解重构求职匹配体验。
项目 ↓
为 2000+ 中小县级融媒体中心设计的内容-分发-增长飞轮模型。不靠堆资源,靠让现有资源发挥数倍效果。
调研规模
127 份问卷 + 8 人深度访谈 + 260 篇内容量化分析
核心发现
本地内容互动量是非本地内容的 3.6 倍——同等平台、同等账号权重下的数倍差距
方法论验证
选题讨论会从「等上面分任务」变成了「这条选题关系度几分?」——团队行为转变是最真实的验证
2018 年以来,全国县级融媒体中心挂牌数量超 2585 个。但真正有能力建设"中央厨房"、获得专项财政支持的不足 20%。剩余 2000+ 个中小融媒中心面临典型的"资源鸿沟":年预算不足 300 万、无技术团队、全员不到 15 人。项目启动时,我带着一个从文献和政策文件里形成的假设——"中小融媒的核心瓶颈是资源不足,如果能帮他们争取更多资源,问题就能解决。"这个假设驱动了第一阶段的调研方向,但后来被数据和用户反馈彻底推翻。
我定义了三层竞品圈来系统扫描竞争格局。内层:天津市同城同级 4 家区级融媒横向对比——四家融媒在"资金"和"上级平台"这两个变量上基本一致(都接入津云,都依赖区级财政),但西青的篇均互动量是河西区的 2.2 倍。差异不在资源,在本地内容占比和原创率。中层:本地头部自媒体——优势在"快"和"近",但无公信力;融媒有官方信任背书却把它浪费在"公文式表达"上。外层:全国标杆。长兴靠机制创新而非堆资源,尤溪靠轻量化+内容聚焦做到抖音 200 万粉——两个标杆都不是靠钱砸出来的。
面向全国 127 个中小融媒中心发放问卷,对西青融媒中心进行 8 场半结构化深度访谈(覆盖管理层、采编人员、运营人员三个角色层),并完成 260 篇多平台内容量化分析。我抽象了四类核心用户画像:"迷茫的主任"——知道新媒体重要但不知道怎么做,预算有限不敢试错;"疲惫的记者"——一人兼多岗,选题全等上面分下来,做了好内容也得不到反馈;"焦虑的运营"——全凭直觉,各平台胡乱发,想学但没人带;"沉默的居民"——不是不看新闻,是不看和他们无关的新闻。一位一线采编的话让我印象深刻:"我们每天发的稿子,大部分是上面要求的。我知道这些没人看,但上面要发。我也不知道用户到底想看什么,因为我们不看数据,也没人看数据。"
对西青、和平、南开三家融媒的 260 篇内容进行多维度量化分析(内容属性、本地关联度、传播效果、时效性)。核心发现:本地内容在所有效果维度上碾压非本地内容——篇均互动量是非本地的 3.6 倍,互动率 3.7 倍,评论率 4.5 倍。在同样的发布平台、同样的账号权重下,本地内容全面胜出。这个发现推翻了项目最初的"资源瓶颈"假设,指向了一个更深层的结论:中小融媒唯一不可替代的资产,不是技术、不是资金、不是政策通道,而是本地用户对你的信任。所有策略的本质目标,都应该是构建和加深这种信任。
基于调研发现,设计了一套以"本地关系度"为核心的「内容-分发-增长」三层飞轮模型。第一层·内容策略层:本地选题关系度评估法(地理相关性/情感共鸣度/实用信息量/时效紧迫性 4 维度加权评分,S/A/B 三级选题管理)+ 内容价值四象限(政务传播/本地经济/地域文化/民生服务)+ 6 环节标准化生产流程。融媒特有创新——"语态翻译"机制:把"关于调整我市基本医疗保险住院报销标准的通知"翻译成"你的医保多报了 15%,算算能省多少"。每个政务选题必须产出"翻译版"给新媒体平台,不许一稿通发。第二层·分发策略层:"1+2+N"平台矩阵(微信主阵地 40% + 抖音增长引擎 35% + 补充覆盖 25%)+ 语态适配体系——同一条医保新闻,在微信回答"怎么回事+我该怎么办",在抖音回答"跟我有什么关系"(3 秒内没答出就划走),在社区群回答"在哪办+找谁问"。第三层·增长飞轮层:15 项核心指标体系(内容/分发/增长/信任四层)+ 数据回流闭环(发布→1h/24h/72h 采数→周五复盘会→选题金库+避坑清单+语态参考库→指导下周选题)。这个闭环不依赖任何技术工具——一张 Excel 表格、一次 30 分钟周会,就可以运转。
方案在西青融媒中心试点。推动落地的关键三步:① 用他们自己过去 3 个月的内部数据做"本地 vs 非本地内容效果对比"——看到自己的数据后,团队从"怀疑"变成了"那我们试试"。② 拉拢早期支持者——找到团队里对新媒体最有热情的两位采编先试跑选题方法论两周,他们的正向反馈成为团队推广时的最好背书。③ 把门槛降到最低——最初复盘模板只保留 3 个核心指标,一张 Excel 表 5 分钟填完。过程中遇到了几个预期外的问题:抖音爆款和其他平台内容脱节(团队把所有好选题押在抖音上)、复盘会变成了批斗会(调整措辞和流程后化解)、数据追踪成了额外负担(改由运营岗集中采集)。这些"遇到问题→调整"的细节,反而比完美落地更能体现 PM 的实战能力。
如果重来一次:① 先做小范围验证再写完整方案(最初两周写的 SOP 第一周就发现多处不适用);② 更早引入数据可视化(纯文字呈现数据没人看,换成柱状图后说服力天差地别);③ 对"组织阻力"准备不足——"把选题权还给数据"触碰了既有权力结构,应在方案中预设缓冲机制。这个项目最核心的能力沉淀:把西青个案抽象为一套可复制的三层方法论工具包(自评诊断手册 + 三大 SOP + 15 项指标体系),让任何一家中小融媒都能"拿来就用"。
AI 驱动的求职匹配工具。用语义理解替代关键词匹配,告诉你不只投哪个、还告诉你怎么改。
核心洞察
「数据分析」和「数据驱动」在关键词层面不相关,但在实际能力上是同一件事——这是产品存在的理由
设计突破
改写建议从「建议强调 AI 经验」变成「第二段第一句加入你用 API 的具体案例」——可执行,不废话
产品哲学
AI 出错时用户应该看到什么?答案——用户永远不应该知道 AI 出错了。LLM 的不可靠性在产品层消化
简程 AI 是一个 AI 驱动的求职匹配工具。求职者海投简历,却不知道哪个岗位真正匹配、简历该改哪里。简程用语义理解替代关键词匹配——上传简历后 3 分钟内,告诉你最值得投的 5 个岗位,并给出具体到"哪句话该改成什么"的改写建议。不是"建议强化 AI 经验",而是"在第二段第一句加上你用 API 做过的具体事情,因为 JD 里这个词出现了三次"。不再盲投。
典型用户小林,应届硕士。做过数据分析、写过 SQL、实习用过 Python。手里有 30 个 JD,每次看都觉得自己差不多符合、又不完全符合,纠结很久。她上传简历,告诉系统想找"上海 AI 方向产品岗,20k+"。系统返回 5 个岗位——每个都有评分和具体理由:"你的 Gemini API 经验直接对应 JD 第二条,但你没有提到跨部门协作,JD 反复强调这个,建议补一段经历描述。"她照着改完,20 分钟就投递出去了。
四个关键决策定义了产品的差异化和核心体验。决策①:偏好输入用自然语言而非表单——用户在求职初期往往没有清晰的方向画像,一个输入框降低使用门槛,同时给系统足够匹配信号。决策②:评分体系三维度分开(技能匹配/经验匹配/方向匹配),不合并为综合分——用户可能技能高度匹配但方向不对口,综合分会掩盖这个差异。分开打分,让用户自己判断。决策③:改写建议必须是"位置+内容+理由"三元组结构——调试 Prompt 时最大的教训:早期模型输出方向性建议("建议强调 AI 经验"),用户知道要改但不知道改哪里,等于没有输出。强制三元组后,建议从"方向"变成了"可执行指令"。决策④:用户永远看不到技术报错——每类技术错误都翻译成用户语言("简历格式好像有点问题,换个 PDF 试试?"而非"JSON parse error")。
把不可靠的 LLM 变成可靠的产品,核心做了两层工作。Prompt 工程层·三层约束:角色锚定("资深面试官"而非"职业规划顾问"——角色不同,输出完全不同);禁用词表(禁止"建议""努力""可以考虑""加强""提升"等模糊动词);格式约束(强制输出"位置+修改内容+理由"三元结构)+ Few-shot 范例嵌入。关键经验:Few-shot 范例比纯文字约束有效得多。嵌入 2-3 个标准输出范例后,模型输出的可执行性显著提升——模型是通过模仿来学习的。产品兜底层·三层防御:Prompt 层(Few-shot + 严格格式约束)→ 预处理层(API 响应统一清洗,去 Markdown 标记、补全残缺 JSON)→ 降级兜底(友好提示,保留用户输入数据)。输出质量验证:对同一份简历+JD 连续调用 API 10 次,约 80% 输出在核心匹配结论上保持一致,剩余 20% 差异主要在措辞层面。AI PM 最核心的命题就是:当 AI 出错时,用户应该看到什么?答案——用户永远不应该知道 AI 出错了。
MVP 聚焦验证一个核心假设:用户与 JD 的差距主要是表达性遗漏(做过但没写),而非结构性缺失(根本没做过)。三元组优雅地解决了前者,对后者无能为力。MVP 用 30 条覆盖多行业的模拟岗位验证匹配算法——聚焦一个问题:AI 能否理解"数据分析"和"数据驱动"是同一件事?做了:PDF 简历上传与 AI 解析、语义匹配+三维度评分、三元组改写建议、浏览器本地历史记录、错误状态全覆盖。主动没做——以及为什么:账户体系(MVP 验证的是匹配+改写有没有用,跨会话需求 v2.0 再引入);真实岗位爬取(先验证匹配算法有效性,v2.0 接入 RAG 获取实时岗位);简历模板/美化(聚焦内容匹配,不分散精力);社交/分享(核心链路跑通前,分支功能都是干扰)。这些"不做"和"做了什么"同等重要——PM 的核心价值之一是判断什么不该加、什么时候该加。
构建了三级衡量体系,上线后逐级验证。行为层:核心漏斗——上传简历→查看匹配结果(≥70%)→查看改写建议(≥65%)→点击投递(>30%)。如果"匹配→查看改写"转化率 <50%,先优化入口而非跑 A/B 测试。体验层:改写建议采纳率 ≥50%(按建议类型拆分追踪——快速改进大概率可执行,强化点取决于是否真做过,重新定位可能完全无法执行。不拆分就看不出是"格式问题"还是"根本没东西可写")。结果层:7 日回访率 >25%,跨会话留存独立追踪。提出"匹配成功"的三层定义——行为✅+体验✅+结果✅ = 强匹配成功;行为✅+体验❌+留存❌ = 最危险的虚假繁荣(推荐"腾讯 PM"给任何人都被点,体现的是岗位吸引力而非匹配能力)。