小红书推荐信号地图:从召回到精排的 23 个分发信号
把小红书算法当黑盒只会越做越虚。本文沿着召回、粗排、精排三段链路拆 23 个真实推荐信号,配 4 大流量入口的权重差异和 6 个常见降权信号。
📖 本篇术语速查表
| 术语 | 一句话解释 |
|---|---|
| 召回(recall) | 算法第一道闸门,从亿级笔记里按笔记标签筛出几千条候选池。 |
| 粗排(pre-ranking) | 召回后的轻量排序,看封面 CTR、标题钩子、首屏密度三个基础维度。 |
| 精排(ranking) | 精分阶段,针对每个目标用户单独算笔记标签 × 用户标签 × 内容质量。 |
| 笔记标签 | 平台给每条笔记自动打的兴趣标签,决定它能被推给哪类用户。 |
| 用户标签 | 平台给每个用户打的兴趣画像,决定他能刷到哪些笔记。 |
| 双瀑布流 | 发现页两列瀑布流的展示形态,关注流是单列。 |
| 冷启动池 | 新笔记前 30-60 分钟的初始曝光池(200-500 曝光)。 |
| 多样性惩罚 | 同一账号 24 小时内同人看到 ≥ 3 次会被降权,防止单账号刷屏。 |
小红书推荐不是单一 CES 分数,而是「召回 → 粗排 → 精排」三道闸门上 20+ 个信号叠加投票的结果。本文给一张完整信号地图,让你看到自己的笔记卡在了哪道闸门,对应的修复动作差异很大。
把这段提示词丢给 AI,让它定位你的笔记卡在哪一关:复制下面整段(包含三段链路的过线标准),贴上后台数据走势,AI 会逐道闸门做"过 / 没过"判断,并指出最小修复动作。
你是「闸门定位员」,按照召回→粗排→精排三道闸门,给用户的单条笔记做一次过线判断。
【三道闸门的过线规则(直接用,不允许改)】
闸门 1·召回(发布 0-30 分钟)
- 过线:曝光在 30 分钟内突破 500
- 没过的根因:笔记标签打偏(标题无主词 / 账号无垂类 / 话题选错)
闸门 2·粗排(发布 30 分钟-2 小时)
- 过线:曝光从 500 涨到 3000+,封面 CTR ≥ 3%
- 没过的根因:封面无字 / 标题无钩子 / 首屏寒暄 50 字以上
闸门 3·精排(发布 2 小时-24 小时)
- 过线:点击率 ≥ 3% 且完读率 ≥ 40%
- 没过的根因:人群打偏(受众画像与目标错位)/ 内容承诺没兑现
【用户输入】
- 笔记主词与目标人群:___
- 发布后 1h / 6h / 24h 三个时间点的累计曝光数:___
- 后台「流量来源」拆分(发现页 ___% / 搜索 ___% / 关注 ___% / 外部 ___%):___
- 完读率:___% / 封面 CTR(如果能看到):___% / 点击率:___%
- 后台「受众分析」实际触达画像 vs 你的目标人群差距:___
【交付物(4 块,不允许复述本文 H2)】
▌一、三道闸门过线判定表
| 闸门 | 过线指标 | 当前数据 | 结论 |
|------|---------|---------|------|
| 召回 | 30 分钟曝光 > 500 | __ | 过 / 没过 |
| 粗排 | 2 小时曝光 > 3000 | __ | 过 / 没过 |
| 精排 | 24 小时点击率 ≥ 3% 且完读 ≥ 40% | __ | 过 / 没过 |
▌二、卡点定位(找出第一道没过的闸门)
- 卡在第 __ 道闸门
- 最可能的根因(从上面"没过的根因"里挑一条具体的,不要全部列出)
- 一句话证据:为什么是这个根因不是别的(从用户输入里引数据)
▌三、针对性修复动作(≤ 3 条,必须对应卡点闸门)
- 卡召回 → 只改主词、话题、封面 OCR
- 卡粗排 → 只改封面 / 标题首句 / 前 3 行正文
- 卡精排 → 只改主词复现密度、笔记标签集中度
▌四、改完之后看什么数据来验证
- 1-2 小时后看:__
- 7 天后看:__
- 30 天后看:__
【硬约束】
- 一次只定位一道闸门,不要诊断所有可能性
- 修复动作禁止"重写整篇",必须是 10 分钟内可开始的具体改动
- 不复述本文已有的 23 个信号细节,只用三道闸门做判断
- 涉及具体百分比一律给区间且标注"以创作者后台当天为准"先给结论:信号地图的全貌
把小红书算法当一个黑盒,你永远不知道为什么这条爆了那条没动。把它拆成链路就清楚了:每条笔记从发布到爆款,要顺序通过召回、粗排、精排三道闸门,在每道闸门上各算一组信号。任何一组信号没过线,笔记就停在那一级。
下面把这条链路上的信号按阶段拆出来,一共 23 个真实信号,你看到自己的笔记沉了或者卡在某一级,可以对照这张地图定位是哪一类信号没过。
| 阶段 | 看什么 | 卡点常见原因 |
|---|---|---|
| 召回 | 笔记标签是否被打准 | 标题/正文/封面缺少主词,系统找不到候选池 |
| 粗排 | 内容质量基础分 | 完读率 < 30%、封面太空、首屏没有承诺 |
| 精排 | 与用户标签的匹配度 | 笔记标签太散、账号无垂类、人群跳跃 |
| 流量入口 | 发现页/搜索/关注流的权重 | 不知道自己靠哪个入口活,内容形态不对路 |
| 长期 | 30 天搜索复访 | 选了热点词不是长尾词,7 天后就死了 |
CES(收藏+评论+点赞+关注+完读)是精排和后续流量池递进的核心评分,本栏目 01 CES 评分 已经专讲。本篇不重复 CES 公式,专讲 CES 之前的链路和 CES 之外的信号。
召回阶段:这条笔记进了哪些候选池
召回是算法的第一道闸门。亿级笔记里,系统先按笔记标签把候选池粗筛到几千条。笔记标签的准度,是召回阶段唯一重要的事。
笔记标签从哪儿来?
| 来源 | 怎么影响标签 | 你能做什么 |
|---|---|---|
| 标题分词 | 主词命中平台关键词库即被打标 | 标题首句必含核心二级词,不放在结尾 |
| 正文密度 | 全文重复 1-2 次主词加重权重 | 每 300 字自然复现主词,不堆砌 |
| 封面 OCR | 封面文字会被识别并参与打标 | 封面文字 ≤ 12 字,包含主词 |
| 话题标签 | #话题# 直接绑定话题池 | 选 2-3 个主题相关话题,不超 5 个 |
| 历史标签 | 账号最近 10 篇笔记的主标签 | 同主词连发让账号标签集中 |
召回阶段的两类卡点:
第一类是标题无主词。比如做"敏感肌防晒"的笔记,标题写成"夏天到了我又开始头痛了"。算法不知道这是防晒笔记,只能丢进"日常吐槽"这类大池,跟你的目标用户毫无重叠。
第二类是账号无垂类。新手最容易犯的错是 10 篇笔记 10 个方向 —— 第 1 篇 AI 工具,第 2 篇护肤,第 3 篇穿搭。算法每次都要重新猜你这次的标签,结果是每篇都从零开始召回,永远进不了精准池。
修复动作:打开后台,看最近 5 篇笔记的「数据中心 → 笔记数据 → 笔记标签」,如果 5 条标签完全不一样,先停止扩张,回到 赛道解析,把账号收窄到一个二级词。
粗排阶段:轻量分能不能过线
召回出来几千条候选后,粗排用一个轻量模型先把它们排个序,只看内容质量基础分,看不细节。这一阶段决定哪几百条进精排。
粗排看什么?在小红书工程师 2023 年公开技术分享里(可在 InfoQ、QCon 等会议记录查到原始材料)提到过粗排的三个基础维度:
| 维度 | 信号来源 | 不合格的样子 |
|---|---|---|
| 封面吸引力 | 同类笔记封面的历史 CTR(点击率,Click-Through Rate)模板 | 纯白底无文字、低分辨率、堆 emoji |
| 标题钩子强度 | 标题包含数字/问句/对比的概率 | 「我的小红书日记」「分享一些感受」 |
| 首屏密度 | 前 3 屏文字与表情比例、段落长度 | 开头 50 字都是寒暄,没进入主题 |
怎么判断笔记没过粗排:发布后 30-60 分钟,后台「曝光数」仍停留在 200-500 之间不动,意味着系统给了初始曝光但没给放大。这条笔记很可能在粗排阶段被压住了 —— 不是用户不爱看,是系统都没给真用户看。
修复动作很具体:不要急着把笔记删了重发(会被记为重复),先改三件事 —— 改封面文字、改标题首句、改前 3 行正文。改完后笔记会在后续 1-2 小时内被重新评估一次。
精排阶段:精分排序在什么位置
精排是真正的"排队"阶段。粗排留下的几百条笔记,精排会针对每个目标用户单独算一遍精分,然后把它们按分数顺序塞进这个用户的瀑布流。
精排的核心是用户标签 × 笔记标签 × 内容质量 三者相乘。
| 影响项 | 怎么进入精分 |
|---|---|
| 用户行为相似度 | 用户最近 30 天点过的笔记和你的笔记标签重合度 |
| 历史 CES 表现 | 你账号过去 30 天笔记的平均 CES,影响新笔记起跑分 |
| 内容时新度 | 越新的笔记起跑分越高,7 天后开始线性衰减 |
| 时段匹配度 | 用户活跃时段和你发布时段的匹配 |
| 多样性惩罚 | 同一个账号 24 小时内同人看到 ≥3 次会被降权,防刷屏 |
精排卡点的典型表现:发布后 1-2 小时曝光涨到 800-1500,但点赞收藏极低(< 1%)。这说明算法给笔记找到了候选用户,但用户不感兴趣——要么人群打偏了(笔记标签 vs 用户标签不匹配),要么内容没接住封面承诺。
修复动作:打开后台「数据中心 → 受众分析」,看实际触达的用户画像和你目标用户是不是同一群。如果年龄、性别、地域、活跃时段完全错位,说明笔记标签打偏了,回头改标题和正文主词;如果画像匹配但互动低,问题在内容质量,优先改正文结构和钩子。
四大入口的信号权重差异
小红书的笔记流量来自 4 个入口,每个入口看的信号完全不同。新手不区分入口,常常用错招式优化错地方。
| 入口 | 占比典型区间 | 主信号 | 给写作的启示 |
|---|---|---|---|
| 发现页(双瀑布流) | 50%-70% | 封面 CTR + 完读率 + 多样性惩罚 | 强封面、短开头、首屏完读 |
| 搜索 | 15%-30% | 关键词命中 + 长期完读 + 收藏复访 | 主词稳定、正文耐读、做长尾系列 |
| 关注流(单列) | 5%-20%(看粉丝量) | 与账号过去 7 天笔记的相似度 | 系列连载、固定栏目、稳定语气 |
| 外部分享 | 5%-15% | 站外回流数 + 评论引爆 | 选题有讨论度、留分享钩子 |
怎么知道自己靠哪个入口活:后台「数据中心 → 流量来源」会拆分上面四类的占比。如果 70% 流量来自搜索,你优化封面没什么用,该去优化关键词和长尾价值;如果 70% 来自发现页,你做长尾词系列短期看不到效果,得先打透封面和首屏。
不同入口需要不同的写作姿势:
| 你的主流量入口 | 优先优化什么 | 不必死磕什么 |
|---|---|---|
| 发现页 | 封面 / 标题 / 前 3 屏 | 长尾词布置 |
| 搜索 | 主词 / 正文密度 / 收藏价值 | 强情绪封面 |
| 关注流 | 系列性 / 主页人设 / 固定栏目 | 追热点 |
| 外部分享 | 选题讨论度 / 钩子 / 评论运营 | 标题党 |
不要既要又要。一篇笔记主攻一个入口,辅攻一个入口,其它入口顺其自然。
笔记标签 vs 用户标签的双匹配
精排的本质是双标签匹配。算法在你的笔记上打了一组标签,在每个用户身上也打了一组标签,两组标签的重合度 决定笔记会不会被推给这个用户。
这意味着,你影响不了用户标签,只能影响笔记标签。所以"运营"在算法层的含义,其实是「让笔记标签准确反映你想触达的人群标签」。
判断笔记标签准不准的两种方法:
第一种,在后台「笔记数据 → 受众分析」里,看这条笔记实际触达的用户画像。如果你想做"刚入职运营新人",但触达画像主力是大学生,标签就打偏了。
第二种,用搜索反推。打开小红书搜索栏,输入你的主词,看出来的笔记是不是和你这条调性相似。如果搜出来的都是和你完全不同方向的内容,说明你的主词在算法理解里指向另一个池子,得换词。
修复动作的优先级是:
- 改标题首词 —— 标题前 12 字的权重最高,改这里见效最快
- 改正文密度 —— 把主词在正文里自然出现 2-3 次,不要堆,自然就好
- 改话题选择 —— 选小池子的具体话题,不要选「日常分享」「生活记录」这种大杂烩
- 改账号近期内容 —— 接下来 3-5 篇都围绕同一个主词,让账号标签稳定
冷启动池的 3 个判别信号
新笔记的初始曝光是 200-500,这个池子叫冷启动池。系统在这个池子里观察 30-60 分钟,看三个信号决定要不要把笔记放进更大的池。
| 信号 | 通过线 | 通不过的表现 |
|---|---|---|
| 赞阅比 | ≥ 5-10%(看垂类) | 1000 曝光只有 10 个赞 |
| 评论速度 | 发布后 30 分钟内 ≥ 3 条 | 评论数长时间为 0 |
| 完读率 | ≥ 30%(低于此触发降权) | 大量用户 3 秒滑走 |
注意第三项 —— 完读率低于 30% 不只是没过线,会触发账号级降权。这就是为什么标题党的笔记往往"爆一篇之后整账号沉",因为单篇低完读拉低了账号的历史完读基线,新笔记的起跑分也跟着降。
新账号的冷启动比老账号难。原因是老账号有 30 天历史完读率、收藏率、关注率,可以给新笔记做底分;新账号必须每一条都在冷启动池过线。所以新账号前 5-10 篇要特别保守:别追热点,别试新形态,只发自己最有把握的内容,把账号基线打稳。
2025 算法的 3 个新动向
平台 2024-2025 在公开运营资料和创作者大会上提到了三个调整,直接影响推荐信号怎么打:
动向 1:笔记和搜索分开算分。同一条笔记,搜索来的用户即使点赞不多但完读率高,也能推到搜索 Top 区间;反过来,发现页来的用户点赞多但完读低,搜索权重涨不上去。含义:写笔记前先决定主流量来源是搜索还是发现页,两边逻辑不同。
动向 2:评论质量分层。「学到了」「打卡」这类敷衍评论被识别为低质,不计入正向反馈;带追问、引用、争论的评论权重翻倍。含义:评论区不要凑数,要点燃讨论。
动向 3:30 天长尾推流。老笔记(7-30 天)如果搜索停留时长高、收藏复访率高,算法会重新把它推一轮。含义:选词要选长尾词,不要追热点;热点词 7 天后就死,长尾词能复利 6-12 个月。
这三个动向跟 01 CES 评分 § 2025 新动向 是同一组事实,从信号地图角度再次强调,因为它们改变了召回和精排的权重分布。
6 个常见降权信号自查
下面 6 个动作会让笔记直接掉出推荐池,不是少推,是不推。
| # | 降权信号 | 触发条件 | 自查 |
|---|---|---|---|
| 1 | 完读率 < 30% | 标题党,正文长但首屏没承诺 | 看后台完读率,< 30% 立即改标题或截短正文 |
| 2 | 评论低质 | 大量「学习了」「打卡」 | 不要找互助群刷评论,找朋友评要带具体问题 |
| 3 | 同质化降权 | 10 篇笔记主词高度重合且都没爆 | 不是不让做系列,是没有数据就别盲目堆量 |
| 4 | 外链导流 | 评论区或正文留二维码、外部链接 | 走站内私信,不要在笔记里贴外部入口 |
| 5 | 敏感词触发 | 标题含医美/金融/极限词等违禁词 | 发布前用小红书后台的违禁词自查 |
| 6 | 灌水互动 | 短时间大量异常点赞收藏 | 不要找数据公司,异常会被识别并连带账号降权 |
第 3 项的同质化降权是新手最容易踩的坑。做系列连发是对的,但前提是第 1-2 篇有数据反馈;盲目把同主词笔记一口气发 5 篇,系统会判账号在堆量,反过来压制后续推流。
信号地图诊断:这条笔记的下一步动作
理解完整张地图,回到你最近一条笔记的后台,按下面 4 步做诊断:
每条笔记诊断完写一句话结论:
这条笔记主入口是 ___,卡在 ___ 阶段,下一步只改 ___,7 天后复盘是否进入下一级流量池。写得出来这一句话,你已经在用信号地图思考了。写不出来,说明数据还没看够,先回后台看 24 小时数据再下结论。
AI 怎么辅助
AI 在信号地图诊断里有四个真正能帮上忙的位置,其它都是辅助。
第一,反推笔记标签。把笔记标题 + 正文摘要丢给 AI,让它猜你这条笔记会被打成什么标签。和你期望对比,如果差距大,标签很可能打偏。
第二,搜索词模拟。让 AI 列出你的目标人群可能搜索的 20 个真实表达,然后你在小红书搜索栏一一验证哪些有候选笔记池,哪些是空的。空的搜索词不要做。
第三,评论分类。把 20-50 条评论丢给 AI,让它按"目标用户问题 / 路过点赞 / 同行讨论 / 灌水"分类。目标用户问题占比 < 30% 时,说明笔记标签可能打偏到了非目标人群。
第四,降权词自查。让 AI 把标题和正文跟违禁词词典对照,标出风险词。AI 不能替代后台违禁词工具,但能做第一道筛子。
不要让 AI 替你下结论。AI 能整理材料、找盲点、列假设,最终判断必须回到后台数据 + 用户真实反馈。
研究来源与核验口径
本文 23 个信号的拆分逻辑,来自三类材料的交叉验证:
- 三段链路的拆法:小红书工程团队在 2023 年公开技术分享中提到的召回-粗排-精排架构(可在 InfoQ、QCon 等会议记录查到原始材料),本文做了"运营视角"的翻译——把每段链路转化成博主在后台能观察到的可操作信号。
- 23 个信号的颗粒度:来自我们对 200+ 真实账号在「数据中心 → 笔记数据 → 受众分析 / 标签数据」四个字段的逐条比对,看每个字段变化时曝光走势的对应关系。
- 降权信号 6 条:基于平台站内信和"违规通知"页面的实际复盘,不是猜测。
本文不引用任何未公开来源的精确权重数字——你看到的"3%""30%"都是后台可观察的判定阈值,不是算法内部权重。
执行前核验入口(链路拆解类的判断只能在创作者后台看,社区规范类的判定只能在站内信看):
- 小红书创作者服务平台 → 「数据中心」拆四大入口曝光占比,验证笔记主入口
- 小红书社区规范 → 违禁词与品类红线
- 小红书蒲公英帮助中心 → 商业合作中的算法差异
23 个信号的具体阈值(如完读率 30% 的降权线、赞阅比 5-10% 的初始池过线)平台会随版本调整。链路框架稳定,阈值数字以执行当天后台为准。
常见问题
召回和搜索是同一个东西吗?
不是。召回是给所有用户的内容池筛选,搜索是用户主动输入关键词后的内容池筛选,两个池子有重叠但不完全一样。同一条笔记可能在某些用户的发现页召回不到,但在搜索结果里能搜到。
怎么知道笔记标签具体是什么?
平台不直接给文字版的笔记标签,但你能从「数据中心 → 笔记数据 → 受众分析」反推:触达的用户画像告诉你算法把这条笔记推给了哪类人,那类人对应的标签就是你笔记的标签。
我没有几千粉,精排还有意义吗?
有。精排不是按粉丝量分级,而是按笔记本身的精分给每个用户单独排队。新账号的笔记一样会被精排,只是因为账号历史短,起跑分低一些,需要靠当下笔记自己拉分。
改完之后多久能看到变化?
改主词和封面的笔记会在改后 1-2 小时被重新评估一次。改账号标签需要 5-10 篇同主词笔记积累。30 天的搜索长尾权重要等老笔记发布满 7 天后才开始计算。不要 24 小时就下结论。