双层偏好建模

通过”历史行为被动信号 + 主动申报显式信号”两层叠加,构建比任何单层都更精准的用户兴趣画像。

简介

双层偏好建模是一种用户画像方法,将偏好信号分为两个独立层次采集并融合:第一层从用户的历史行为数据中被动提取(如阅读高亮、笔记、书评),第二层由用户主动填写个人信息和兴趣方向。两层信息互补,避免了单一来源的盲区。

与纯行为推荐(如协同过滤)或纯声明式画像相比,双层建模的核心优势在于覆盖时间维度的变化:历史记录反映过去的偏好,但人是会变的——你可能最近在研究新方向,之前没怎么读过这块的书,单靠历史数据推断不出来。主动填写的信息补的正是这个缺口。

关键信息

  • 类型:概念 / 方法论
  • 领域:用户画像 / 个性化推荐 / AI 应用
  • 相关概念:用户兴趣画像、协同过滤、内容推荐

核心特性

定义

双层偏好建模(Two-layer Preference Modeling)将用户偏好信号拆分为:

  1. 被动信号层:从用户已有的标注、笔记、高亮、书评中提取的行为偏好
  2. 主动信号层:用户通过结构化表单主动申报的职业背景、兴趣方向、阅读目的

两层信号的优先级关系为:被动行为 > 主动申报。当申报偏好与实际标注行为出现矛盾时,以行为数据为准,并在画像中注明差异。

核心组成

被动信号层的分析维度

  • 主题聚类:反复标注的领域、跨书持续关注点
  • 内容类型偏好:数据与案例 vs 概念框架 vs 操作策略 vs 人物叙事
  • 抽象层级:高层战略思维 vs 一线执行细节
  • 类比模式:跨行业类比 vs 单一领域深度挖掘
  • 数据敏感度:宏观市场数据 vs 微观运营指标(转化率、留存率、单位经济模型)
  • 行业细节敏感度:运作机制、业务流程、产业链结构
  • 业务节点关注:增长拐点、商业模式转型、关键产品决策、组织变革节点

主动信号层的采集内容

  • 职业背景与工作内容(2-5 句话)
  • 喜欢的书籍分类(按兴趣排序,标注兴趣程度)
  • 不感兴趣的内容类型(可选,用于降权)
  • 阅读目的(辅助投资决策 / 提升认知 / 内容创作素材等)

典型应用

  • 个性化阅读助手:基于双层画像对新书进行定制化内容提炼
  • 内容推荐系统:结合行为数据和显式偏好过滤信息流
  • 学习路径规划:根据历史学习记录和当前职业目标推荐下一步

缓存与增量更新

双层建模支持增量更新机制:

  • 偏好画像缓存到本地文件,记录上次分析时间和文件清单快照
  • 每次启动时自动检测文件夹变动,无变动则直接使用缓存
  • 有新内容时只处理增量部分,与原画像合并更新
  • 支持强制刷新指令(全量重算)和局部更新指令(仅更新申报部分)

不同素材中的观点

  • 2026-05-27-woshipm-personalized-ai-reading-assistant:文章详细描述了双层偏好建模的完整实现方案。被动层通过扫描 reading_resource/ 文件夹中的所有已读书籍提取黄色标注内容,分析主题聚类、内容类型偏好、抽象层级等 9 个维度。主动层通过 user_profile.md 结构化表单采集。两层叠在一起让 AI 读书时同时参考,“比任何一层单独工作都要准”。文章特别强调:申报偏好优先级低于标注行为,当两者矛盾时以行为为准。

实用信息

  • 快速上手:建一个 reading_resource/ 文件夹放历史阅读资料 + 写一份 user_profile.md 填职业和兴趣,让 AI 工具同时读取两份信息即可
  • 偏好维度参考:主题聚类、内容类型、抽象层级、数据敏感度、行业细节敏感度、业务节点关注、申报一致性验证、职业关联推断
  • 缓存机制:画像生成后缓存到本地文件,避免每次重跑;新书读完导出的 Markdown 存回文件夹后自动纳入下次分析

相关页面