本文为IJCAI’22综述论文 _A Survey on User Behavior Modeling in Recommender Systems_ 阅读笔记。
问题定义
- 用户行为建模(User Bevhavior Modeling, UBM)是推荐系统(Recommender System, RS)中的一个重要问题,其目标为根据用户信息、商品信息以及用户历史行为数据去预测用户对商品的兴趣:
其中:
为用户集合, 为商品集合 分别为非行为用户特征(如年龄)、商品特征(如价格)、上下文特征(如工作日/周末),不在本文讨论范围内 表示用户 的历史行为集合,其元素为一个三元组,包含历史商品标识 ,时间戳 ,行为特征 。
UBM 工作分类
传统UBM
特点:用户历史行为集合用短序列(按时间排序)表示,且行为种类单一:
其中
常见方法:RNN-based; CNN-based; Attention-based
- 讨论:相关研究主要关注于不同网络结构(RNN,CNN,Attention,MLP…)对于捕捉历史行为特征的作用,且不同网络结构各有优劣
长序列UBM
特点:将传统UBM中的用户历史行为序列拓展到长序列(至少
其中
常见方法:Memory-augmented: User Behavior Retrieval
- Memory-augmented: 将从长序列中提取到的知识额外存储,如用户兴趣表征(可embedding化)
User Behavior Retrieval: 从长行为序列中检索与当前推荐目标最相关的那些行为,从而减少历史行为序列之长度,并且降噪
讨论:memory-augemented方法的动机是通过引入额外参数来记忆历史行为序列信息。该方法虽然对于长序列建模很有效,但在现实场景中模型相当复杂且难以部署。相比之下,retrival-based方法效率更高,且更易于部署在大规模推荐系统中。然而此类方法不可避免地会损失部分行为信息。
多类型UBM
特点:同时考虑多种类型的用户行为(如购买,点击,etc.)对用户兴趣估计的影响:
其中
行为的分类
多类型UBM的第一大挑战是用户行为的分类,目前学界缺乏统一定义。一般地,用户行为可以分为三大类:
- 宏观行为:具有显式的交互行动的那些行为,例如点击、加入购物车、收藏、购买等。在线购物平台中可直接获取。
- 微观行为:依赖于专家知识的,比宏观行为更加细粒度的行为。例如点击行为可以根据点击源的不同做进一步分类。然而这种分类法缺乏泛化性,难以推广到与场景无关的一般情况。
- 来自不同领域或场景的行为:与场景相关联的行为,例如搜索场景中的查询操作以及推荐场景中的点击操作。此外,同名行为(如“观看”)在不同场景中的含义也不同,需要分别单独建模。
多行为融合
多行为UBM的第二大挑战是如何联合利用多种行为提升推荐效果。相关做法为late-fusion和early-fusion两种。
- late-fusion:两阶段方法。第一阶段分别建模每种行为,第二阶段将第一阶段的建模结果融合
- early-fusion:从一开始就将所有种类行为混合建模(所有行为放进一个混合行为序列里)
多行为预测
多行为UBM的第三大挑战是,有些行为本身需要在模型中被预测出来(笔者:由于这些行为在测试集中不可获取?)。
- 常见做法:单独设置一个行为预测模型,与兴趣预测相互分离。优点:易于构建;缺点:行为预测模型缺乏与兴趣预测本身的联系,因此兴趣预测性能堪忧。
UBM + 辅助信息
除了上述UBM方法,相关研究者还注重于利用行为中丰富的辅助信息(如时间戳)增强推荐效果:
其中
辅助信息源
辅助信息有三种来源:时间信息、商品属性,以及多模态信息。
- 时间信息:时间戳、时间间隔,可用来排序或挖掘用户兴趣
- 商品属性:如商品价格,影响用户行为从而影响兴趣
- 多模态信息:如商品介绍文本、图片、视频,同上
辅助信息的利用
(笔者:基本思想为表征学习,即将辅助信息映射到语义向量,映射过程可训练,类似Transformer)。
相关做法略
研究展望
- 更加深度的信息融合
- 更加高速的学习算法
- 更加可解释的用户表征
- 更加先进的技术(如预训练)