推荐系统中的用户行为建模综述【IJCAI'22论文阅读】

本文为IJCAI’22综述论文 _A Survey on User Behavior Modeling in Recommender Systems_ 阅读笔记。

问题定义

  • 用户行为建模(User Bevhavior Modeling, UBM)是推荐系统(Recommender System, RS)中的一个重要问题,其目标为根据用户信息、商品信息以及用户历史行为数据去预测用户对商品的兴趣:

其中:

  • 为用户集合,为商品集合
  • 分别为非行为用户特征(如年龄)、商品特征(如价格)、上下文特征(如工作日/周末),不在本文讨论范围内
  • 表示用户的历史行为集合,其元素为一个三元组,包含历史商品标识,时间戳,行为特征

UBM 工作分类

传统UBM

特点:用户历史行为集合用短序列(按时间排序)表示,且行为种类单一:

其中为从用户历史行为集合中提取的短行为序列,且长度有限。

常见方法:RNN-based; CNN-based; Attention-based

  • 讨论:相关研究主要关注于不同网络结构(RNN,CNN,Attention,MLP…)对于捕捉历史行为特征的作用,且不同网络结构各有优劣

长序列UBM

特点:将传统UBM中的用户历史行为序列拓展到长序列(至少级别),研究难点为长序列难以使用深度模型学习(遗忘问题)、噪声含量高,以及潜在计算瓶颈:

其中为从用户历史行为集合中提取的长行为序列。

常见方法:Memory-augmented: User Behavior Retrieval

  • Memory-augmented: 将从长序列中提取到的知识额外存储,如用户兴趣表征(可embedding化)
  • User Behavior Retrieval: 从长行为序列中检索与当前推荐目标最相关的那些行为,从而减少历史行为序列之长度,并且降噪

  • 讨论:memory-augemented方法的动机是通过引入额外参数来记忆历史行为序列信息。该方法虽然对于长序列建模很有效,但在现实场景中模型相当复杂且难以部署。相比之下,retrival-based方法效率更高,且更易于部署在大规模推荐系统中。然而此类方法不可避免地会损失部分行为信息。

多类型UBM

特点:同时考虑多种类型的用户行为(如购买,点击,etc.)对用户兴趣估计的影响:

其中为从用户历史行为集合中提取的多类别行为序列,每个元素为, 其中表示用户的行为类别。

行为的分类

多类型UBM的第一大挑战是用户行为的分类,目前学界缺乏统一定义。一般地,用户行为可以分为三大类:

  • 宏观行为:具有显式的交互行动的那些行为,例如点击、加入购物车、收藏、购买等。在线购物平台中可直接获取。
  • 微观行为:依赖于专家知识的,比宏观行为更加细粒度的行为。例如点击行为可以根据点击源的不同做进一步分类。然而这种分类法缺乏泛化性,难以推广到与场景无关的一般情况。
  • 来自不同领域或场景的行为:与场景相关联的行为,例如搜索场景中的查询操作以及推荐场景中的点击操作。此外,同名行为(如“观看”)在不同场景中的含义也不同,需要分别单独建模。

多行为融合

多行为UBM的第二大挑战是如何联合利用多种行为提升推荐效果。相关做法为late-fusion和early-fusion两种。

  • late-fusion:两阶段方法。第一阶段分别建模每种行为,第二阶段将第一阶段的建模结果融合
  • early-fusion:从一开始就将所有种类行为混合建模(所有行为放进一个混合行为序列里)

多行为预测

多行为UBM的第三大挑战是,有些行为本身需要在模型中被预测出来(笔者:由于这些行为在测试集中不可获取?)。

  • 常见做法:单独设置一个行为预测模型,与兴趣预测相互分离。优点:易于构建;缺点:行为预测模型缺乏与兴趣预测本身的联系,因此兴趣预测性能堪忧。

UBM + 辅助信息

除了上述UBM方法,相关研究者还注重于利用行为中丰富的辅助信息(如时间戳)增强推荐效果:

其中将辅助信息()与商品ID 融合,以获得商品的细粒度表征。的设计在这里工作中非常重要。

辅助信息源

辅助信息有三种来源:时间信息、商品属性,以及多模态信息。

  • 时间信息:时间戳、时间间隔,可用来排序或挖掘用户兴趣
  • 商品属性:如商品价格,影响用户行为从而影响兴趣
  • 多模态信息:如商品介绍文本、图片、视频,同上

辅助信息的利用

(笔者:基本思想为表征学习,即将辅助信息映射到语义向量,映射过程可训练,类似Transformer)。
相关做法略

研究展望

  • 更加深度的信息融合
  • 更加高速的学习算法
  • 更加可解释的用户表征
  • 更加先进的技术(如预训练)