推荐系统中的用户行为建模综述【IJCAI'22论文阅读】

问题定义

用户行为建模（User Bevhavior Modeling, UBM）是推荐系统（Recommender System, RS）中的一个重要问题，其目标为根据用户信息、商品信息以及用户历史行为数据去预测用户对商品的兴趣：

$P(u,i) = F_{\Theta}^{UBM}(u,i,\mathcal{H}_u,f_u,f_i,f_c),\forall u\in\mathcal{U},i\in\mathcal{I}$

其中：

特点：用户历史行为集合用短序列（按时间排序）表示，且行为种类单一：

$P(u,i) = F_\Theta^{UBM}(u,i,\mathcal{H}_u^S),\forall u\in\mathcal{U},i\in\mathcal{I}$

其中为从用户历史行为集合中提取的短行为序列，且长度有限。

常见方法：RNN-based; CNN-based; Attention-based

特点：将传统UBM中的用户历史行为序列拓展到长序列（至少级别），研究难点为长序列难以使用深度模型学习（遗忘问题）、噪声含量高，以及潜在计算瓶颈：

$P(u,i) = F_\Theta^{UBM}(u,i,\mathcal{H}_u^L),\forall u\in\mathcal{U},i\in\mathcal{I}$

其中为从用户历史行为集合中提取的长行为序列。

常见方法：Memory-augmented: User Behavior Retrieval

Memory-augmented: 将从长序列中提取到的知识额外存储，如用户兴趣表征（可embedding化）
User Behavior Retrieval: 从长行为序列中检索与当前推荐目标最相关的那些行为，从而减少历史行为序列之长度，并且降噪
讨论：memory-augemented方法的动机是通过引入额外参数来记忆历史行为序列信息。该方法虽然对于长序列建模很有效，但在现实场景中模型相当复杂且难以部署。相比之下，retrival-based方法效率更高，且更易于部署在大规模推荐系统中。然而此类方法不可避免地会损失部分行为信息。

特点：同时考虑多种类型的用户行为（如购买，点击，etc.）对用户兴趣估计的影响：

$P(u,i) = F_\Theta^{UBM}(u,i,\mathcal{H}_u^{MB}),\forall u\in\mathcal{U},i\in\mathcal{I}$

其中为从用户历史行为集合中提取的多类别行为序列，每个元素为, 其中表示用户的行为类别。

多类型UBM的第一大挑战是用户行为的分类，目前学界缺乏统一定义。一般地，用户行为可以分为三大类：

宏观行为：具有显式的交互行动的那些行为，例如点击、加入购物车、收藏、购买等。在线购物平台中可直接获取。
微观行为：依赖于专家知识的，比宏观行为更加细粒度的行为。例如点击行为可以根据点击源的不同做进一步分类。然而这种分类法缺乏泛化性，难以推广到与场景无关的一般情况。
来自不同领域或场景的行为：与场景相关联的行为，例如搜索场景中的查询操作以及推荐场景中的点击操作。此外，同名行为（如“观看”）在不同场景中的含义也不同，需要分别单独建模。

多行为UBM的第二大挑战是如何联合利用多种行为提升推荐效果。相关做法为late-fusion和early-fusion两种。

多行为UBM的第三大挑战是，有些行为本身需要在模型中被预测出来（笔者：由于这些行为在测试集中不可获取？）。

除了上述UBM方法，相关研究者还注重于利用行为中丰富的辅助信息（如时间戳）增强推荐效果：

$P(u,i) = F_\Theta^{UBM}(u,i,M(\mathcal{H}_u)), \forall u\in\mathcal{U}, i\in\mathcal{I}$

其中将辅助信息()与商品ID 融合，以获得商品的细粒度表征。的设计在这里工作中非常重要。

辅助信息有三种来源：时间信息、商品属性，以及多模态信息。

（笔者：基本思想为表征学习，即将辅助信息映射到语义向量，映射过程可训练，类似Transformer）。
相关做法略