快捷搜索: 王者荣耀 脱发

阿里DIN模型(深度兴趣网络)详解及理解

目标:


模型产生原因:


核心思想:

**顺着DIN模型的思想,我们也可以进一步提出我们的优化方案: 1、加 e − t e^{-t} e−t的时间衰减系数

    购买过的物品是时间序列,因此可以在加上和上次购买时间间隔的衰减因子。比如1年前购买过笔记本电脑,1个月前购买过尿不湿,现在要推荐鼠标,你觉得1年前购买过笔记本电脑的权重还很高吗?显然不是,可以加个 e − t e^{-t} e−t的时间衰减系数, t t t为上次购买时间和今天的时间间隔,时间间隔越大,权重越小。

模型介绍:

模型算法设计

    输入 x x x : 模型的输入是个 K K K 维高维稀疏二值型向量,通常是多个group的特征进行拼接而成(group可以理解为一个方面的特征)。假设有 M M M 个group,每个group的特征 t i t_i ti 向量的维度为 K i K_i Ki , 特征向量 t i t_i ti每个元素取值为0或1,取值为1的个数大于1(废话,全0怎么训练?)。 输入类别示意图:

这样就搞清楚了模型的结构。 Loss损失函数,还是采用常规的二分类交叉熵损失函数。 DIN的模型结构图,与base model的主要区别就在于在用户行为特征上引入了局部激活单元(Activation Unit):

论文的算法改进

    论文的算法改进主要朝着 降低模型复杂度 降低计算或者存储 通过变形、改写公式,找到相近似的表达式。进而找到模型的简化版本。 这个其实做工程已经不是特别关心了。 这里贴出别人解释的照片即可。

参考资料

经验分享 程序员 微信小程序 职场和发展