阿里DIN模型(深度兴趣网络)详解及理解
目标:
模型产生原因:
核心思想:
**顺着DIN模型的思想,我们也可以进一步提出我们的优化方案: 1、加 e − t e^{-t} e−t的时间衰减系数
-
购买过的物品是时间序列,因此可以在加上和上次购买时间间隔的衰减因子。比如1年前购买过笔记本电脑,1个月前购买过尿不湿,现在要推荐鼠标,你觉得1年前购买过笔记本电脑的权重还很高吗?显然不是,可以加个 e − t e^{-t} e−t的时间衰减系数, t t t为上次购买时间和今天的时间间隔,时间间隔越大,权重越小。
模型介绍:
模型算法设计
-
输入 x x x : 模型的输入是个 K K K 维高维稀疏二值型向量,通常是多个group的特征进行拼接而成(group可以理解为一个方面的特征)。假设有 M M M 个group,每个group的特征 t i t_i ti 向量的维度为 K i K_i Ki , 特征向量 t i t_i ti每个元素取值为0或1,取值为1的个数大于1(废话,全0怎么训练?)。 输入类别示意图:
这样就搞清楚了模型的结构。 Loss损失函数,还是采用常规的二分类交叉熵损失函数。 DIN的模型结构图,与base model的主要区别就在于在用户行为特征上引入了局部激活单元(Activation Unit):
论文的算法改进
-
论文的算法改进主要朝着 降低模型复杂度 降低计算或者存储 通过变形、改写公式,找到相近似的表达式。进而找到模型的简化版本。 这个其实做工程已经不是特别关心了。 这里贴出别人解释的照片即可。
参考资料
上一篇:
通过多线程提高代码的执行效率例子
下一篇:
【第二天】配置python环境