专利 一种基于自学习表征聚类的推荐系统新颖度评估方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211330003.2 (22)申请日 2022.10.27 (71)申请人天翼电子商务有限公司地址 100037 北京市西城区阜成门外大街 31号4层429D (72)发明人傅剑文　韩弘炀　陈心童　章建森　周文彬　 (51)Int.Cl. G06Q 10/06(2012.01) G06K 9/62(2022.01) G06F 17/16(2006.01) G06Q 30/06(2012.01) (54)发明名称一种基于自学习表征聚类的推荐系统新颖度评估方法 (57)摘要本发明公开了一种基于自学习表征聚类的推荐系统新颖度评估方法，它涉及人工智能领域。本发明整体作为推荐系统的新颖度评估模块，其应用于推荐系统中，能有效的评估和监测推荐系统推荐结果的新颖性程度，当推荐结果出现新颖性不足时，能及时向推荐系统发出新颖性告警，使得推荐系统能及时发现新颖性不足的问题从而进行结果调整，进而能帮助提升用户浏览商品时的新颖性体验。权利要求书2页说明书4页附图1页 CN 115511378 A 2022.12.23 CN 115511378 A 1.一种基于自学习表征聚类的推荐系统新颖度评估方法，其特征在于，包括以下步骤： (1)、利用流技术对用户在某场景下同一个session中点击的物料序列SN＝{item1, item2,…,itemP}进行记录,N表示点击序列的数量， p表示序列中物料个数； (2)、对于已有物料库Sitem中每个物料生成一个物料与其属性的key ‑value映射表Smap； (3)、基于已有的物料库Sitem初始化生成2个物料表征矩阵Mitem和M'item，以及2个属性表征矩阵Mattr和M'attr； Mitem的维数为L*M， L表示物料的总个数， M表示表征向量的维度数，而 M'item的维数为M*L；矩阵Mattr的维数为P*J， P表示该属性的种类个数， J表示表征向量的维度数，而M'attr的维数为J*P；基于映射表Smap将Mitem和Mattr进行关联生成整体表征向量矩阵 Mitem|attr，整体表征向量矩阵的形状为L*(M+J)；初始化生成隐层向量矩阵M'item|attr，其尺寸为(M+J)*L； (4)、设计一种基于物料序列采用物料表征向量和属性表征向量的一体化自学习机制来学习出整体表征向量； (5)、基于表征向量创新的设计了一个新颖性的度量方法； (6)、上述步骤合起来称为推荐系统新颖度评估模块；推荐系统新颖度评估模块集成入推荐系统之中，每隔T时间间隔为每个用户计算过去T时间段内的新颖度评分，当新颖度评分低于阈值τ时则认为推荐系统的推荐结果新颖度不足，并实时向推荐系统发出新颖度不足告警；推荐系统在收到新颖度不足告警后，应及时对该用户的推荐结果进行调整来提升推荐结果的新颖度，从而提升用户浏览商品时的新颖性体验。 2.根据权利要求1所述的一种基于自学习表征聚类的推荐系统新颖度评估方法，其特征在于，所述的步骤(4)具体包括：在每个物料序列中，从头到尾把将每个物料itemi逐一设置为目标物料，并将当前的目标物料在其序列中前后距离小于d的每个物料定义为临近物料，目标物料分别与这些临近物料形成两两关系对；通过目标物料和临近物料的关系对进行自学习生成每个物料的隐式表征向量；具体步骤如下： (1)生成目标物料itemi与临近物料itemj的两两关系对； (2)为每个关系对随机选取全量物料库中但非itemi临近物料的k个物料，作为负样本物料； (3)从Mitem中获取当前目标物料、临近物料、负样本物料的物料表征向量，并将物料表征向量构建生成学习物料矩阵Zitem， Zitem的尺寸是(k+2)*M，并且矩阵的第一行为目标物料表征向量，第二行为对应的临近物料表征向量，剩余k行为负样本物料表征向量；基于映射表 Smap从Mattr构中获取其对应的属性表征向量，并构建生成学习属性矩阵Zattr， Zattr的尺寸是 (k+2)*J，并且矩阵的第一行也为目标物料表征向量，第二行也为对应的临近物料表征向量，剩余k行也为负样本物料表征向量；将Zitem和Zattr进行拼接，得到矩阵Zitem|attr＝row concat(Zitem,Zattr)；同时指定输入独热向量： Vin＝(1,0,. ..,0)，其维数为 k+2维； (4)类似的，从M'item中获取当前目标物料、临近物料、负样本物料的物料表征向量，并将物料表征向量构建生成学习物料矩阵Z'item， Z'item的尺寸是M*(k+2)，并且矩阵的第一列为目标物料表征向量，第二列为对应的临近物料表征向量，剩余k列为负样本物料表征向量；基于映射表Smap从M'attr构中获取其对应的属性表征向量，并构建生成学习属性矩阵Z'attr， Z'attr的尺寸是J*(k+2)，并且矩阵的第一列也为目标物料表征向量，第二列也为对应的临权　利　要　求　书 1/2 页 2 CN 115511378 A 2近物料表征向量，剩余k列也为负样本物料表征向量；将Z'item和Z'attr进行拼接，得到矩阵 Z'item|attr＝column concat(Zitem,Zattr)； (5)定义前向输出向量： Vout＝Vin·Zitem|attr·Z′item|attr+Vin·Zitem·Z′item+Vin·Zattr·Z′attr 同时定义向量Vtarget＝(0,1,...,0)，对所有物料序列中每对目标物料与临近物料计算损失函数：通过梯度下降进行参数迭代后， Mitem、 Mattr中的行向量即为物料和某属性的表征向量；梯度下降参数更新时，原矩阵Mitem、 Mattr、 M'item、 M'attr中对应的向量也会随着Zitem|attr、 Z'item|attr、 Zitem、 Z'item、 Zattr、 Z'attr的参数更新而同步更新； (6)最后针对每个物料，将其物料表征向量(vk_item∈Mitem)和对应的属性表征向量 (vk_attr∈Mattr)进行拼接后，得到每个物料最终的整体表征向量Vitem。 3.根据权利要求1所述的一种基于自学习表征聚类的推荐系统新颖度评估方法，其特征在于，所述的步骤(5)具体包括：对于每个物料的整体表征向量Vitem，使用聚类算法将物料分为K个类簇，这样属于同一个类簇中的物料其物料之间的相似度则较高，相似度高也表明其新颖度则较低；基于过去某一段时间，推荐系统给某一用户展示过的物料集Eitem，物料集Eitem的数量为N，物料集Eitem中每个聚类的物料集为Ci，定义如下新颖度计算公式： Num_Cluster(Eitem)表示物料集Eitem中包含有多少个聚类数量，而Num(Ci)则表示聚类Ci 中物料的数量；上述公式前半部分衡量聚类的整体覆盖率，后半部分则衡量每个聚类中的物料数量是否均衡； Score值的取值范围为[ 0,1]，值越高则代表新颖度越好，越低则代表新颖度越差。权　利　要　求　书 2/2 页 3 CN 115511378 A 3

专利 一种基于自学习表征聚类的推荐系统新颖度评估方法

专利一种基于自学习表征聚类的推荐系统新颖度评估方法