说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210666129.0 (22)申请日 2022.06.14 (71)申请人 厦门大学 地址 361000 福建省厦门市思明南路42 2号 (72)发明人 林元国 林凡 张志宏 张伟  游环宇 柳蕴轩 陈鸿  (74)专利代理 机构 厦门市精诚新创知识产权代 理有限公司 3 5218 专利代理师 赵薇 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/36(2019.01) G06N 3/08(2006.01) G06N 5/04(2006.01) (54)发明名称 一种慕课可解释推荐 方法、 终端设备及存储 介质 (57)摘要 本发明涉及一种慕课可解释 推荐方法、 终端 设备及存储介质, 该方法中包括: 根据学习者历 史选课记录中实体和实体之间的关系构建三元 组数据集; 基于三元组数据集构建知识图谱, 通 过TransE模型对知识图谱中的实体和关系进行 向量化表示, 其中, 分别通过粗粒度的课程表示 方法和细粒度的概念表示方法表示学习者和课 程; 构建基于自监督强化学习方法的学习路径推 理模型, 用于指导推荐智能体在知识图谱上从学 习者至目标课程的学习路径推理; 采用执行者 ‑ 评论家算法训练学习路径推理模 型; 通过训练后 的学习路径推理模型进行学习者至目标课程之 间的学习路径推理。 本发明不仅可以在知识图谱 中构建显性信息和隐性反馈, 而且还通过深度强 化学习进行慕 课可解释推荐。 权利要求书2页 说明书9页 附图2页 CN 115238169 A 2022.10.25 CN 115238169 A 1.一种慕课可解释推荐方法, 其特 征在于, 包括以下步骤: S1: 采集学习者的历史选课记录, 从历史选课记录中提取学习者、 课程、 课程概念和学 科分类作为实体, 并提取实体之间的关系, 基于实体和实体之间的关系构建三元组数据集; S2: 基于三元组数据集构建知识图谱, 通过TransE模型对知识图谱中的实体和关系进 行向量化表示, 其中, 将学习者的嵌入向量通过粗粒度的课程表示方法进 行表示, 将课程的 嵌入向量 通过细粒度的概念表示方法进行表示; S3: 构建基于自监督强化学习方法的学习路径推理模型, 用于指导推荐智能体在知识 图谱上从学习者至目标课程的学习路径推理; 学习路径推理模型包括执行者网络和路径判别器, 执行者网络首先生成路径, 然后路 径判别器将专家演示路径与生成的路径区分开来, 而 执行者网络试图通过模仿专家演示路 径来欺骗路径判别器; S4: 采用执行者 ‑评论家算法训练学习路径推理模型, 其中, 执行者网络根据评论家网 络的价值函数学习路径推理策略, 评论家网络利用时序差分方法来单步更新 价值函数; S5: 通过训练后的学习路径推理模型进行 学习者至目标课程之间的学习路径推理。 2.根据权利要求1所述的慕课可解释推荐方法, 其特征在于: 将学习者的嵌入向量通过 粗粒度的课程表示方法进行表示的方法为: 对学习者u的历史选课记录按时间顺序进行排 序后, 将学习者的嵌入向量表示为: 其中, 表示学习者u在t时刻选 修的课程, 1, …,t,…,tu表示从远至 近的时刻。 3.根据权利要求1所述的慕课可解释推荐方法, 其特征在于: 将课程的嵌入向量通过细 粒度的概念表示方法进行表示的方法为: 将课程的嵌入向量表示 为ct: ct={(k,w)| (ki,wj),n>i>0,j>0} 其中, n表示课程包含的课程概念的数量, i表示课程概念的序号, j表示课程概念包含 的词的序号, ki表示课程的第i个课程概念的嵌入向量, wj表示嵌入向量ki中第j个词的嵌入 向量, k表示课程中所有概念的嵌入向量, w表示课程中所有词的嵌入向量。 4.根据权利要求1所述的慕课可解释推荐方法, 其特征在于: 步骤S3中将路径推理问题 表述为马尔科夫决策过程, 智能体通过在知识图谱上执行多跳路径推理来为学习者推荐 学 习者至目标课程的学习路径; 在马尔科夫决策过程中设定初始状态为s0=, t时刻的状态为 根据状态st, 智能体按照策略执行相关动作 来预测实体et可行的输出边, 动作空间 其中ε表示实体集合, 表 示一个知识图谱; 通过终端收益Re,T衡量智能体是否生 成了一条从学习者u开始并以目标课 程 结束的多跳路径; 其中, u表示学习者, r表示关系, e表示实体, rt表示t时刻的关系向 量, et表示t时刻的实体向量, t={1,2, …,t‑1,t,t+1}, 表示收益 函数。 5.根据权利要求1所述的慕课可解释推荐方法, 其特征在于: 在马尔科夫 决策过程中通 过加权动作路径来保留有潜力的输出边, 路径中每条边的权 重设定为: 权 利 要 求 书 1/2 页 2 CN 115238169 A 2其中, 表示相对于三元组 的路径权重,V表示头部实体的向量 et与头部实体et与尾部实体 之间关系rt的关系向量rt之和, 表示尾部实体的向量 ‖. ‖表示L1范数。 6.根据权利要求1所述的慕课可解释推荐方法, 其特征在于: 专家演示路径的获取方法 为: 针对所有的学习者u和目标课程 基于加权动作 路径, 使用Dijkstra算法在加权图上 生成学习者u和目标课程 之间的最短路径, 得到一系列演示路径 从演示路径 中随机采样得到专 家演示路径。 7.根据权利要求1所述的慕课可解释推荐方法, 其特征在于: 路径判别器Dp(st,at)表示 关于状态st在t时刻的动作at, 具体定义 为: 其中, 为中间变量, 表示状态st的嵌入向量, 是在判别器Dp中动 作ap,t的嵌入向量, tanh( ·)表示双曲正切函数, σ( ·)表示logistic  sigmoid函数, 和 均为被学习的参数, da表示执行者网络中动作嵌入的维 度, ds表示状态嵌入的维度, dd表示路径判别器中动作嵌入的维度。 8.一种慕课可解释推荐终端设备, 其特征在于: 包括处理器、 存储器以及存储在所述存 储器中并在所述处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现如权 利要求1~7中任一所述方法的步骤。 9.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于: 所述计算机程序被处 理器执行时实现如权利要求1~7中任一所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115238169 A 3

.PDF文档 专利 一种慕课可解释推荐方法、终端设备及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种慕课可解释推荐方法、终端设备及存储介质 第 1 页 专利 一种慕课可解释推荐方法、终端设备及存储介质 第 2 页 专利 一种慕课可解释推荐方法、终端设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:55:00上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。