全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210836126.7 (22)申请日 2022.07.15 (71)申请人 百度在线网络技 术 (北京) 有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦三层 (72)发明人 王琳博 崔燕 朱景曦 黄岳  申宇林 师敏花  (74)专利代理 机构 北京英赛 嘉华知识产权代理 有限责任公司 1 1204 专利代理师 王达佐 马晓亚 (51)Int.Cl. G06Q 30/02(2012.01) (54)发明名称 信息处理方法和装置、 电子设备、 计算机可 读介质 (57)摘要 本公开提供了一种信息处理方法和装置, 涉 及深度学习、 自然语言处理技术领域。 具体实现 方案为: 获取信息竞价平台的当前时刻的当前信 息、 历史信息以及当前信息和历史信息的指标信 息; 基于当前信息、 历史信息以及指标信息, 确定 信息竞价平台的下一时刻的属性环 境状态; 基于 属性环境状态、 当前信息、 历史信息以及指标信 息, 检测信息竞价平台在下一时刻是否需要调整 目标属性的属性值; 响应于信息竞价平台在下一 时刻需要调整目标属性的属性值, 将属性环境状 态和预设的属性调整目标 发送给智能体, 以使智 能体基于属性环境状态和属性调整目标, 向信息 竞价平台发送属性值调整策略。 该 实施方式提高 了目标属性的属性 值调整的可靠性。 权利要求书4页 说明书16页 附图3页 CN 115170195 A 2022.10.11 CN 115170195 A 1.一种信息处 理方法, 所述方法包括: 获取信息竞价平台的当前时刻的当前信 息、 历史信 息以及所述当前信 息和所述历史信 息的指标信息; 基于所述当前信息、 所述历史信息以及所述指标信息, 确定所述信息竞价平台的下一 时刻的属性环境状态; 基于所述属性环境状态、 所述当前信 息、 所述历史信息以及所述指标信息, 检测所述信 息竞价平台在下一时刻是否需要调整目标属性的属性 值; 响应于所述信 息竞价平台在下一 时刻需要调整目标属性的属性值, 将所述属性环境状 态和预设的属性调整目标发送给智能体, 以使 所述智能体基于所述属性环境状态和所述属 性调整目标, 向所述信息竞价平台发送属 性值调整策略, 所述属 性值调整策略用于调整不 同信息的目标属性的属性 值。 2.根据权利要求1所述的方法, 在所述智能体向所述信息竞价平台发送所述属性值调 整策略之前, 所述方法还 包括: 基于所述属性环境状态和所述属性值调整策略, 确定奖励值; 向所述智能体发送所述 奖励值, 以使所述智能体 检测是否向所述信息竞 价平台发送所述属性 值调整策略。 3.根据权利要求1所述的方法, 在所述基于所述属性环境状态、 所述当前信息、 所述历 史信息以及所述指标信息, 检测所述信息竞价平台在下一时刻是否需要调整目标属性的属 性值之前, 所述方法还包括: 将所述属性环境状态发送给训练完成的扰动分类模 型, 得到所 述扰动控制模型输出的扰动分类结果, 所述扰动分类模型用于判断属性环境状态是否增加 扰动; 响应于所述扰动分类结果为不需要加扰动, 基于所述属性环境状态、 所述当前信 息、 所 述历史信息以及所述指标信息, 检测所述信息竞价平台在下一时刻是否需要调整目标属性 的属性值。 4.根据权利要求1 ‑3之一所述的方法, 其中, 所述基于所述当前信息、 所述历史信息以 及所述指标信息, 确定所述信息竞 价平台的下一时刻的属性环境状态, 包括: 基于所述当前信 息、 所述历史信息和所述指标信息, 得到多种信 息的向量集合, 所述向 量集合包括所述当前信息的向量、 所述历史信息的向量和所述指标信息的向量; 基于所述向量 集合, 得到下一时刻的评估指标; 基于所述评估指标、 所述向量集合以及预设的属性环境图谱, 得到下一时刻的属性环 境状态。 5.根据权利要求4所述的方法, 其中, 所述基于所述评估指标、 所述向量集合以及预设 的属性环境图谱, 得到下一时刻的属性环境状态, 包括: 基于所述向量 集合和所述评估指标, 确定下一时刻的目标属性编码; 将所述下一 时刻的目标属性编码与 所述向量集合进行融合, 得到下一 时刻的属性环境 状态; 基于所述属性环境图谱, 将所述下一 时刻的属性环境状态中相关类目的属性环境状态 进行关联。 6.根据权利要求1 ‑3之一所述的方法, 其中, 所述当前信 息和所述历史信息为多模态信 息, 所述基于所述当前信息、 所述历史信息以及所述指标信息, 确定所述信息竞价平台的下权 利 要 求 书 1/4 页 2 CN 115170195 A 2一时刻的属性环境状态, 包括: 基于所述信息竞价平台中不同投放词的分布, 对所述当前信息、 所述历史信息以及所 述指标信息进行分层采样, 得到 至少一层 层信息和各层 层信息相应的指标信息; 将各层层信 息和相应的指标信 息分别输入训练完成的多模态融合模型, 得到各层层信 息的向量集合, 所述多模态融合模型用于对多种模态信息进行向量计算, 得到各种模态信 息的向量; 计算各层 层信息的向量 集合对应的评估指标; 基于各层层信息的评估指标、 各层层信息的向量集合以及预设的属性环境图谱, 得到 各层层信息的下一时刻的属性环境状态; 组合所有层的层信 息的下一 时刻的属性环境状态, 得到所述信 息竞价平台的下一 时刻 的属性环境状态。 7.根据权利要求1所述的方法, 其中, 所述基于所述属性环境状态、 所述当前信 息、 所述 历史信息以及所述指标信息, 检测所述信息竞价平台在下一时刻是否需要调整目标属性的 属性值, 包括: 基于所述当前信息、 所述历史信息以及所述指标信息, 预测下一时刻的评估指标; 将所述评估指标、 所述属性环境状态输入已训练完成的调价判别模型, 得到所述调价 判断模型输出的是否调整目标属性的属性 值的判别结果; 基于所述判别结果, 确定下一时刻是否需要调整目标属性的属性 值。 8.根据权利要求1所述的方法, 其中, 所述属性值调整策略是从多个预置调 整策略中选 取的一个预置调整策略; 所述预置调整策略包括以下至少一项: 第一提价策略, 用于针对所述信 息竞价平台中展示 次数大于预设次数且无消费的第 一 输入信息, 在所述第一输入信息对应的目标属性的属性 值中增加展示惩罚项; 第一降价策略, 用于针对所述信 息竞价平台中展示等级小于预设等级值的第 二输入信 息, 在所述第二输入信息对应的目标属性的属性 值中增加压价项; 第二提价策略, 用于针对所述信 息竞价平台中展示等级小于预设等级值且预定指标满 足指标要求的第三输入信息, 在所述第三输入信息对应的目标属性的属性值中增加上边界 界限, 以限制所述第三输入信息的目标属性的属性 值; 第二降价策略, 用于针对所述信 息竞价平台中收入规模大于预设规模值的第四输入信 息, 在所述第四输入信息对应的目标属 性的属性值中增加收入奖励因子, 以维持所述第一 输入信息的输入规模。 9.一种信息处 理装置, 所述装置包括: 获取单元, 被配置成获取信息竞价平台的当前时刻的当前信息、 历史信息以及所述当 前信息和所述历史信息的指标信息; 确定单元, 被配置成基于所述当前信 息、 所述历史信息以及所述指标信息, 确定所述信 息竞价平台的下一时刻的属性环境状态; 检测单元, 被配置成基于所述属性环境状态、 所述当前信 息、 所述历史信息以及所述指 标信息, 检测所述信息竞 价平台在下一时刻是否需要调整目标属性的属性 值; 调整单元, 被配置成响应于所述信息竞价平台在下一时刻需要调整目标属性的属性权 利 要 求 书 2/4 页 3 CN 115170195 A 3

.PDF文档 专利 信息处理方法和装置、电子设备、计算机可读介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信息处理方法和装置、电子设备、计算机可读介质 第 1 页 专利 信息处理方法和装置、电子设备、计算机可读介质 第 2 页 专利 信息处理方法和装置、电子设备、计算机可读介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:30:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。