专利信息处理方法和装置、电子设备、计算机可读介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210836126.7 (22)申请日 2022.07.15 (71)申请人百度在线网络技术（北京）有限公司地址 100085 北京市海淀区上地十街10号百度大厦三层 (72)发明人王琳博　崔燕　朱景曦　黄岳　申宇林　师敏花　 (74)专利代理机构北京英赛嘉华知识产权代理有限责任公司 1 1204 专利代理师王达佐　马晓亚 (51)Int.Cl. G06Q 30/02(2012.01) (54)发明名称信息处理方法和装置、电子设备、计算机可读介质 (57)摘要本公开提供了一种信息处理方法和装置，涉及深度学习、自然语言处理技术领域。具体实现方案为：获取信息竞价平台的当前时刻的当前信息、历史信息以及当前信息和历史信息的指标信息；基于当前信息、历史信息以及指标信息，确定信息竞价平台的下一时刻的属性环境状态；基于属性环境状态、当前信息、历史信息以及指标信息，检测信息竞价平台在下一时刻是否需要调整目标属性的属性值；响应于信息竞价平台在下一时刻需要调整目标属性的属性值，将属性环境状态和预设的属性调整目标发送给智能体，以使智能体基于属性环境状态和属性调整目标，向信息竞价平台发送属性值调整策略。该实施方式提高了目标属性的属性值调整的可靠性。权利要求书4页说明书16页附图3页 CN 115170195 A 2022.10.11 CN 115170195 A 1.一种信息处理方法，所述方法包括：获取信息竞价平台的当前时刻的当前信息、历史信息以及所述当前信息和所述历史信息的指标信息；基于所述当前信息、所述历史信息以及所述指标信息，确定所述信息竞价平台的下一时刻的属性环境状态；基于所述属性环境状态、所述当前信息、所述历史信息以及所述指标信息，检测所述信息竞价平台在下一时刻是否需要调整目标属性的属性值；响应于所述信息竞价平台在下一时刻需要调整目标属性的属性值，将所述属性环境状态和预设的属性调整目标发送给智能体，以使所述智能体基于所述属性环境状态和所述属性调整目标，向所述信息竞价平台发送属性值调整策略，所述属性值调整策略用于调整不同信息的目标属性的属性值。 2.根据权利要求1所述的方法，在所述智能体向所述信息竞价平台发送所述属性值调整策略之前，所述方法还包括：基于所述属性环境状态和所述属性值调整策略，确定奖励值；向所述智能体发送所述奖励值，以使所述智能体检测是否向所述信息竞价平台发送所述属性值调整策略。 3.根据权利要求1所述的方法，在所述基于所述属性环境状态、所述当前信息、所述历史信息以及所述指标信息，检测所述信息竞价平台在下一时刻是否需要调整目标属性的属性值之前，所述方法还包括：将所述属性环境状态发送给训练完成的扰动分类模型，得到所述扰动控制模型输出的扰动分类结果，所述扰动分类模型用于判断属性环境状态是否增加扰动；响应于所述扰动分类结果为不需要加扰动，基于所述属性环境状态、所述当前信息、所述历史信息以及所述指标信息，检测所述信息竞价平台在下一时刻是否需要调整目标属性的属性值。 4.根据权利要求1 ‑3之一所述的方法，其中，所述基于所述当前信息、所述历史信息以及所述指标信息，确定所述信息竞价平台的下一时刻的属性环境状态，包括：基于所述当前信息、所述历史信息和所述指标信息，得到多种信息的向量集合，所述向量集合包括所述当前信息的向量、所述历史信息的向量和所述指标信息的向量；基于所述向量集合，得到下一时刻的评估指标；基于所述评估指标、所述向量集合以及预设的属性环境图谱，得到下一时刻的属性环境状态。 5.根据权利要求4所述的方法，其中，所述基于所述评估指标、所述向量集合以及预设的属性环境图谱，得到下一时刻的属性环境状态，包括: 基于所述向量集合和所述评估指标，确定下一时刻的目标属性编码；将所述下一时刻的目标属性编码与所述向量集合进行融合，得到下一时刻的属性环境状态；基于所述属性环境图谱，将所述下一时刻的属性环境状态中相关类目的属性环境状态进行关联。 6.根据权利要求1 ‑3之一所述的方法，其中，所述当前信息和所述历史信息为多模态信息，所述基于所述当前信息、所述历史信息以及所述指标信息，确定所述信息竞价平台的下权　利　要　求　书 1/4 页 2 CN 115170195 A 2一时刻的属性环境状态，包括：基于所述信息竞价平台中不同投放词的分布，对所述当前信息、所述历史信息以及所述指标信息进行分层采样，得到至少一层层信息和各层层信息相应的指标信息；将各层层信息和相应的指标信息分别输入训练完成的多模态融合模型，得到各层层信息的向量集合，所述多模态融合模型用于对多种模态信息进行向量计算，得到各种模态信息的向量；计算各层层信息的向量集合对应的评估指标；基于各层层信息的评估指标、各层层信息的向量集合以及预设的属性环境图谱，得到各层层信息的下一时刻的属性环境状态；组合所有层的层信息的下一时刻的属性环境状态，得到所述信息竞价平台的下一时刻的属性环境状态。 7.根据权利要求1所述的方法，其中，所述基于所述属性环境状态、所述当前信息、所述历史信息以及所述指标信息，检测所述信息竞价平台在下一时刻是否需要调整目标属性的属性值，包括：基于所述当前信息、所述历史信息以及所述指标信息，预测下一时刻的评估指标；将所述评估指标、所述属性环境状态输入已训练完成的调价判别模型，得到所述调价判断模型输出的是否调整目标属性的属性值的判别结果；基于所述判别结果，确定下一时刻是否需要调整目标属性的属性值。 8.根据权利要求1所述的方法，其中，所述属性值调整策略是从多个预置调整策略中选取的一个预置调整策略；所述预置调整策略包括以下至少一项：第一提价策略，用于针对所述信息竞价平台中展示次数大于预设次数且无消费的第一输入信息，在所述第一输入信息对应的目标属性的属性值中增加展示惩罚项；第一降价策略，用于针对所述信息竞价平台中展示等级小于预设等级值的第二输入信息，在所述第二输入信息对应的目标属性的属性值中增加压价项；第二提价策略，用于针对所述信息竞价平台中展示等级小于预设等级值且预定指标满足指标要求的第三输入信息，在所述第三输入信息对应的目标属性的属性值中增加上边界界限，以限制所述第三输入信息的目标属性的属性值；第二降价策略，用于针对所述信息竞价平台中收入规模大于预设规模值的第四输入信息，在所述第四输入信息对应的目标属性的属性值中增加收入奖励因子，以维持所述第一输入信息的输入规模。 9.一种信息处理装置，所述装置包括：获取单元，被配置成获取信息竞价平台的当前时刻的当前信息、历史信息以及所述当前信息和所述历史信息的指标信息；确定单元，被配置成基于所述当前信息、所述历史信息以及所述指标信息，确定所述信息竞价平台的下一时刻的属性环境状态；检测单元，被配置成基于所述属性环境状态、所述当前信息、所述历史信息以及所述指标信息，检测所述信息竞价平台在下一时刻是否需要调整目标属性的属性值；调整单元，被配置成响应于所述信息竞价平台在下一时刻需要调整目标属性的属性权　利　要　求　书 2/4 页 3 CN 115170195 A 3

专利 信息处理方法和装置、电子设备、计算机可读介质

专利信息处理方法和装置、电子设备、计算机可读介质