专利一种对话生成模型的训练以及对话生成方法、装置及设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210829680.2 (22)申请日 2022.07.15 (71)申请人北京聆心智能科技有限公司地址 100083 北京市海淀区成府路28号1 1 层4-1106 (72)发明人彭立彪　郑银河　黄民烈　 (74)专利代理机构北京墨丘知识产权代理事务所(普通合伙) 11878 专利代理师唐忠仙 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) (54)发明名称一种对话生成模型的训练以及对话生成方法、装置及设备 (57)摘要本发明公开了一种对话生成模型的训练以及对话生成方法、装置及设备，涉及数据处理技术领域，其中，所述对话生成模型的训练方法包括：获取第一对话集与第二对话集，其中，所述第一对话集中的每组对话包括话术及该话术的回话话术，每组对话中的话术包括对话触发标签，每组对话中的回话话术包括回话标签，所述第二对话集中的对话不带有标签；根据所述第一对话集，预测所述第二对话集中的每组对话对应的标签，得到第三对话集；将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型，以得到对话生成模型。通过上述方式，本发明提高了对话生成模型的对话效果。权利要求书2页说明书8页附图5页 CN 114896385 A 2022.08.12 CN 114896385 A 1.一种对话生成模型的训练方法，其特征在于，所述方法包括：获取第一对话集与第二对话集，其中，所述第一对话集中的每组对话包括话术及该话术的回话话术，每组对话中的话术包括对话触发标签，每组对话中的回话话术包括回话标签，所述第二对话集中的对话不带有标签；根据所述第一对话集，预测所述第二对话集中的每组对话对应的标签，得到第三对话集；将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型，以得到对话生成模型。 2.根据权利要求1所述的对话生成模型的训练方法，其特征在于，所述第二对话集中的对话数量大于所述第一对话集中的对话数量。 3.根据权利要求1所述的对话生成模型的训练方法，其特征在于，根据所述第一对话集，预测所述第二对话集中的每组对话对应的标签，得到第三对话集，包括：使用所述第一对话集训练待训练的策略分类器，得到策略分类器；调用所述策略分类器根据所述第一对话集为所述第二对话集中每组对话添加标签，以得到所述第三对话集。 4.根据权利要求1所述的对话生成模型的训练方法，其特征在于，在得到第三对话集之后，还包括：使用所述训练样本训练待训练的标签预测模型，得到标签预测模型，其中，所述标签预测模型用于接收触发标签，并在接收触发标签后预测对应的回话标签。 5.根据权利要求1所述的对话生成模型的训练方法，其特征在于，将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型，以得到对话生成模型，包括：将所述训练样本中所有标签为对话触发标签的话术作为触发话术集，将所述训练样本中所有标签为回话标签的回话话术以及每个回话话术对应的回话标签作为回话话术集；使用所述触发话术集以及所述回话话术集训练待训练对话生成模型，得到所述对话生成模型。 6.一种对话生成方法，其特征在于，所述方法包括：获取第一对话数据，所述第一对话数据包括历史对话以及待回话话术；调用标签预测模型根据所述历史对话对所述待回话话术的回话标签进行预测，得到第一回话标签，所述标签预测模型是根据权利要求1 ‑5中任一方法训练得到的；调用对话生成模型根据第一回话标签生成第一回话数据，得到第一回话，所述对话生成模型是根据权利要求1 ‑5中任一方法训练得到的。 7.一种对话生成模型的训练装置，其特征在于，所述装置包括：第一获取模块，用于获取第一对话集与第二对话集，其中，所述第一对话集中的每组对话包括话术及该话术的回话话术，每组对话中的话术包括对话触发标签，每组对话中的回话话术包括回话标签，所述第二对话集中的对话不带有标签；处理模块，用于根据所述第一对话集，预测所述第二对话集中的每组对话对应的标签，得到第三对话集；训练模块，用于将所述第一对话集与所述第三对话集作为训练样本训练待训练对话生成模型，以得到对话生成模型。权　利　要　求　书 1/2 页 2 CN 114896385 A 28.一种对话生成装置，其特征在于，所述装置包括：第二获取模块，用于获取第一对话数据，所述第一对话数据包括历史对话以及待回话话术；调用模块，用于调用标签预测模型根据所述历史对话对所述待回话话术的回话标签进行预测，得到第一回话标签，所述标签预测模型是根据权利要求1 ‑5中任一方法训练得到的；生成模块，用于调用对话生成模型根据第一回话标签生成第一回话数据，得到第一回话，所述对话生成模型是根据权利要求1 ‑5中任一方法训练得到的。 9.一种计算设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存储至少一可执行指令，所述至少一可执行指令运行时使所述处理器执行如权利要求 1‑5中任一项所述的对话生成模型的训练方法，或者如权利要求6中的对话生成方法。 10.一种计算机存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令运行时使计算设备执行如权利要求1 ‑5中任一项所述的对话生成模型的训练方法，或者如权利要求6中的对话生成方法。权　利　要　求　书 2/2 页 3 CN 114896385 A 3

专利 一种对话生成模型的训练以及对话生成方法、装置及设备

专利一种对话生成模型的训练以及对话生成方法、装置及设备