全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210393216.3 (22)申请日 2022.04.14 (71)申请人 广州欢聚时代信息科技有限公司 地址 511442 广东省广州市番禺区南村镇 万达广场B-1栋24层 (72)发明人 黄家冕  (74)专利代理 机构 广州利能知识产权代理事务 所(普通合伙) 44673 专利代理师 王增鑫 (51)Int.Cl. G06V 30/19(2022.01) G06V 30/16(2022.01) G06V 30/146(2022.01) G06V 30/148(2022.01) G06V 30/10(2022.01)G06V 10/82(2022.01) G06N 5/04(2006.01) G06F 16/35(2019.01) G06F 16/36(2019.01) (54)发明名称 订单数据处理方法及其装置、 设备、 介质、 产 品 (57)摘要 本申请公开一种订单数据处理方法及其装 置、 设备、 介质、 产品, 所述方法包括: 获取待检测 图像; 识别出待检测图像中存在的各个行文本图 像相对应的行文本; 构造表示各个行文本及各个 行文本之间的相对位置关系的知识图谱, 所述知 识图谱对应各个行文本建立节 点, 以每两个节点 的行文本图像彼此在所述待检测图像中的位置 信息之间的数据距离为该两个节 点的边权重; 根 据所述知识图谱构造订单数据, 所述订单数据包 含根据所述行文本对应获得的数据条目, 所述数 据条目包含用于描述所述订单的属性字段及其 对应的属性数据。 本申请能够从待检测图像中识 别出结构化的订单数据, 可供电商订单业务流程 直接调用, 提升了电商订单业务流程的处理效 率。 权利要求书2页 说明书15页 附图4页 CN 114863440 A 2022.08.05 CN 114863440 A 1.一种订单 数据处理方法, 其特 征在于, 包括如下步骤: 获取待检测图像; 识别出待检测图像中存在的各个行文本图像相对应的行文本; 构造表示各个行文本及各个行文本之间的相对位置关系的知识图谱, 所述知识图谱对 应各个行文本 建立节点, 以每两个节点的行文本图像彼此在所述待检测图像中的位置信息 之间的数据距离为该两个节点的边权 重; 根据所述知识图谱构造订单数据, 所述订单数据包含根据 所述行文本对应获得的数据 条目, 所述数据条目包 含用于描述所述 订单的属性字段及其对应的属性数据。 2.根据权利要求1所述的订单数据处理方法, 其特征在于, 获取待检测图像, 包括如下 步骤: 获取用户提交的原 始图片; 根据预先训练至收敛状态的订单分类模型的入参对原始图片进行图像预处理, 获得待 检测图片; 采用所述订单分类模型对预处理后的待检测图片进行分类判别, 判别出该待检测图片 及该原始图片是否包含订单描述信息, 将包含有订单描述信息的所述原始图片确定为待检 测图像。 3.根据权利要求1所述的订单数据处理方法, 其特征在于, 识别出待检测图像中存在的 各个行文本图像相对应的行文本, 包括如下步骤: 根据预先训练至收敛状态的文本检测模型的入参对所述待检测图像进行图像预处理, 获得预处理后的待检测图像; 调用所述文本检测模型对所述预处理后的待检测图像进行检测, 获得所述预处理后的 待检测图像中各 行文本相对应的候选 框; 根据所述 候选框从所述待检测图像中截取 出各个行文本图像; 将所述行文本图像输入预训练至收敛状态的文本识别模型中进行文本识别, 获得相应 的行文本 。 4.根据权利要求1所述的订单数据处理方法, 其特征在于, 构造表示各个行文本及各个 行文本之间的相对位置关系的知识图谱, 包括如下步骤: 将每个行文本转换为相应的行文本向量; 将各个行文本向量存 储为知识图谱的节点; 计算每两个行文本图像的中心点坐标之间的数据距离, 存储为所述知识图谱中该两个 行文本图像相对应的行文本向量所在的两个节点的边权 重。 5.根据权利要求4所述的订单数据处理方法, 其特征在于, 计算每两个行文本图像的中 心点坐标之间的数据距离, 包括如下步骤: 获取每个行文本图像在识别出对应的行文本过程中产生的候选 框的各个角点的坐标; 针对每个候选框, 根据其四个角点的横坐标和纵坐标的均值确定出其中心点 坐标; 采用欧氏距离算法计算获得每两个行文本图像的中心点 坐标之间的数据距离 。 6.根据权利要求1至5中任意一项所述的订单数据处理方法, 其特征在于, 根据所述知 识图谱构造订单 数据, 包括如下步骤: 以节点信息向量矩阵及节点的邻接矩阵表示所述知识图谱;权 利 要 求 书 1/2 页 2 CN 114863440 A 2将各个节点的所述节点信息向量矩阵及其邻接矩阵输入预先训练至收敛状态的图神 经网络中进行推理, 获得知识图谱中各个节点的键值对作为订单数据的数据条目, 每个键 值对中, 与节点相映射的类别被存储为键数据作为数据条目中的属 性字段, 与节点相对应 的行文本被存 储为值数据作为数据条目中的属性数据。 7.根据权利要求1至5中任意一项所述的订单数据处理方法, 其特征在于, 根据所述知 识图谱构造订单 数据的步骤之后, 还 包括如下步骤: 根据所述订单数据生成电商交易订单, 将该电商交易订单推送至提交所述待检测图像 的终端设备以启动预设的电商业 务流程。 8.一种订单 数据处理装置, 其特 征在于, 包括: 图像获取模块, 用于获取待检测图像; 文本识别模块, 用于识别出待检测图像中存在的各个行文本图像相对应的行文本; 图谱构造模块, 用于构造表示各个行文本及各个行文本之间的相对位置关系的知识图 谱, 所述知识图谱对应各个行文本建立节点, 以每两个节点的行文本图像彼此在所述待检 测图像中的位置信息之间的数据距离为该两个节点的边权 重; 数据封装模块, 用于根据所述知识图谱构造订单数据, 所述订单数据包含根据所述行 文本对应获得的数据条目, 所述数据条目包含用于描述所述订单的属性字段及其对应的属 性数据。 9.一种计算机设备, 包括中央处理器和存储器, 其特征在于, 所述中央处理器用于调用 运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的 步骤。 10.一种计算机可读存储介质, 其特征在于, 其以计算机可读指令的形式存储有依据权 利要求1至7中任意一项 所述的方法所实现的计算机程序, 该计算机程序被计算机调用运行 时, 执行相应的方法所包括的步骤。权 利 要 求 书 2/2 页 3 CN 114863440 A 3

.PDF文档 专利 订单数据处理方法及其装置、设备、介质、产品

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 订单数据处理方法及其装置、设备、介质、产品 第 1 页 专利 订单数据处理方法及其装置、设备、介质、产品 第 2 页 专利 订单数据处理方法及其装置、设备、介质、产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:00:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。