全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111488423.9 (22)申请日 2021.12.08 (71)申请人 苏州盈天地资 讯科技有限公司 地址 215024 江苏省苏州市自由贸易试验 区苏州片区苏州工业园区苏州大道西 9号苏州国际财富广场2幢1501室 1505、 1506、 1507单元 (72)发明人 张金磊 许哲豪 宋少鸿  (74)专利代理 机构 义乌市宏创专利代理事务所 (普通合伙) 33320 代理人 赵双 (51)Int.Cl. G06F 9/48(2006.01) G06F 9/451(2018.01) G06F 9/445(2018.01)G06F 8/38(2018.01) G06F 3/0486(2013.01) G06N 20/00(2019.01) (54)发明名称 一种可拖拽式机器学习工作流组件调度方 法 (57)摘要 本发明公开了一种可拖拽式机器学习工作 流组件调度方法, 包括以下步骤: S1、 设计与组件 类别相对应的组件配置模 版, 配置模 版中除伪节 点Base以外, 其他节点与机器学习建模所需的任 务一一对应; S2、 获取当前机器学习工作流所包 含的机器学习建模所需的任务及任务顺序, 并将 该任务顺序和配置模版作为参数一起传入; S3、 根据任务顺序动态加载配置模 版参数, 执行机器 学习工作流。 本发明可拖拽式机器学习工作流设 计思路, 工作流组件化, 能快速复用, 做到 可以通 过Web前端页面拖拽、 代码层和命令行的方式分 别实现机 器学习工作流任务的创建。 权利要求书1页 说明书5页 附图1页 CN 114138446 A 2022.03.04 CN 114138446 A 1.一种可拖拽式机器学习工作流组件调度方法, 其特 征在于: 包括以下步骤: S1、 设计与组件类别相对应的组件配置模版, 配置模版中 除伪节点Base以外, 其他节点 与机器学习建模所需的任务 一一对应; S2、 获取当前机器学习工作流所包含的机器学习建模所需的任务及任务顺序, 并将该 任务顺序和配置模版作为 参数一起传入; S3、 根据任务 顺序动态加载配置模版参数, 执 行机器学习工作流。 2.根据权利要求1所述的一种可拖拽式机器学习工作流组件调度方法, 其特征在于: 该 方法还包括: S11、 采用与组件类别相 对应的组件配置模版对组件进行封装, 包括采用与组 件类别相对应的组件配置模版对组件进行封装, 将组件的数据输入接口、 数据输出接口及 组件参数接口暴露出来。 3.根据权利要求2所述的一种可拖拽式机器学习工作流组件调度方法, 其特征在于: 该 方法还包括: S12、 任务 运行日志保存路径通过伪节点Base进行配置 。 4.根据权利要求3所述的一种可拖拽式机器学习工作流组件调度方法, 其特征在于: 该 方法还包括: S21、 按照该任务顺序对机器学习建模所需的任务所对应组件进行连接后, 根 据组件的规范性输入类型、 输入数量、 输出类型及输出数量对前后连接的两个组件进行是 否符合连接规范检查; 其中, 若符合, 进行S3步骤; 否则, 拒绝不符合连接规范的连接组件并报错提示, 重 复执 行S11‑S21步骤直至组件连接符合连接规范后才执 行S3步骤。 5.根据权利要求4所述的一种可拖拽式机器学习工作流组件调度方法, 其特征在于: S21中报错提示方式为 弹框提示 或命令行终端提示所述机器学习建模所需的任务流程中组 件的连接错 误信息。 6.根据权利要求5所述的一种可拖拽式机器学习工作流组件调度方法, 其特征在于: 该 方法还包括: S22、 用户也可以通过拖拽机器学习组件, 设计组件运行流程图, 控制组件之间 的数据流向。权 利 要 求 书 1/1 页 2 CN 114138446 A 2一种可拖 拽式机器学习工作流组件调度方 法 技术领域 [0001]本发明涉及机器学习工作流技术领域, 具体为一种可拖拽式机器学习工作流组件 调度方法。 背景技术 [0002]近年来, 随着计算机应用技术的高速发展, 人工智能、 大数据、 云计算已成为IT领 域关注的焦点。 作为使计算机具有 “智能”的机器学习(MachineLearning, ML)算法在目标识 别、 目标检测等任务上都取得了显著的成果, 并成功应用于金融交易、 商品推荐、 交通预测 等领域。 在使用机器学习算法训练模型时, 为了避免原始数据收集、 数据 清洗、 缺失值处理、 特征提取、 样本生成及模型评估等流程占用过多的时间, 通常需要针对实际业务场景构建 机器学习工作流。 [0003]现有的机器学习算法大多都是从代码层进行构建和测试的, 通常要经过环境配 置、 算法流程设计、 数据接口设计、 程序编写、 程序调试等工序, 最后才可以部署服务。 对于 上游的数据源和下游的服务应用, 每次都要等算法服务部署好之后才可以将这三者打通, 这成为了自动化运行 的瓶颈。 此外, 对于机器学习 领域的初级开发人员或业务层的数据分 析人员, 进行代码层算法的开发与测试存在一定的难度, 门槛过高。 [0004]目前, 机器学习工作流构建方法大多以强调调度方法和调度系统为主, 而对于一 个易用的机器学习工作流的构建应该不止于此。 因此, 结合具体实际业务需求, 提出一种工 作流构建新的形式。 具体的, 将机器学习工作流以Python第三方包的标准形式进 行交付, 支 持后续的功能更新和版本迭代; 支持独立运行, 同时也可配合Web前端界面采用拖拽式运 行; 独立运行时通过友好的命令行界面进行交 互。 [0005]现有的机器学习工作流调度方法和系统虽然将原始数据收集、 数据清洗、 缺失值 处理、 特征提取、 样本生成等模块组件化, 便于集 成和节省时间, 但, 这样的构建思路是有弊 端的。 这种机器学习工作流构建思路与通过代码层进 行构建和测试机器学习算法的方式对 立了起来, 其对应的工作流调度方法也被局限住了, 无法适应基于代码层构建的方式。 为 此, 我们提出一种可拖拽式机器学习工作流组件调度方法。 发明内容 [0006]本发明的目的在于提供一种可拖拽式机器学习工作流组件调度方法, 以解决上述 背景技术中提出的问题。 [0007]为实现上述目的, 本发明提供如下技术方案: 一种可拖拽式机器学习工作流组件 调度方法, 包括以下步骤: [0008]S1、 设计与组件类别相对应的组件配置模版, 配置模版中除伪节点Base以外, 其他 节点与机器学习建模所需的任务 一一对应; [0009]S2、 获取当前机器学习工作流所包含的机器学习建模所需的任务及任务顺序, 并 将该任务 顺序和配置模版作为 参数一起传入;说 明 书 1/5 页 3 CN 114138446 A 3

.PDF文档 专利 一种可拖拽式机器学习工作流组件调度方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种可拖拽式机器学习工作流组件调度方法 第 1 页 专利 一种可拖拽式机器学习工作流组件调度方法 第 2 页 专利 一种可拖拽式机器学习工作流组件调度方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:19:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。