全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111520094.1 (22)申请日 2021.12.13 (71)申请人 广州大学 地址 510006 广东省广州市番禺区大 学城 外环西路23 0号 (72)发明人 曾衍瀚 侯明江 林培东 吕明瑞  陈伟坚 李志贤 陈咏森  (74)专利代理 机构 北京高航知识产权代理有限 公司 11530 代理人 刘艳玲 (51)Int.Cl. G16H 50/70(2018.01) G16H 50/30(2018.01) G06N 3/12(2006.01) G06N 20/00(2019.01)G06K 9/62(2022.01) (54)发明名称 一种基于改进的F-Score的妊高症预测方法 (57)摘要 本发明提供了一种基于改进的F ‑Score的妊 高症预测方法, 包括先采用改进 的F‑Score特征 选择算法从妊高症患者的特征集合中选出最优 特征, 所有最优特征组成训练集; 然后使用训练 集对Stacking模型中的机器 学习模型进行训练, 获得经过训练的机器学习模型; 使用经过训练的 机器学习模 型对训练集中的特征进行预测, 获得 预测结果; 基于所述最终预测结果, 使用遗传算 法对经过训练的机器学习模型的组合进行筛选, 获得最佳的模 型组合; 将最佳的模 型组合对训练 集的预测结果作为Stacking模型第二层逻辑回 归的输入, 通过第二层逻辑回归输出对妊高症患 者患病概率的预测值。 本发明有效地解决数据不 平衡的问题, 增加了对医学数据预测结果的泛化 性和表现力。 权利要求书2页 说明书6页 附图2页 CN 114155971 A 2022.03.08 CN 114155971 A 1.一种基于改进的F ‑Score的妊高症预测方法, 其特 征在于, 包括: S1, 采用改进的F ‑Score特征选择算法分别计算妊高症患者的特征集合中的每个特征 的F‑Score的值; S2, 将F‑Score的值大于预设的选择阈值的所有特征作 为最优特征, 所有最优特征组成 训练集; S3, 使用训练集对Stacking模型中的K个clfl机器学习模型进行训练, 获得K个经过训 练的机器学习模型; S4, 将训练集中的每个最优特征分别输入到K个经过训练的机器学习模型中进行预测, 获得K个预测结果, 对K个预测结果取平均值, 获得训练集中的每 个特征的最终预测结果; S5, 基于所述最终预测结果, 使用遗传算法对K个经过训练的机器学习模型进行筛选, 获得N个最佳的模型组合; S6, 将N个最佳的模型组合对训练集的预测结果作为Stacking模型第二层逻辑回归的 输入, 通过第二层逻辑回归输出对妊高症患者患病概 率的预测值。 2.根据权利要求1的一种基于改进的F ‑Score的妊高症预测方法, 其特征在于, 所述S1 包括: 使用如下公式分别计算妊高症患者的特 征集合中的每 个特征的F‑Score的值: 式中, F(i)表示第i个特征的F ‑Score的值, 表示第i个特征在少数类上的平均值, 表示第i个 特征在多数类上的平均值, 代表第i个特征在整个数据集上的平均值, n+代 表正类的样本大小, 为第k个少数类 类样本点的第i个特 征的特征值。 3.根据权利要求1的一种基于改进的F ‑Score的妊高症预测方法, 其特征在于, 所述S3 包括: 使用Kflod将训练集切分成K个子集, 每一个子集包括 一个验证集和一个测试集; 对于clfl机器学习模型, 使用其 中的K‑1个子集对clfl机器学习模型进行训练, 使用剩 余的一个子集对训练结果进行验证。 4.根据权利要求1的一种基于改进的F ‑Score的妊高症预测方法, 其特征在于, 所述S5 包括: 所述遗传算法使用二进制编码的形式; 使用所述遗传算法分别为经过训练的K个机器学习模型产生初始种群, 然后通过随机 产生的多个交叉点进 行多点交叉, 在交叉后的二进制码上选择多个点位进 行二进制变换的 变异操作, 二级制变换包括0变1或1变0, 将二进制中为1所对应的模 型取出来, 为0的模 型舍 弃; 对K个经过训练的机器学习模型的所有组合进行上述遗传算法的交叉变异选择, 然后 每次将组合作为Stacking第二层也就是逻辑回归的输入, 用临床妊高症数据训练第一层学 习器, 然后将第一层Kflod验证集上的预测结果堆叠起来作为第二层逻辑回归的训练集, 第权 利 要 求 书 1/2 页 2 CN 114155971 A 2一层Kflod测试集的预测结果的平均值作为第二层逻辑回归的测试集再次进行预测, 获得 预测结果; 对预测结果从大到小 进行排序, 获得排名靠前的N个最佳的模型组合。权 利 要 求 书 2/2 页 3 CN 114155971 A 3

.PDF文档 专利 一种基于改进的F-Score的妊高症预测方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于改进的F-Score的妊高症预测方法 第 1 页 专利 一种基于改进的F-Score的妊高症预测方法 第 2 页 专利 一种基于改进的F-Score的妊高症预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:19:35上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。