说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211248439.7 (22)申请日 2022.10.12 (71)申请人 浙江传媒学院 地址 310028 浙江省杭州市下沙高教园区 学源街998号 (72)发明人 付剑晶  (74)专利代理 机构 杭州天勤知识产权代理有限 公司 33224 专利代理师 米志鹏 (51)Int.Cl. G06F 21/60(2013.01) (54)发明名称 一种面向数据空间离 散安全度的检 定方法 (57)摘要 本发明公开一种面向数据空间离散安全度 的检定方法, 包括: 步骤1: 对数据集S{δ1, δ2,…δN}, 定义: 涨率Er, 束率Ihr, 及 综合离散度IIR; 步骤2: 按以下步骤计算: 对原始 数据按升序排序, 计算数据间隔δi; 对部分δi 逐次求出相应的IIRi; 对出现的第一个大于阈值 c的IIRi赋值t=i; 所有下标小于t的间隔δi都 被认定为离散安全。 本发明方法基于对离散的新 量度: 用涨率及束率比来描述的综合离散度; 通 过对韦伯定律的变化, 本发明亦提出了对应韦伯 常数的阈值意义; 对检验数据集排升序, 通过基 础的安全中集用定义的新量度对外围数据逐次 检定, 达到阈值的离散点将被视为对主体的安全 脱离边界。 权利要求书1页 说明书5页 附图4页 CN 115495766 A 2022.12.20 CN 115495766 A 1.一种面向数据空间离 散安全度的检定方法, 其特 征在于, 包括: 步骤1: 对数据集S{ δ1, δ2,…δN}, 定义: 涨率Er, 束率 Ihr, 及综合离 散度IIR; 步骤2: 按以下步骤计算: 2.1: 对原 始数据按升序排序, 计算数据间隔δi; 2.2: 对部分δi逐次求出相应的I IRi; 2.3: 对出现的第一个大于阈值c的I IRi赋值t=i; 2.4: 所有下 标小于t的间隔δi都被认定为离 散安全。 2.根据权利要求1所述的面向数据空间离散安全度的检定方法, 其特征在于, 在步骤1 中, 涨率Er, 束率 Ihr及综合离 散度IIR对应的公式为: Eri=N×δi/Δ 其中, N表示数据总数, j与i皆为数据集索引下 标。 3.根据权利要求1所述的面向数据空间离散安全度的检定方法, 其特征在于, 所述步骤 2.1包括: S1、 在升序排列的数据集选 定中值; S2、 对中值的左右邻居同时计算间隔; S3、 持续计算左右间隔, 直到左端或右端数据竭尽; S4、 对剩下 数据按单侧邻居计算间隔, 直到单侧数据完毕; S5、 对获取的间隔数据集 δi执行步骤2.2 ~2.4, 得到 离散度为安全的数据集。 4.根据权利要求3所述的面向数据空间离散安全度的检定方法, 其特征在于, 在步骤S1 中: N为偶数时, 对应的中值 为 δN/2和 δN/(2+1); N为奇数时, 对应的中值 为 δ(N+1)/2。 5.根据权利要求3所述的面向数据空间离散安全度的检定方法, 其特征在于, 在步骤S2 中, 在所述中值的左右邻居中, 先选取值小的开始计算间隔。 6.根据权利要求1所述的面向数据空间离散安全度的检定方法, 其特征在于, 在步骤 2.2中, 计算总数1/2以上的δi对应的IIRi。 7.根据权利要求1所述的面向数据空间离散安全度的检定方法, 其特征在于, 在步骤 2.3中, 所述阈值c取值 为1.81。 8.根据权利要求1所述的面向数据空间离散安全度的检定方法, 其特征在于, 在步骤 2.1中的升序排序是根据数值从小到大排列。权 利 要 求 书 1/1 页 2 CN 115495766 A 2一种面向数据空间离散安全度的检定方 法 技术领域 [0001]本发明涉及数据安全领域, 尤其是涉及单变量数据在空间离散度方面的安全检定 方法。 背景技术 [0002]信息时代的飞速发展使得数据的获取呈指数递增, 而大数据处理中不可或缺的一 个环节就是基础数据的噪音处 理, 表现在数据空间对离 散的测度及安全检定 。 [0003]离散或中心偏离安全范围的检定最基本方法包括均值标准偏差法, 中值绝对偏差 法(F,Hampel, “The influence  curve and its role in robust estimation ”,Journal  of the American  Statistical  Association,69,383 ‑393,1974), boxplot法(J.W.Tukey, Exploratory  data analysis,Addison ‑Wesley,1977), 以及最小二乘法的变法 (P.J.Rousseeuw  and A.M.Leroy,Robust  regression  and outlier detection,John   Wiley&Son,198 7; R.A.Maronna,R.D.Martin  and V.J.Yohai,Robust  Statistics:Theory   and Methods,John  Wiley&Sons,2006)等等。 以及公开号CN112434253A的专利申请提供一 种判断大数据离散程度的方法, 基于调整 前计算子集的方差和或标准方差的二个以上组件 增量计算调整后计算子集的方差和或标准方差的二个以上组件, 然后根据需要基于一个或 多个增量计算的组件生 成调整后计算子集的方差和或标准方差, 增量计算方差和或标准方 差可以基于最新数据实时更新计算结果并避免访问调整后计算子集中的所有数据元素和 执行重复计算从而提高计算效率; 另外, 公开号CN  111708979  A的专利申请提供公开一种 实时判断大数据离散程度的方法, 也采用基于迭代计算方差和或标准方差衡量数据离散程 度。 [0004]现有方法都普遍运用在各学科数据处理的前期, 优点或在于算法的简单或在于原 理的简洁。 然而存在的问题是多环境下各方法无法得到统一结果, 实际案例中存在或多或 少的偏差, 这样细微之处的数据安全是无法得到保障的。 不同的方法设立了不同的标准, 主 要的原因在于离散的度量角度问题, 这毫无疑问导致了实际的混乱, 是离散检定一直存在 的缺陷。 发明内容 [0005]本发明公开了一种面向数据空间离散安全度的检定方法, 在以模拟和实际数据集 为检验标准的前提下, 表现优于传统的各算法。 尤其在实际数据集下, 显示了更强的同一 性。 与boxpl ot的直接对比更体现了 本发明的优势。 [0006]本发明采用的具体技 术方案如下: [0007]一种面向数据空间离 散安全度的检定方法, 包括: [0008]步骤1: 对数据集S{ δ1, δ2,…δN}, 定义: 涨率Er, 束率Ihr, 及综合离散度 IIR; [0009]步骤2: 按以下步骤计算:说 明 书 1/5 页 3 CN 115495766 A 3

.PDF文档 专利 一种面向数据空间离散安全度的检定方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向数据空间离散安全度的检定方法 第 1 页 专利 一种面向数据空间离散安全度的检定方法 第 2 页 专利 一种面向数据空间离散安全度的检定方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 05:39:49上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。