(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210636595.4
(22)申请日 2022.06.07
(71)申请人 浙江工业大 学
地址 310014 浙江省杭州市拱 墅区潮王路
18号
(72)发明人 董红召 郭宇进 廖世凯 金灿
(74)专利代理 机构 杭州天正专利事务所有限公
司 33201
专利代理师 楼明阳
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 50/26(2012.01)
G06F 30/23(2020.01)
G06F 30/27(2020.01)
G06F 17/14(2006.01)G06F 17/18(2006.01)
G06K 9/62(2022.01)
G06N 20/00(2019.01)
(54)发明名称
一种半监督学习下的城市颗粒物浓度时空
预测方法
(57)摘要
一种半监督学习下的城市颗粒物浓度时空
预测方法, 包括: 1、 将研究区域进行网格划分; 2、
提取波动周期特征; 3、 提取空间特征和气象特
征; 4、 提取POI点密度分布特征; 5、 提取道路线密
度分布特征; 6、 构建半监督回归的时空预测模
型; 7、 展开城市颗粒物时空预测分析。 本发明充
分利用各类重要的无标签数据(气象条件、 不同
污染特征性的POI点密度和道路线密度), 提取各
类时空重要特征, 利用半监督回归 预测方法和反
距离插值法, 构建城市颗粒物时空预测模型, 预
测结果证明此 方法的精度较高。
权利要求书4页 说明书9页 附图7页
CN 114997499 A
2022.09.02
CN 114997499 A
1.一种半监 督学习下的城市颗粒物浓度时空预测方法, 包括如下步骤:
1、 将研究区域进行网格划分;
将城市区域投影至平面坐标系, 根据城市边界或预测的区域划定最大矩形框, 进行中
分辨率的网格划分;
2、 提取波动周期特 征;
大气污染浓度数据一般为时间序列数据, 具有较高的复杂性和非线性, 与其相关的特
征随时间变化而变化, 直接求取相关系 数并不合适; 而小波分析在时间尺度上 的颗粒物浓
度变化周期方面效果显著;
小波分析的基本思想: 利用一簇小波函数系拟合某一时间序列信号或函数, 它具有震
荡性并能迅速 衰减为零的特点, 即小 波函数 ψf∈L2(R), 且满足:
小波函数可通过时间维度的尺度伸缩和平移构成一簇子小波, 如式(2); 而对于给定能
量有限的信号, 其连续的小 波变换为 Wf(a,b), 如式(3)所示;
上式中, ψa,b(t)代表子小波; a表示时间尺度因子; b表示时间平移量; Wf(a,b)表示小波
变换系数; f(t)表示信号或者平方 可积的函数;
代表复共轭函数;
将小波系数的平方值在b域上积分, 得到小 波方差:
小波方差随尺度a的变化过程成为小波方差图; 由式(4)可知, 小波方差能反映波动的
能量尺度a的分布;
3、 提取空间特 征和气象特 征;
由于城市的区域性污染问题明显, 可根据各区域颗粒物变化规律划分不同预测区域;
在城市各监测站的数据支持下, 将颗粒物0~23时的浓度均值作为主要 特征, 利用凝聚分层
聚类法, 对 城市整体区域进行划分, 后续可利用时空预测模型分别对其展开预测;
气象条件可通过污染物的累积、 通风清洁或污染空气的区域输送直接影响城市环境中
的局部空气质量; 因此可结合城市各区域气象逐小时数据和颗粒物浓度数据, 利用相关性
分析法提取主 要气象特 征;
4、 提取POI 点密度分布特 征;
POI表示真实世界实体的特定地理空间要素, 对城市污染产生影响较大, 比如景区、 工
厂和道路附属设施 等; 对区域内POI简单聚类分析有利于把握POI整体的分布状况; 另外, 为
量化各类POI分布对颗粒物的影响, 采用不同污染特性的点密度估计法;
对于独立分布的POI元 素x1,x2,…xn, 任意点x的点密度值定义 为:
权 利 要 求 书 1/4 页
2
CN 114997499 A
2上式中, Ni代表第i个 单元格和领域内特定类 型的POI总数目; R代表不同类 型POI对周边
颗粒物浓度 产生明显影响的范围半径;
利用皮尔逊相关系数和和斯皮尔曼相关系数分析颗粒物与各类POI分布在0~23小时
的相关性, 并提取其中较明显的POI分布特 征;
5、 提取道路线密度分布特 征;
交通排放在城市中颗粒物日总浓度中占比例较大; 利用城市各级道路分布数据, 为量
化各类道路对区域 性影响, 进行不同污染特性线密度分析;
线密度分析主要用于计算每个输出栅格像元邻域内的线状要素的密度, 计算方法如下
所示:
上式中, L1和L2代表两条道路落于 圆形领域范 围内的线条长度; VI和V2代表各线条应被
统计的次数, 可表示各类道路对颗粒物影响的权重, 此 处均设为 1; R代表各类道路对周边颗
粒物产生明显影响的范围半径;
利用皮尔逊相关系数和和斯皮尔曼相关系数分析颗粒物与各类道路分布在0~23小时
的相关性, 并提取其中较明显的道路分布特 征;
6、 构建半监督回归的时空预测模型;
(61)构建反距离插值模型(IDW);
现有数据中包括城市各级道路线密度数据、 各类POI点密度数据以及空气监测微站 的
颗粒物浓度值和各类气象数据; 其中, 路网密度数据、 POI点密度数据在各网格内都为已知,
而气象数据仅与监测站点对应, 多数网格内存在缺失问题, 因此需采用相应的空间插值模
型将数据映射至整个空间, 选择反距离插值 算法;
IDW插值方法将待预测点和已知样本点之间的距离作为主要权重因子, 其权值随两点
距离减小 而增大, 其计算方法如下:
上式中, y(xe)表示待预测点xe的估算浓度值; y(xi)表示在xi处测得的真实浓度值; di表
示点xi到xe的距离; m表示两点距离的幂次;
(62)构建协同训练半监 督回归模型;
对于时空预测问题, 利用已监测到的站点污染数据作为少量有标签数据, 结合大部分
无标签数据, 利用半监 督回归模型, 可训练得到各点 位的时空污染数据;
协同训练回归模型COREG由于使用不同的距离度量而不需要足够和冗余的视图, 可通
过较低复杂度训练得到较准确的时空污染数据; 该模型利用有标签数据集和无标签数据集
生成两个回归量, 即h1和h2, 在未标记示例的帮助下对每个回归量进行细化; 由于KNN 是一种
惰性学习方法, 没有单独的训练阶段, 可有效实现KNN回归量的细化, 并且需要选择合适的
未标记示例进行标记, 估计标记置信度, 其训练示例的相邻属性可易与KNN回归器耦合, 因
此选用KNN 回归器作为基础学习器来实例化h1和h2, 通过平均k个最近邻示例的实值标签来
标记新实例; 结合
计算的MSE可在标记的示例集上进行评估, 其中xu表示未标记的实权 利 要 求 书 2/4 页
3
CN 114997499 A
3
专利 一种半监督学习下的城市颗粒物浓度时空预测方法
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 05:42:44上传分享