(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210903919.6
(22)申请日 2022.07.29
(71)申请人 湖南大学
地址 410082 湖南省长 沙市岳麓区麓山 南
路1号
(72)发明人 焦胜 蔡勇 欧林之
(74)专利代理 机构 武汉臻诚专利代理事务所
(普通合伙) 42233
专利代理师 宋业斌
(51)Int.Cl.
G06F 30/27(2020.01)
G06F 17/18(2006.01)
G06F 16/29(2019.01)
G06F 16/9537(2019.01)
G06K 9/62(2022.01)G06V 10/764(2022.01)
G06V 20/13(2022.01)
G06V 10/774(2022.01)
G06V 10/766(2022.01)
G06V 10/80(2022.01)
(54)发明名称
一种基于多源大数据的人口分布 识别方法
(57)摘要
本发明公开了一种基于多源大数据的人口
分布识别方法, 包括: 获取某个城市的统计数据、
矢量数据以及栅格数据, 对这些数据进行预处
理, 以得到预处理后的统一坐标系数据; 将得到
的百度热力图、 住宅POI数据、 建筑轮廓数据、 遥
感影像数据输入训练好的居住区人口识别模型,
以获取城区居住区人口分布, 将得到的经济发展
水平数据、 市区/县和街道的人口统计数据、 道路
矢量数据、 以及土地利用数据输入训练好的多因
素融合模型, 以得到人口分布影响因素及其系
数, 并根据人口分布影 响因素及其系数获取非城
区人口分布、 以及城区非居住区人口分布。 本发
明构建“宏观层面上分城乡、 分行政区、 分城市功
能以及微观层面上分街区单元 ”的人口分布模拟
模型。
权利要求书5页 说明书13页 附图4页
CN 115238584 A
2022.10.25
CN 115238584 A
1.一种基于多源大 数据的人口分布 识别方法, 其特 征在于, 包括以下步骤:
(1)获取某个城市的统计数据、 矢量数据以及栅格数据, 对这些数据进行预处理, 以得
到预处理后的统一坐标系 数据; 其中统计数据包括经济发展水平数据以及市区/县和街道
的人口统计数据, 矢量数据包括兴趣点数据POI、 道路矢量数据、 以及建筑轮廓数据, 栅格数
据包括遥感影 像数据、 土地利用数据、 以及百度热力图;
(2)将步骤(1)得到的百度热力图、 住宅POI数据、 建筑轮廓数据、 遥感影像数据输入训
练好的居住区人口识别模型, 以获取城区居住区人口分布;
(3)将步骤(1)得到的经济发展水平数据、 市区/县和街道的人口统计数据、 道路矢量数
据、 以及土地利用数据输入训练好的多因素融合模 型, 以得到人口分布影响因素及其系数,
并根据人口分布影响因素及其系数获取非城区人口分布、 以及城区非居住区人口分布;
(4)将步骤(2)得到的城区居住区人口分布、 连同步骤(3)得到的非城区人口分布和城
区非居住区人口分布融合成为初步人口分布图, 使用该城市的人口统计年鉴判断该初步人
口分布图是否校验通过, 如果 通过则进入步骤(5), 否则返回步骤(2);
(5)使用该城市的百度热力图判断步骤(4)得到的初步人口分布图是否校验通过, 如果
通过则进入步骤(6), 否则返回步骤(2);
(6)使用该区域的遥感影像数据将初步人口分布图中的无建筑区域赋值为零, 以得到
包含了无居住建筑的用地的真实情况的初步人口分布图。
(7)通过分区验证的方式判断初步人口分布图是否验证通过, 如果通过则将该初步人
口分布图作为 最终的人口分布图输出, 过程结束, 否则返回步骤(2)。
2.根据权利要求1所述的基于多源大 数据的人口分布 识别方法, 其特 征在于,
步骤(1)是从城市的统计年鉴中获取该城市的经济发展水平数据GDP、 市区/县和各街
道人口统计数据; 从地理空间数据云获取遥感影像数据; 从OpenStreetMap网站获取道路矢
量数据、 住宅POI数据和建筑轮廓数据; 从Esri Land Cover网站获取土地利用数据; 从百度
地图获取18级的百度热力图。
针对包括遥感影像数据、 土地利用数据、 以及百度 热力图的栅格数据而言, 预处理过程
是进行重采样, 形成3 00*300m的统一尺度;
针对包括各级行政区划、 住宅POI数据、 道路矢量数据、 以及建筑轮廓数据的矢量数据
而言, 预处理过程是: 对其中空间坐标不一致的数据使用GIS投影变换, 形成统一坐标系的
空间数据库; 针对包括GDP数据、 以及市区/县和街道的人口统计数据的统计数据而言, 与相
应的行政区划矢量数据进 行表格链接, 选取最小面积的 “街道”或“镇”行政面积的10%作为
像元大小, 通过插值方法转 化为栅格数据。
市区尺度数据预处 理是使用GIS统一空间坐标系;
省级数据的预处理首先对道路网密度、 GDP进行格式转化, 选取最小面积的 “街道”或
“镇”行政面积的10%作为像元大小, 通过插值方法转化为300*300m的栅格数据, 并对空间
坐标不一致的数据使用GIS进 行空间配准, 形成统一坐标系的空间数据库然后利用GIS对一
部分宏观数据进行重采样, 形成3 00*300m的统一尺度。
3.根据权利要求1或2所述的基于多源大 数据的人口分布 识别方法, 其特 征在于,
居住区人口识别模型包括居住区范围提取模型、 建筑高度识别模型、 以及GIS模型, 其
中建筑高度识别模型和GIS模型均 与居住区范围提取模型相连;权 利 要 求 书 1/5 页
2
CN 115238584 A
2居住区范围提取模型 是先后采用Rel iefF算法和J48决策树 来实现;
建筑高度识别模型采用M3Net模型和高分影 像反演方法。
GIS模型采用GIS几何 统计建筑面积。
4.根据权利要求1至3中任意一项所述的基于多源大数据的人口分布识别方法, 其特征
在于, 居住区人口识别模型 是通过以下步骤训练得到的:
(a1)采用ReliefF算法对遥感影像数据中自然地物和非自然地物进行分类, 以得到自
然地物遥感影 像和非自然地物遥感影 像;
(a2)从步骤(a1)得到的非 自然地物遥感影像中随机选择多个样本, 获取所有样本的特
征权重, 并按照从大到小的顺序对特 征权重进行排序;
(a3)对于步骤(a2)得到 的选择分类能力排名前10%的特征权重而言, 运用PSO封装算
法对这些 特征权重进行特征重要性度量, 从而得到对分类有贡献力的多个特 征权重;
(a4)对步骤(a3)得到的特征权重进行降序排列, 利用排名和序列后向选择方法相结合
的方式, 以得到多个分类特 征;
(a5)根据(a4)得到的分类特征对步骤(a1)处理后的非 自然地物遥感影像进行处理, 以
得到基于 遥感影像数据的建筑物;
(a6)采用J48决策树 算法根据对(a5)得到的建筑物进行区分, 以初步 提取居住建筑;
(a7)在GIS中将建筑轮廓数据与住宅POI数据进行叠置, 以提取住宅建筑, 并将提取的
住宅数据与步骤(a6)提取的居住建筑进行融合, 以得到 完整的住宅建筑数据;
(a8)通过GIS中的聚合工具对步骤(a7)得到的住宅建筑数据进行提取, 以得到各居住
区范围;
(a9)利用GIS对步骤(a8)得到的各居住区范围中的住宅建筑数据进行几何统计, 以得
到各居住区建筑面积;
(a10)根据百度街景数据和步骤(a9)得到 的各居住区建筑面积, 将步骤(a8)得到 的各
居住区范围进行进一步划分, 以得到能够获得百度街景 的居住区A和不能获得百度街景 的
居住区B;
(a11)根据步骤(a10)得到的居住区A提取相应范围的百度街景图像, 并将其输入M3Net
模型, 通过转置卷积 操作得到特 征图;
(a12)根据M3Net模型中的多视图分支, 并使用两次Conv、 BN和ReLU的组合, 将输入的百
度街景图像映射到特征图, 然后在编码阶段使用2 ×2最大池化操作对特征图进行下采样,
将该过程重复四 次, 从而得到同比例尺特 征图;
(a13)通过跳跃式连接将步骤(a11)得到的特征图与 步骤(a12)得到的同比例尺特征图
连接起来, 并应用Conv和ReLU组合两次生 成新的特征图, 重复此过程四次, 从而 得到特征筛
选过的新的特 征图;
(a14)使用Conv1 ×1卷积对步骤(a13)得到的新的特征图进行处理, 以得到建筑高度
图, 并将其输入多视图分支, 以得到来自多视图分支的建筑高度;
(a15)将得到的建筑高度图输入多光谱分支, 从而得到来自多光谱分支的建筑高度和
建筑足迹, 将来自多视图分支的建筑高度、 以及来自多光谱分支的建筑高度和建筑足迹连
接起来, 从而得到最终预测的建筑高度;
(a16)针对步骤(a10)得到的居住区B而言, 提取其中的GF ‑2卫星影像数据, 通过正射校权 利 要 求 书 2/5 页
3
CN 115238584 A
3
专利 一种基于多源大数据的人口分布识别方法
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:10:41上传分享