张春成
2023/05/01阅读:23主题:默认主题
细粒度的中国地理数据分析(三)
细粒度的中国地理数据分析(三)
本文不再向前推进,而是承接上文将之前的聚类结果进行进一步展示,并尝试以此为契机说明目前我比较推荐的绘图或可视化思路,即在后端进行数据分析后,由开源前端对进行数据呈现和发放,并且参与呈现的数据规模不宜过大。本文代码可见我的前端笔记本
Chinese geometry dataset analysis with fine land types / Chuncheng | Observable (observablehq.com)
数据归纳与传输
承接上文,经过简单的归纳,我们计算得到的按地块种类的城市聚类结果可以总结成数据表,如下图所示,其中包含各个城市的地块面积比例、城市代码、城市名称和聚类标签信息。
我们注意到,虽然前文所涉及的地块信息极其丰富,导致原始数据极其巨大,但经过计算而得到的表格规模却十分小巧,因此我们可以将它独立出来,放在开源前端进行交互式展览,这样,其他人就可以比较方便地从中提取出对自己有用的信息。

数据的交互式呈现
以下两图是按密度对数据进行呈现,其中横坐标代表居住地块的大小,纵坐标分别代表工业(左)和公共(右)地块的大小。从左图中不难看出居住和工业地块呈现“此消彼长”的趋势,共同构成我国城市地块面积的主导因素。从右图中可以看到公共地块的大小与居住地块面积没有线性关系,整体呈现较低的趋势。


接下来,我还提供了进一步的细节交互式图表,用于选择感兴趣的显示方案和省级单位,它的控件如下左图所示。在如下右图中,按城市聚类结果展示了它们的分布,点的颜色代表聚类标签,而点的大小代表商业地块的规模占比。
在下图的例子中分别展示了山东省和北京市在工业区划上的分布差异。其中,山东省的市主要分布在靠近对角线的位置,这代表这些城市以工业和居住为主。如果我们将的分布理解成一个“三角形”,那么它最右端为青岛,以居住为主、最左端为德州,以工业为信、最下方为济南,以商业为主。
再下图中是将北京市标记在整个表格上,可以看到它是一个很特殊的城市,它的居住地块面积占比适中,但公共服务地块占比脱颖而出的高,而工业地块则相对较低。当然,你也可以选择喜欢的省份来查看这些城市在全国的分布
Chinese geometry dataset analysis with fine land types




最后,你还可以让类别进行分离,甚至绘制它们的分布等势面,以便更清晰地查看它们。


作者介绍