jionlp数据分析

V1

2022/10/23阅读:35主题:默认主题

分享 2022中国行政区划文本数据集(json格式)

相信很多做自然语言处理、知识图谱、数据分析的小伙伴们都需要一份中国行政区划数据词典

行政区划分为省、市、县、乡(街道)、村(社区)等五级,如下表所示:

  • 城市
{"loc_name": ["北京市"], "loc_code""110000000000"}
{"loc_name": ["北京市""市辖区"], "loc_code""110100000000"}
{"loc_name": ["北京市""市辖区""东城区"], "loc_code""110101000000"}
{"loc_name": ["北京市""市辖区""东城区""东华门街道"], "loc_code""110101001000"}
{"loc_name": ["北京市""市辖区""东城区""东华门街道""多福巷社区居委会"], "loc_code""110101001001"}
{"loc_name": ["北京市""市辖区""东城区""东华门街道""银闸社区居委会"], "loc_code""110101001002"}
{"loc_name": ["北京市""市辖区""东城区""东华门街道""东厂社区居委会"], "loc_code""110101001005"}
{"loc_name": ["北京市""市辖区""东城区""东华门街道""智德社区居委会"], "loc_code""110101001006"}
{"loc_name": ["北京市""市辖区""东城区""东华门街道""南池子社区居委会"], "loc_code""110101001007"}

  • 农村
{"loc_name": ["浙江省""宁波市""北仑区""霞浦街道""方戴村委会"], "loc_code""330206005207"}
{"loc_name": ["浙江省""宁波市""北仑区""霞浦街道""书院村委会"], "loc_code""330206005208"}
{"loc_name": ["浙江省""宁波市""北仑区""霞浦街道""陈华村委会"], "loc_code""330206005209"}
{"loc_name": ["浙江省""宁波市""北仑区""霞浦街道""山前村委会"], "loc_code""330206005210"}
{"loc_name": ["浙江省""宁波市""北仑区""霞浦街道""上傅村委会"], "loc_code""330206005211"}
{"loc_name": ["浙江省""宁波市""北仑区""霞浦街道""水俞村委会"], "loc_code""330206005214"}
{"loc_name": ["浙江省""宁波市""北仑区""霞浦街道""河西村委会"], "loc_code""330206005215"}
  • 少数民族地区
{"loc_name": ["内蒙古自治区""包头市""土默特右旗""萨拉齐镇""上茅庵村委会"], "loc_code""150221104211"}
{"loc_name": ["内蒙古自治区""包头市""土默特右旗""萨拉齐镇""王光亮村委会"], "loc_code""150221104212"}
{"loc_name": ["内蒙古自治区""包头市""土默特右旗""萨拉齐镇""大袄兑村委会"], "loc_code""150221104213"}
{"loc_name": ["内蒙古自治区""包头市""土默特右旗""萨拉齐镇""公盖营村委会"], "loc_code""150221104214"}
{"loc_name": ["内蒙古自治区""包头市""土默特右旗""萨拉齐镇""王庆营村委会"], "loc_code""150221104215"}
{"loc_name": ["内蒙古自治区""包头市""土默特右旗""萨拉齐镇""小袄兑村委会"], "loc_code""150221104216"}

其实,国家发展变化很快,随着人口迁徙、老龄化、产业结构变迁等因素影响,很多市县改区、村镇合并、消失等等,每年行政区划都会进行变更。国务院每年批准的行政区划调整批文多达十几甚至几十个。

因此,很多互联网上公开的行政区划词典往往存在一些过时、老旧。

最近细致整理了2022年度最新的的中国行政区划数据集,数据来源于 国家统计局整理的最新行政区划表。数据集以 json 格式给出。有需要的小伙伴可以关注下面公众号自取。

步骤如下:

  • 1 关注公众号JioNLP
  • 2 回复【下载】获取下载链接
  • 3 该数据集是免费的

如何在程序中加载

如果有编程经验,可以用python进行操作

  • 1 安装 jionlp 工具包
$ pip install jionlp
  • 2 编写以下代码执行
import jionlp as jio
loc_list = jio.read_file_by_line(/path/to/loc_list.txt)  # 解压后替换为下载路径

数据将定期更新,未来也会根据国务院的行政区划调整进行重新抓取。

我已经把数据集公开出来,可以扫码关注公众号JioNLP,回复下载获取。

扫码,并回复【下载】获取最新行政区划数据集
扫码,并回复【下载】获取最新行政区划数据集

JioNLP 是一个专注挖掘并分析互联网数据的公众号,来看看这里有没有你想要的数据吧。

分类:

人工智能

标签:

自然语言处理

作者介绍

jionlp数据分析
V1

jionlp开源作者,数据分析专家