基于兴趣点大数据的小城镇建设综合指数测算与对标分析
小城镇是新型城镇化的新空间。小城镇的空间生产与其产业、文化、基础设施等空间实体要素建设是紧密交织的。从这一空间生产理论视角来看,小城镇建设是集成自然生态、产业发展、社会文化、基础设施与公共服务等多空间实体要素建设的系统工程。而目前,学者多利用统计数据、调查数据、案例分析等数据与方法对小城镇建设水平进行研究,存在数据难获取、数据不全面等问题,较大地限制小城镇建设水平测算。其他学者,如曹根榕、顾朝林等利用高德电子地图POI数据有效诠释区域的“三生空间”建设。兴趣点(Point Of Interest,简称POI)作为一种代表真实地理实体的点状地理空间大数据,有效丰富小城镇研究数据的数量和种类,为小城镇建设指标体系与水平测算提供新思路与方法。基于此,本文将小城镇建设向其内部地域空间实体拓展,利用统计数据和兴趣点数据构建指标体系及测算综合指数,并结合雷达图和夹角余弦法,提出基于典型特征匹配的小城镇建设对标分析方法,为我国小城镇建设评价提供一定的理论和实践参考。
1 基于兴趣点大数据的综合测算指标体系构建
1.1 兴趣点大数据的含义
兴趣点大数据客观详实记录人类重要活动关联设施的空间点位及属性信息,反映小城镇建设的方方面面。如小城镇街道建设空间活力、商业聚集空间及热点问题等。其数据内容非常丰富,包括餐饮、购物、生活、交通、科教文化设施等方面,能有效凸显小城镇建设的全面性、实时性和精准性。
1.2 测算指标体系的构建与数据来源
小城镇建设是集生态、产业、社会文化、基础设施与公共服务等多空间实体要素建设的系统工程。本文基于统计数据和兴趣点大数据两方面,构建小城镇建设指标体系。见图1。
(1)统计指标数据包括面积、常住人口、城镇建成区面积、企业个数、企业从业人员、工业企业个数及规模以上个数。其中,前三个指标诠释出其社会特征,后四个指标描述经济水平。该部分数据来源于《2018中国县域统计年鉴》。
(2)兴趣点数据通过高德地图按行政区范围获取全类型大数据。具体来看,用商务住宅、金融保险相关服务、公司企业兴趣点指标诠释小城镇的产业发展,用风景名胜兴趣点指标代表其资源禀赋,用交通设施、体育休闲、住宿、汽车、餐饮、购物、生活、科教文化及医疗保健等相关服务兴趣点指标表示其设施建设水平,用政府机构及社会团体、道路附属设施、地名地址信息、公共设施兴趣点指标表示其社会管理水平。该数据是基于2019年高德地图分类,利用ArcGIS和Python爬取。
1.3 研究样本的说明
基于高德地图爬取重庆范围内小城镇POI大数据,剔除资料提取不充分不完整的样本,最终筛选出557个小城镇,包括阿蓬江镇、隘口镇、安澜镇、安坪镇等。
2 综合指数测算与对标分析方法
2.1 综合指数的测算方法
本文采用标准差标准化方法测算小城镇建设综合指数,该方法是评价指标的常用方法。转化公式是:对序列x1,x2,……,xn进行变换:

这里,
则新序列y1,y2,……,yn的均值为0,方差为1,且无量纲。通过该方法,可将小城镇建设指标进行无量纲化处理,测算出综合指数,为小城镇的聚类和对标学习提供基础。
2.2 对标分析
对标分析旨在同一可比类别中找到最优学习样本。基于夹角余弦的相似度匹配法能有效对比两样本在建设指标特征上的相似度和差异性。例如,假设小城镇A和B有n个典型指标特征,则可用n维样本点A(x11,x12,…,x1n)与B(x21,x22,…,x2n)表示,其相似性用夹角余弦公式求得:

夹角余弦取值范围为[-1,1]。夹角余弦越大,表示两个向量的夹角越小,说明两样本对标学习的意义与效果就越大,反之亦然。
3 重庆市小城镇建设综合指数测算与对标分析
3.1 综合指数的测算
采用标准差标准化方法对筛选出的重庆市557个小城镇样本进行指标测算。测算结果范围为[-13.992530,140.582136],值越高表示小城镇在六个特征维度上的综合建设水平越强,反之亦然。从图2可知,重庆市西南部中心位置的小城镇建设水平较高,东南部小城镇建设综合水平较低。
3.2 聚类分析
利用系统聚类法进行聚类,将重庆市小城镇类型划分为3类。根据聚类结果,结合“人口与面积—经济—产业—资源禀赋—设施服务—社会管理”六个维度的指标特征值,可分析出三大类型的小城镇特征,结果如图3所示。
从图3可知,不同类型小城镇在不同维度特征上存在较大差异。第一类小城镇综合实力较强,各项特征指标值远高于均值,发展基础好,可界定为综合型小城镇,包括八桥镇等18个小城镇。第二类小城镇仅在某些特征上表现出一定优势,整体建设水平偏弱,资源禀赋较好,经济与产业有待突破发展,设施服务水平不高,可界定为发展型小城镇,包括安居镇等115个小城镇。第三类小城镇各维度特征不明显,六个指标维度值均低于平均水平,经济与产业或资源基础薄弱,优势不突出、市场化程度不高,设施服务待完善。该类型小城镇尚处于初步发展阶段,可界定为起步型小城镇,包括阿蓬江镇等424个小城镇。
3.3 对标分析
根据上述方法进行实例对标分析,具体过程如下:
(1)在重庆市小城镇库中随机抽取一个样本x作为示例样本:
x=涂山镇
(2)查看聚类结果和综合指数测算排名。
涂山镇(x)属于第一类型小城镇,排名第九,综合指数75.2724;
(3)基于夹角余弦法的相似度匹配对标分析。
将涂山镇(x)与第一类型(综合型)中排名前八的样本小城镇做相似度匹配测算。根据夹角余弦公式(2),测算涂山镇(x)与长生桥镇(a)、龙水镇(b)、九龙镇(c)、西彭镇(d)、南坪镇(e)、八桥镇(f)、永安镇(g)、港口镇(h)的计算结果如表1。
一般而言,cosθ≥0.85可作为选取对标样本的阈值要求。当cosθ≥0.85,表明案例小城镇与对标小城镇间的匹配度较高,具有可比性;反之则表示二者之间的差异性较大,尽管对标学习的进步空间可能较大,但对标学习的难度大、限制多。据此可知,涂山镇(x)与九龙镇(c)、西彭镇(d)、南坪镇(e)、八桥镇(f)的cosθ≥0.85,表明他们的匹配度高,在建设模式上具有一定的借鉴意义;与长生桥镇(a)、龙水镇(b)、永安镇(g)、港口镇(h)的cosθ≤0.85,表明他们的特征重合度较低,在建设模式上的差异较大,对涂山镇(x)的借鉴意义较小,不作为后面对标分析的样本考虑。
(4)小城镇建设的对标分析
根据上述夹角余弦值测算结果,基于雷达图,可得九龙镇(c)、西彭镇(d)、南坪镇(e)、八桥镇(f)与涂山镇(x)的相似度匹配雷达图,如图4所示。
从图4可知,1)涂山镇对标九龙镇。涂山镇可对标学习其在产业、设施服务特征维度上的发展经验;2)涂山镇对标西彭镇。涂山镇可对标学习其在经济和产业发展的经验;3)涂山镇对标南坪镇。涂山镇可在设施服务特征维度上对标学习南坪镇;4)涂山镇对标八桥镇。涂山镇可对标学习其在设施服务和产业上的建设经验。
4 结 语
从空间视角,运用统计数据和兴趣点大数据,构建小城镇建设指数测算指标体系,并基于雷达图和夹角余弦法提出典型特征匹配的小城镇建设对标分析方法。结果表明:(1)重庆小城镇综合建设水平呈现较大的差异化和空间集聚特征,重庆市西南部中心位置的小城镇建设的综合指数高。(2)重庆市小城镇的建设水平可划分为“较强、一般、弱”三类,建设模式可归纳为综合型、发展型与起步型。(3)基于雷达图和夹角余弦法的典型特征匹配的小城镇建设对标分析方法,能有效进行可视化匹配和对标样本提取,为发展模式和路径的对标经验学习提供理论参考和实践指引。
[2]曹根榕,顾朝林,张乔扬.基于POI数据的中心城区“三生空间”识别及格局分析——以上海市中心城区为例[J].城市规划学刊,2019(2):44-53.
[3]薛冰,李京忠,肖骁,等.基于兴趣点(POI)大数据的人地关系研究综述:理论、方法与应用[J].地理与地理信息科学,2019(35):51-60.
[4]罗奇,温子涵,余来彦.环境行为学导向下小城镇街道空间活力提升策略研究——以紫湖镇为例[J].城市发展研究,2019(2):20-24+30.
[5]魏中宇,苏惠敏,黄荣静.基于POI数据西安市商业集聚特征分析[J].西南大学学报(自然科学版),2020(4);97-104.