基于腾讯人口迁徙数据的全国城市网络结构特征分析
1 引 言
基于大数据的城市网络研究是近十年来城市研究的新方向,本文基于腾讯人口迁徙数据,从网络分析入手,通过度、转变中心性、转变控制力、等级划分等方面分析网络结构特征。分析表明:(1)度与城市 GDP 具有较强的相关性,在一定程度上表征城市等级和经济发展情况,结合转变中心性和转变控制力进行中心城市评价是具有说服力的。(2)全国城市层级服从金字塔模型,金字塔顶端的城市在资源承载和辐射范围上都远远优于其他城市,城市之间的等级具有较大的差异,但随着一带一路、粤港澳大湾区、西部大开发、中部崛起和全国中西城市建设的战略扶持,这种差距在不断缩小,多极化发展的趋势明显。(3)迁徙流所表现出来的中国人口迁徙主要发生在以京津冀、长三角、珠三角、成渝地区为核心构成的菱形区域内。以黑河-腾冲一线为分界线,总体上呈现东高西低,南高北低的格局,全国形成多中心的网络结构。
20 世纪 90 年代后,经济全球化以及互联网的发展,深刻地改变了城市联系的方式,城市联系突破了封闭的系统,形成了在时空上的网络连接关系,从“流空间”视角分析,城市是网络中的一个节点,城市间的相互联系构成具有一定结构和功能的城市网络,这种网络承担着包括交通流、货物流、资金流、信息流、人口流等在内的各种物质要素的交换。城市的中心性是一个城市在网络中与其他城市的关联程度,体现了一个城市在网络中的地位和等级。因此,从“流空间”分析逻辑出发,打破了原有的垂直等级制度,更多地看到城市间协同互补的合作关系,使研究视角由地理空间转向要素空间,着眼于动态发展、开放互补的要素流动。因此,西方学者从互联网、邮件等信息流,飞机、公路、铁路和货运港口等交通流对城市网络进行研究,我国学者从新浪微博、微信、百度等视角对中国城市的结构进行研究[7]。 城市之间的联系是由各种要素流动的成果,考虑到人作为生产劳动的主体,对城市的发展有着至关重要的作用,人口在区域间的流动与变化可以真实地反映城市网络结构类型和强度,城市人口规模决定了城市基础设施建设的规模、可持续发展问题、区域经济发展问题。本文在已有学者研究的基础上利用腾讯位置大数据对中国大部分城市(354 个)进行网络分析,以期在一个新的视角下对全国城市的网络结构和等级进行研究和分析。
2 数据来源和研究方法
2.1 数据来源
腾讯位置大数据是目前国内重要的位置数据统计平台之一,其庞大的数据库是研究者重要的数据来源。本文以腾讯位置大数据 2018 年的人口迁徙数据作为研究对象,包括每个城市每日热度前十的人口迁入迁出路线,以及乘坐飞机、火车、汽车的迁入迁出数据,去除可能影响迁徙结果的国家法定节日和频率较低的数据,以此作为原始数据,通过城市网络研究方法,进行研究论证。
2.2 研究方法
社会网络分析是用于表达网络整体形态和节点特征的方法。度是通过测量一个节点在网络中的可达性,是一个节点在网络中的参与度,度越高证明一个点在网络中起到越重要的作用。提取城市节点在网络中的参与度和控制力是城市网络结构分析的基本内容。节点的连通性和控制性表征了网络对其的依赖性。中心性用于分析各个节点在网络中的地位和作用,表征一个网络结构对某几个关键节点的依赖性,处于网络中心位置的城市有利于其对资源、信息的集聚或扩散。控制力指标用于反映一个节点在其网络中对“流”的调度和控制能力,城市控制力体现为影响资源、信息等在城市中有效流通的能力。考虑到在网络中,一个中心城市往往承担着资源集聚和扩散两方面的功能,必须考虑到下一层级关联城市对于中心城市影响,因此本文使用转变中心性和转变控制力指标来衡量一个城市
的地位。
2.2.1 城市网络个体度量
借鉴已有的城市网络研究方法,计算城市的出度、入度以及度。城市 i i i的出度表示为: R i j R_{ij} Rij,入度表示为: R j i R_{ji} Rji,式中: R i j R_{ij} Rij表示以 i城市作为迁出地的迁徙路线个数, R j i R_{ji} Rji表示以 i 城市作为目的地的迁徙路线个数。
度表示为 i i i 城市的出度与入度之和。公式如下:
D i = R i j + R j i D_i = R_{ij}+R_{ji} Di=Rij+Rji
由于腾讯位置大数据统计的是热度前十的迁徙路线,本身就代表了具有强联系的城市个数,在去除掉频次较低的数据后,实际上就是具有较强联系且保持一定联系频率的时空轨迹数据,所以度是一个城市与其保持强联系的城市个数,度越高说明该城市与外界有着越多的人口流动联系,等级越高。
2.2.2 城市网络整体度量
使用转变中心性和转变控制力指标,度量一个城市在不同范围内的威望程度和等级。
转变中心性表示为:
A C i = ∑ D i × H i j AC_{i}=\sum D_{i}\times H_{ij} ACi=∑Di×Hij
转变控制力表示为:
A P i = ∑ H i j D i AP_{i}=\sum \frac{H_{ij}}{D_{i}} APi=∑DiHij
式中: D i D_{i} Di表示度, H i j H_{ij} Hij表示$ i 城 市 到 城市到 城市到 j $城市的频数
3 人口迁徙特征以及城市层级分析
对于人口流动的影响因素有许多,大部分学者认为经济发展是驱动人口迁徙的主要动力。吸引人口迁入的城市一般经济水平较高,可以提供更多的就业岗位、教育资源,对外开放的水平也更高。于此同时,我们也应该考虑时空因素对于人口迁徙的影响:
(1)节假日时期的人口迁徙方向不具有参考性,此时迁徙行为可能是旅游和探亲等出于偶发的行为,故本文不考虑节假日和迁徙热度低的迁徙数据。
(2)迁徙人口的数量与距离有关。中国人民对于乡土文化具有深度的认同,一般人们不愿背井离乡,所以对于寻找发展机遇的人来说,离其最近的中心城市往往就是目的地。 换言之,一个城市对人口吸引力和影响力往往与距离有关系, 这种影响范围可以通过迁徙人口出行的交通工具加以区分。本文将采用飞机、火车、汽车三种交通工具来说明一个城市的影响范围和对人口资源的控制能力。
3.1 人口迁徙规模特征
度是一个城市在多大程度上与外界交流的指标,也可以说是一个城市人口迁徙的活跃程度,这与城市经济发展水平、城市规模、行政等级、基础设施密切相关(图 3-1) 。
图 3-1 中国城市中心度分布图
排名前十城市间的度差距较大,靠后的城市度的差距并不大,呈现出长尾的特征,少量城市位于高值区,大部分城市数值低,且低值区城市间差异很小。 城市网络主要由北京、上海、广州、深圳等核心的城市构建,部分城市处于边缘位置,城市迁徙度大体上服从城市发展规律,城市等级越高人口迁徙度越高,对外联系越强烈,辐射能力强。人口流动特征与一个城市的方方面面有着千丝万缕的联系,尤其与一个城市的经济发展规模有着密切的关系。作为经济发展的重要因素,人口流动特征的巨大差异也导致了经济发展的差异。根据 2018 年各城市 GDP 数据,来验证“度”与 GDP 之间的关系(图 3-2) ,用 354 个城市的 GDP 作为自变量,度作为因变量进行回归分析,分析表明GDP 与度之间的相关系数为 0.891(𝑅2 = 0.7943),并在 0.01 的置信区间上通过了显著性检验,城市度与 GDP 呈正相关趋势, GDP 是衡量城市经济发展状况的指标,度与GDP 较强的相关关系体现出人口迁徙与城市经济发展规模具有一定的联系。
图 3-2 度与城市 GDP 相关性分析
3.2 全国城市层级结构特征
我国地域广大,区域之间存在着发展不平衡的差异,地区生活水平的差异推动人口迁徙,一般来说,人口主要流入经济发达的地区和城市,以追求更高的生活水平和发展空间。从这个角度来说,接受较多人口的城市经济发展水平高,城市规模大,基础设施完善,对外联系强等一系列特征,基于此,在 A r c g i s Arcgis Arcgis中利用自然间断分类得到全国网络层级(表 3-1)。
层级特征:(1)城市网络层呈现出多中心的特征,第一层级的城市有 6 个,构成空间上的多个中心,分别分布于中国的京津冀、长三角、珠三角、成渝,多个中心构成人口迁徙网络,承担着人口集聚和扩散的功能。
(2)层级越高内部差距越大。第一层级中,北京的迁徙度达到 457 为最高,武汉只有248,仅为北京的二分之一。第四层级中,差距均不大。说明即便同处于第一层级,但北京依然是全国城市之首,其他城市处于追赶地位。但随着粤港澳大湾区的建设,深圳呈现出及其强劲的发展态势,可以预见在未来一段时间内,深圳将会保持快速发展的势头,成渝地区作为西部大开发的重要平台、长江经济带的战略支撑点、一带一路的重要区域,经济发展活力越发强劲。因此,这些位于追赶地位的城市与北京的差距将会越来越小,层级内部差距也会进一步缩小,达成平衡的多中心网络结构。
(3)总体呈现金字塔结构,层级越低城市越多,大多数城市体系成熟的国家基本服从金字塔的层级规律。处于金字塔顶端的城市对于资源的控制和垄断能力远高于一般城市,然而金字塔型的等级构造表明了,大量处在金字塔中下级的城市起到了上下连接的作用,防止了网络结构收敛于少数几个高等级城市。
(4)高层级的城市一般是综合性的大城市,能够提供足够的发展空间和机遇,而工业城市和资源消耗型城市在此表现并不突出。此外,行政级别较高的城市因其能够较为容易获得稀缺资源,因此直辖市、省会城市等级普遍较高。
3.3 全国城市网络节点分析
人口迁徙活跃的区域主要在于北京-天津、上海-杭州、成都-重庆、深圳-广州等几大区域,这几大区域也是我国主要的经济、政治、文化的发展中心,而作为地区的首府,北京、上海、广州、深圳、成都等城市是人口迁徙的网络中心,会在不同程度上影响人口迁徙的方向和数量。而东北缺少人口迁徙活跃的城市,哈尔滨的度指数相当于北京的五分之一,低于西安、郑州、武汉等中西部城市,这主要是东北经济颓势和以重化工业为主的产业结构推动人口向经济发达区域流动,由此引起的人口结构失衡、劳动力缺失、人口老龄化等问题又会影响经济发展,人口问题已成为东北经济发展的主要限制因素。西北地区的人口较少,由于地缘文化因素导致其与内地的联系并不紧密,西北城市对于外界流动人口的吸引力不足,而自身又对本地区的人口产生了较大的推力,但西北人口集聚现象明显,人口普遍集聚在宁夏、青海、新疆等地区。东部城市在人口迁徙中的表现较为活跃,一方面是因为对外开放水平高,经济实力强,交通条件好,基础设施完善;另一方面是文化认同感较高,生活习惯和文化习俗一致。在愈演愈烈的人才引进政策中,虽然各方都进行了激烈的竞争,但显然东部城市占据着巨大的优势。
人口流动的活跃地区在分布上呈现出不均衡和集中性强的特点,度较高的城市多分布于沿海地区,以沿海向内陆递减。度较高的城市集中分布,以联合组团的方式形成城市群。区域分布与我国经济发展形势一致,京津冀、珠三角、长三角、成渝四大区域发展较好,中部地区依托省会城市与外界不断加强联系,作为门户的郑州、武汉、长沙的度较高,而东北与西北的人口流动各有特点,总体上均不活跃,经济发展也较为落后。
3.4 全城市网络结构及城市影响范围分析
在 2018 年内,除去节假日和迁徙热度低的 300 天迁徙数据,提取出 3879 条迁徙路线,平均迁徙频率 245.8,即每条迁徙路线平均使用率为 82%。入度前十位城市的平均入度为 121.1,即平均每个城市都与 121 个城市有直接的人口流动关系。 在空间上网络结构具有明显的特征(图 3-4) :
(1)人口流动主要在黑河腾冲一线右侧,东西差距极大,分割线以西,人口数量与城市数量都相对较少,经济发展水平较低,城市之间的联系相对较低,主要依赖省会或者门户城市的带动作用。
(2)区域组团特征明显,以京津翼、长三角、珠三角、成渝区域为核心区域构建起密度极高,关联性强的网络结构。尤其是核心城市与其周围城市形成关联极强的区域,说明了实际人口流动表现出小世界性。而地区与地区之间又及其不平衡,表现出中心性与地区非均衡性。总体上呈现出“南高北低”、“东高西低”的格局,从中心节点到网络边缘,迁徙热度显著变低,网络密度显著下降。
(3)迁徙热度与距离成反比,人口向边远地区的迁徙意愿不高,而新疆、西藏内蒙等地区由于地缘文化差异,迁往内地的意愿不强。故一个能吸引距离其较远的地区迁入的城市等级较高,如北京、上海、广州。一个影响范围大的城市表现在以飞机为交通工具的迁徙流网络结构基本覆盖全国主要城市,火车迁入网络结构基本覆盖黑河—腾冲一线以南的主要城市,汽车迁入方式基本覆盖区域内主要城市(图 3-5)。北京作为首都对全国人口资源的控制能力是首屈一指的,在长距离的人口迁徙上,北京表现出极强的吸引力,依赖北京形成的网络结构密集,同时其对周边地区的短距离人口迁徙也拥有极强的吸引力。因此从迁徙角度判断一个城市的地位时,往往要考虑三种交通方式的迁徙行为,全国中心城市三种方式皆具有较密集的网络结构,影响范围远,影响力最大;区域中心城市和省际中心城市飞机迁徙方式稍弱,火车迁徙方式在三者中为主要方式;地方中心城市飞机迁徙较少,以汽车迁徙为主,影响范围最近,主要以周边城市为主。北京、上海等城市以远距离高热度的人口迁徙为主,是人口迁徙的核心区域,能够对全国的人口产生吸引作用;成都、广州等城市以中距离高热度迁徙为主,主要是省际之间的人口迁徙;青岛、宁波、大连等城市主要是以短距离高热迁徙为主,主要是区域内的人口流动,该类型城市吸引力略逊与周边城市,往往只能吸引到周边区域的人口流入。
(4)从整体上看,人口流动主要集中于京津冀、长三角、珠三角、成渝的菱形区域内,四个区域形成了迁徙热度高、网络结构密度高、辐射范围广的动态网络结构。全国形成了多中心的网络模式,在空间上形成更加平衡的组织关系。
3.5 全国城市转变中心性与转变控制力
转变中心性和转变控制力将关联城市的影响考虑, 共同衡量了城市在网络中交换和支配资源集聚与扩散的结构性优势位置。 以往的研究表明,中心度最高的城市,即与城市节点联系最直接的城市,可以直接调动潜在网络资源的能力最高, 通过转变中心性与转变控制力的排序可以看到,排名靠前的城市基本是经济较为发达的综合性城市。转变中心性与转变控制力是衡量城市在网络资源交换和支配方面的结构优势的重要指标。中心度高的城市突出其核心地位,因此北京、上海、广州、深圳等位于前十的城市是全国城市网络的核心节点。转变中心性和控制力考虑了相关城市对城市度量的影响,这使得一部分与大型城市具有较强联系的城市排名有所上升,如三亚、青岛、佛山等。受空间距离上的影响,城市网络中的核心节点对其周边城市具有较强的提升作用,因此高中心性的城市在空间上的分布相对集中,尤其是北京-天津、成都-重庆、上海-杭州、成都-深圳地区,这种现象更加突出。而控制力较高的城市在空间上的分布相对均衡,一方面,转变中心性与控制力并不同步,北京转变中心性最高,但控制力并不是最高,原因在于影响范围不同,北京作为全国中心,影响范围涉及全国,正因为如此在资源的匹配上具有多种选择,人流、物流、信息流等要素流动频繁,网络结构趋于多中心发展,辐射能力强。而兰州作为西北部为数不多的大城市,对其周边区域的资源具有极强的控制能力,换言之,其周边城市在交换目标上没有太多选择。但总体上,城市的中心性与其控制力呈正相关。高中心性城市的控制力一般较高。也就是说一个能够很好地集散资源的城市,对资源的支配和控制能力更强。
3.6 转变中心性下的城市体系
根据城市影响范围,将全国城市分为全国中心城市、区域中心城市、省际中心城市、地方中心城市 4 个等级,四个等级城市数量比为 2:5:8:15,剩下 324 个城市在网络发挥的功能较弱。北京、上海等全国性质的中心城市的影响范围往往较大,网络结构复杂,其辐射范围基本覆盖全国城市,而一些特大城市作为区域的中心城市覆盖范围小于全国中心城市,但影响范围也较大,省际中心城市的影响范围一般局限于省份之内,此类城市一般是各省份的省会或者经济最发达的城市。地方中心城市网络结构简单,覆盖范围小。北京、上海是全国性中心,是我国城市发展的最高水平,在高端要素集聚和区域辐射能力方面继续领跑全国,具有重要国际影响力和竞争力。广州、深圳、重庆、成都、武汉紧随其后,发展态势良好。郑州位于第三梯队,作为中原城市群的核心,郑州拥有极大的发展潜力。目前郑州的发展程度不高,与同为中部城市的武汉相比还有一定差距,区域的辐射带动能力不足,但 2018 年郑州市经济总量突破万亿元,显现出中心城市的发展能力和奋起追赶的拼搏态势。下一步郑州应该充分发挥区位优势,以航空港为依托建立国际枢纽,大力发展口岸经济,并带动新乡、开封等周边城市的协同联动。同位于第三梯队的西安是我国著名的历史文化名城,又是一带一路的必经城市,是西部崛起战略的关键城市,但目前作为西北中心的辐射能力不足,远低于同位于一带一路的成都。西北城市群密度远低于中东部地区,人口数量也较少,迁徙度和中心性较低,因此在外部条件并不占优势的情况下,西安应该注重激发内在要素的流动,充分利用自身的文化软实力建设具有国际影响力的文化城市。成都与重庆,一个位于西南的核心地带,一个是西部唯一的直辖市,成渝双核式的发展沟通了西南城市群的整体联系,也辐射和带动周边城市群一体化发展。
4 结论与讨论
4.1 结论
通过腾讯位置大数据 2018 年中国 354 个城市的迁徙数据,建立了城市迁出度和迁徙网络结构,借鉴网络分析的方法对中国迁徙网络结构进行了分析,主要得到以下结论:
(1)我国城市呈现出多中心发展的趋势,城市多极化发展趋势明显。虽然北上广深依然占据绝对的金字塔顶端位置,但武汉、成都、郑州、西安等城市在国家战略扶持下,追赶势头迅猛。
(2)从网络节点看,由于城市在经济、人口、城市功能上的差异,城市之间的等级具有较大的差异。北京、上海、广州、深圳等对外开放水平较高的综合性大城市是网络的主要核心,一些经济较为落后的内陆地区成为网络中的洼地,处于边缘地带,丧失了新时代下经济发展的先机。我国城市呈现为人口富有和人口缺乏的两极分化,以人口流动为基础的鸿沟确实存在,然而要看到一带一路、西部大开发等国家层面的战略决策正在积极对抗分化。迁徙流网络表现出城市群体化,区域一体化程度逐渐加深。一个高等级的城市对其周围城市具有强烈的带动和提升作用,区域的联系逐渐加强。
(3)地区发展水平的差异推动迁徙流的形成,迁徙流在一定程度上可以说明城市对人口资源的集聚能力。空间距离是迁徙流的阻碍因素,阻碍的力度与城市等级成反比,一个城市能够对距离较远的城市起到吸引作用,表明该城市的等级较高。人口迁入全国性中心城市基本不受距离的影响,而等级较低的城市基本吸引不到远距离迁徙的人口。
(4)经济发达的区域,城市间的联系程度高,形成了一体化的城市网络,形成“小世界”现象,这些城市群是人口流动的主要方向,在城市群内部形成明显的空间异质性和层级特征,通过中心性和控制力可以表达城市节点的功能和等级,在分析城市产生的空间效应中具有重要的意义。
4.2 讨论
网络结构分析基于城市“流”之间的连接关系,强调城市对于资源的调配能力,使得城市外部交互关系以及扩散集聚功能得到重视,是一种城市体系分析的新角度。但目前对于城市网络分析有以下方面的问题值得讨论:
(1)城市的联系是复杂多样的,但目前对于城市网络分析往往局限于一种“流”,这将难以说明城市间的复杂联系,并使得城市在不同流的网络中具有不同中心性和控制力,因此,如何将多元流进行结合分析是以后网络分析一个值得思考的问题。
(2)不同的测度方法反映的方面不同,不同流的运作方式也各有特点,如何选择合适的测度方法检测不同流数据也是值得关注的问题。
(3)城市网络分析是“大数据”时代发展的必然结果,许多互联网公司拥有大量的城市空间信息,但很大一部分对外公开的信息中并未说明具体数据的计算过程,某些数据并不能真实反映城市的联系。因此,如何获取和处理数据将是城市网路分析的一大挑战。
参考文献
[1] Michelson R,Wheeler J O. The flow of information in a global economy: The roleof the American urban system in 1990.Annals of the Association of American Geographers,1994,84(1):87-107.
[2] Matsumoto H.International urban systems and air passenger and cargo flows: Somecalculations. Journal of Air Transport Management,2004,(10):239-247.
[3] Ho Shin K,Timberlake A. World cities in Asia: Cliques, centrality and connectedness. Urban Studies,2000,37:2257-2285.
[4] Goetz A R.Air passenger transportation and growth in the US urban system 1950-1987.Growth and Change,1992,23:218-2421.
[5] Malaki E J.The economic geography of the Internet’s infrastructure. Economic Geography, 2002,78(4):399-424.
[6] Townsend A M.Networked cities and the global structure of the Internet. American Behavioral Scientist,2001,44(10):1698-1717.
[7] 甄峰,王波,陈映雪.基于网络社会空间的中国城市网络特征—以新浪微博为例[J].地理学报,2012,67(8):1031-1043.
[8] 赵映慧,李佳谣,郭晶鹏.基于百度指数的成渝城市群网络联系格局研究[J].地域研究与开发,2017,36(4):55-59+129.
[9] 赵映慧,高鑫,姜博.东北三省城市百度指数的网络联系层级结构[ J].经济地理,2015,35(5):32-37.
[10]熊丽芳,甄峰,王波,等.基于百度指数的长三角核心区城市网络特征研究[J].经济地理 2013,33(7):67-73.
[11]侯贺平,刘艳芳,李纪伟,等,基于改进辐射模型的乡镇人口流动网络研究[J].中国人口·资源与环境,2013,23(8)107-115.
[12]李树茁,杨绪松,靳小怡,等.中国乡城流动人口社会网络复杂性特征分析[J].人口与发展,2006,13(5):13-22.
[13]蒋小荣,汪胜兰.中国地级以上城市人口流动网络研究—基于百度迁徙大数据的分析[J].中国人口科学,2017,(2):35-46.
[14]赵梓渝,魏冶,庞瑞秋,等.基于人口省际流动的中国城市网络转变中心性与控制力研究—兼论递归理论用于城市网络研究的条件性[J].地理学报,2017,72(6):1032-1048.
[15]赵梓渝,魏冶,王士君,等,有向加权城市网络的转变中心性与控制力测度—以中国春运人口流动网络为例[J].地理研究,2017,36(4):647-660.