基于数据挖掘技术的区域大气污染联防联控范围划分新方法
发布时间:2018-09-30|作者:栏目:发表论文点击:

近年来,为应对日益严峻的大范围、持续严重雾霾污染我国借鉴欧洲、美国等发达国家经验,在全国范围内开展区域联防联控(JPCAP)已成为我国区域大气污染治理的重要战略举措。自201310月京津冀及周边地区大气污染防治协作机制正式启动以来,长三角区域、山东省省会城市群、昌九区域等区域紧随其后纷纷启动大气污染防治协作机制,但各区域联防联控实际进展缓慢,区域空气质量改善效果并不明显。造成这种局面的原因很多,其中联防联控区域范围界定不科学是重要原因之一。一个区域的空气质量同时受社会经济发展(经济发展水平、能源与产业结构、技术水平、人口规模等)和自然环境(地形地貌、风速风向、温度、湿度等) 等因素影响,并随时间变化而动态变化。因此,如何全面考虑这些因素、科学界定JPCAP区域范围成为促进JPCAP实施进程并提高其有效性的关键。而近年来污染监测网络日益完善、获得长期海量监测数据成为现实,为本研究提供了新的契机。鉴于此,本文提出了综合运用相关性分析、回归分析、聚类分析等数据挖掘技术进行大气污染联防联控区域划分的新方法,应用到中国长三角区域15个城市的细颗粒物PM2.5和臭氧O3污染联防联控的实证案例。

一、研究方法

针对一个包含m个城市的大区域R的某种大气污染p,本研究采用线性回归分析相关性分析和聚类分析等数据挖掘技术对m城市的海量长期污染监测数据进行深入挖掘城市为基本划分单元,将R划分为若干联防联控子区域具体步骤如下

Step 1采用一元线性回归分析识别各城市对R区域的污染影响程度,将污染贡献较大的城市作为参与联控区域划分的候选城市。以某城市的污染物p的日均浓度(Xp)为自变量,以R区域的污染物p的日均浓度(Yp)为因变量进行一元线性回归,回归方程Yp=Xp+ b斜率a越大,表明该城市的污染浓度变化对区域Rp种污染物的影响越大。给定一个判别临界值a0,当回归方程的斜率a> a0对应的城市即可作为联防联控区域划分的候选城市。

Step 2:对候选城市的长期污染数据进行相关性分析,求得城市间污染相关系数矩阵M。基于长期污染监测数据,计算任意两城市xy的皮尔逊相关系数r如式1),r值越接近于1,说明两城市之间的污染相关性越高,意味着它们彼此间的污染传输水平越高,或它们在污染排放特征方面存在较高的一致性。

 

其中cxcy分别代表城市xy的污染物浓度,Cov(cx, cy)xy污染浓度的协方差,σ为标准差,E(·)代表数学期望。

Step 3:以城市为变量,以相关系数矩阵M中的r为观察值,对候选城市进行聚类分析,聚类后得到的类Clusters即为区域R的联防联控子区域。

二、实证研究结果

长三角区域季易爆发严重雾霾污染季常爆发严重的臭氧污染,是我国推行重点区域联防联控的区域之一。本研究长三角区域15个城市为研究单元,包括上海(SH)、浙江省的杭州(HAZ)、湖州(HUZ)、嘉兴(JX)、绍兴(SX)、宁波(NB)、台州(TZZ)和江苏省的南京(NJ)、苏州(SZ)、无锡(WX)、常州(CZ)、扬州(YZ)、镇江(ZJ)、泰州(TZJ)、南通(NT),他们都有着密集的人口、发达的经济、交通、建筑业等,如图1所示。

 

1 长三角区域15市的污染水平及地理分布图

1展示15PM2.5O3整个区域的贡献水平的回归分析结果。显然,各城市PM2.5对应的斜率均不低于0.724说明各城市污染浓度变化对整个区域影响很大,因此可将15全部纳入联防联控候选城市群。对于O3,所有回归方程的斜率均介于0.4280.537之间,说明各城市O3浓度变化对整个区域O3污染水平的影响程度较弱。为了识别哪些城市可能会被划分在一起从而组成一个新的小范围的O3联动区域,仍然将15个城市均作为O3联动候选城市。

1 长三角区域与各城市污染浓度的线性回归结果

 

城市

线性回归方程

R2

P

PM2.5

SH

Y=14.290+0.757 X

0.785

<0.001

HUZ

Y= 8.133+0.861 X

0.834

<0.001

HAZ

Y= 9.772+0.828 X

0.724

<0.001

JX

Y=5.937+0.924 X

0.885

<0.001

SX

Y=9.827+0.821 X

0.718

<0.001

NB

Y=16.166+0.866 X

0.755

<0.001

TZZ

Y=21.020+0.808 X

0.458

<0.001

SZ

Y=6.566+0.830 X

0.914

<0.001

NJ

Y=13.189+0.734 X

0.832

<0.001

WX

Y=4.579+0.824 X

0.937

<0.001

YZ

Y=9.292+0.832 X

0.788

<0.001

CZ

Y= 11.095+0.740 X

0.928

<0.001

ZJ

Y=8.570+0.780 X

0.841

<0.001

NT

Y=12.991+0.739 X

0.818

<0.001

TZJ

Y= 10.928+0.724 X

0.796

<0.001

O3

SH

Y= 11.211+0.504 X

0.760

<0.001

HUZ

Y= 17.558+0.428 X

0.790

<0.001

HAZ

Y= 19.582+0.475 X

0.761

<0.001

JX

Y= 13.949+0.458 X

0.787

<0.001

SX

Y= 25.946+0.437 X

0.688

<0.001

NB

Y= 10.970+0.537 X

0.701

<0.001

TZZ

Y= 14.984+0.509 X

0.557

<0.001

SZ

Y= 14.983+0.506 X

0.848

<0.001

NJ

Y= 18.838+0.448 X

0.773

<0.001

WX

Y= 16.084+0.484 X

0.825

<0.001

YZ

Y=11.387+0.489 X

0.740

<0.001

CZ

Y= 21.353+0.459 X

0.663

<0.001

ZJ

Y= 18.191+0.433 X

0.760

<0.001

NT

Y= 7.830+0.522 X

0.773

<0.001

TZJ

Y= 16.519+0.473 X

0.716

<0.001

215市任意两个城市之间两种污染物的皮尔逊Pearson相关系数矩阵对角线下方为PM2.5污染相关系数,对角线上方为O3污染相关系数。显然,无论是PM2.5还是O3,任意两个城市的污染相关系数均在0.01显著水平上通过检验。

2 皮尔逊相关系数矩阵

 

SH

HUZ

HAZ

JX

SX

NB

TZZ

SZ

NJ

WX

YZ

CZ

ZJ

NT

TZJ

SH

1

0.79*

0.77*

0.90*

0.74*

0.83*

0.73*

0.88*

0.74*

0.84*

0.73*

0.71*

0.78*

0.89*

0.77*

HUZ

0.77*

1

0.91*

0.90*

0.83*

0.79*

0.70*

0.92*

0.86*

0.91*

0.81*

0.82*

0.82*

0.78*

0.80*

HAZ

0.63*

0.88*

1

0.90*

0.89*

0.85*

0.77*

0.88*

0.80*

0.85*

0.76*

0.79*

0.75*

0.73*

0.72*

JX

0.90*

0.88*

0.81*

1

0.82*

0.88*

0.77*

0.92*

0.79*

0.87*

0.76*

0.78*

0.77*

0.81*

0.75*

SX

0.68*

0.83*

0.93*

0.84*

1

0.79*

0.70*

0.81*

0.74*

0.79*

0.69*

0.65*

0.73*

0.71*

0.73*

NB

0.80*

0.81*

0.81*

0.88*

0.85*

1

0.86*

0.83*

0.70*

0.77*

0.68*

0.71*

0.69*

0.73*

0.66*

TZZ

0.56*

0.60*

0.69*

0.63*

0.67*

0.73*

1

0.71*

0.61*

0.68*

0.61*

0.61*

0.61*

0.65*

0.61*

SZ

0.93*

0.86*

0.75*

0.94*

0.76*

0.83*

0.62*

1

0.87*

0.96*

0.84*

0.85*

0.85*

0.87*

0.84*

NJ

0.71*

0.84*

0.79*

0.81*

0.74*

0.72*

0.55*

0.83*

1

0.89*

0.91*

0.81*

0.90*

0.80*

0.86*

WX

0.89*

0.89*

0.78*

0.93*

0.78*

0.82*

0.58*

0.97*

0.88*

1

0.88*

0.90*

0.89*

0.87*

0.86*

YZ

0.71*

0.76*

0.70*

0.75*

0.67*

0.65*

0.52*

0.80*

0.89*

0.82*

1

0.82*

0.89*

0.82*

0.90*

CZ

0.84*

0.86*

0.77*

0.88*

0.75*

0.79*

0.59*

0.93*

0.90*

0.96*

0.89*

1

.075*

0.74*

0.70*

ZJ

0.75*

0.79*

0.72*

0.80*

0.70*

0.68*

0.49*

0.83*

0.92*

0.88*

0.95*

0.91*

1

0.85*

0.90*

NT

0.92*

0.76*

0.62*

0.84*

0.64*

0.74*

0.55*

0.90*

0.76*

0.89*

0.80*

0.89*

0.83*

1

0.89*

TZJ

0.77*

0.74*

0.65*

0.76*

0.64*

0.65*

0.51*

0.83*

0.83*

0.85*

0.92*

0.90*

0.92*

0.89*

1

*. Correlation is significant at the 0.01 level (2-tailed).

对角线上方为“城市对”的O3相关系数,下方为PM2.5相关系数

2a)是对PM2.5联动候选城市的聚类树状图,15市被分成4组,每一组内城市间的污染相关性特征最相似,即每一组就是长三角区域的一个联动子区域。由此,长三角可划分为4PM2.5联动子区域,分别为R1={苏州、无锡、常州、嘉兴、湖州、上海、南通}R2={扬州镇江泰州南京}R3={杭州、绍兴、宁波}R4={台州}。同理长三角区域的15O3联动候选城市可划分为9O3联控子区域,分别为R1={苏州、无锡湖州}R2={杭州嘉兴}R3={上海}R4={南通}R5={南京扬州镇江泰州}R6={常州}R7={绍兴}R8={宁波}R9={台州},如图2b)所示。长三角区域的4PM2.5联控子区域和9O3联控子区域的地理分布示意图如3所示。从联防联控范围划分结果易知,臭氧具有小范围局地污染特征,因此更适合在小范围内开展联防联控。

 

2 长三角区域联动候选城市聚类树状图

 

3 长三角区域PM2.5O3联控子区域划分

三、研究结论与对策建议

PM2.5自身的物化特性决定其在空气中易长时间悬浮并随风传输,适宜在较大的区域范围内开展联动治理。在长三角4PM2.5联动子区域中,R1={苏州、无锡、常州、嘉兴、湖州、上海、南通}R2={扬州、镇江、泰州、南京}的范围均较大R3={杭州绍兴宁波}R4={台州}范围较小,这是由于R3R4污染水平相对低,且均处于西北风向末端的临海位置,自然扩散条件较好,且受来自西北内陆脏气团污染输入的影响比较小。R2处于长三角区域西北部受西北内陆污染输入的影响较大,R2的经济发展中石油、化工、黑色金属、有色金属等6大高污染行业扮演重要角色,扬州、镇江、泰州、南京应加强产业结构调整和优化,强化对高污染行业尤其是化工、石化等的污染治理。R16大高污染行业的石化、化工行业经济贡献远低于R2,而大气污染排放较小的计算机通信和电子设备业、纺织和服装业相对发达。

PM2.5不同,长三角被细分为9个范围较小的O3联动子区域,R1={苏州无锡湖州}R5={南京、扬州、镇江、泰州}外,其它7个子区域所包含的城市均不超过2,说明O3属于小范围局地污染快速的工业化和区域一体化进程使长三角区域内各城市资源及生态环境具有共性特征,各城市自然地理条件相仿、生态功能特征相似,大气环境问题相近,区域内一江、一湖、一海(即长江、太湖、东海)以及纵横交错的水网将苏浙沪生态环境牢牢地嵌套成为一个唇齿相依的整体,这些条件也极易使O3污染在各城市间呈现出一荣俱荣、一损俱损的共性特征。因此,对呈现小范围局地污染特征的O3污染治理,我们可将具有共同污染特征的城市作为一个小范围联控子区域,针对域内各城市O3污染的前体物污染排放源实施统计规划、统一监测、统一监管、统一评估和统一协调的管控措施,降低O3生成率。

上述分析表明,本章提出的联动范围划分方法,既充分考虑了污染因子自身特征各城市的经济发展水平工业结构城市化水平人口规模行政区划等社会经济因素作用,又兼顾了各地相对地理位置、自然气候条件等影响空气流域分布的的影响克服了国内外现有区域划分方法的缺点,比仅根据污染水平表象特征、或仅考虑空气流域的影响因素、以及仅考虑行政区划因素的划分方法更科学,所划分的联动范围更精准,更有利于管理和协调,进而更有利于提高整个长三角区域联动治理的战略有效性。

撰稿人:浙江财经大学中国政府管制研究院 谢玉晶 博士

原文《Methods for defining the scopes and priorities for joint prevention and control of air pollution regions based on data-mining technologies》,作者:谢玉晶赵来军薛俭等,刊于《Journal of Cleaner Production2018年第185