«

»

Nov 01 2014

对北京PM2.5数据的初步分析

抛砖引玉。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

美国大使馆提供了自2008年4月8日以来,到2014年8月31日的中国主要城市pm2.5历史数据,包括一天24小时,365天。

数据链接:http://www.stateair.net/web/historical/1/1.html

根据这一数据,我采用最简单的OLS回归分析方法进行了简单的计算,结果很有意思。

首先,pm2.5的统计量均值为97.7,和其他数据的估计基本吻合。

Variable Obs Mean Std. Dev. Min Max
pm25 50478 97.73793 88.20039 0 994

 

其次,我构建了若干潜在的解释变量,比如

  • 用白天(8~20点)来刻画一般性的人类活动;
  • 用rush_hour(7~10以及16~19)刻画与私家车出行以及堵车的相关影响;
  • 用冬季采暖期winter_heat来控制冬季燃煤采暖;
  • 用春节假期(初一到初六),国庆长假(10月1到7日),和2008北京奥运会比赛日,来控制周边地区工厂生产的因素;
  • 另外,我控制了年变量(2008年为基准)和月变量(1月为基准)。

回归结果如下:


结果表明,

  • 高峰期变量不显著,表明堵车对污染物排放的影响也许不显著,也许在时间上有滞后。
  • 白天的污染水平比夜晚显著偏低,且点估计超过平均污染水平的10%。这个我无法解释,也许光照对控制pm2.5有帮助。
  • 冬季采暖的对污染物排放的贡献显著。
  • 国庆节、春节、奥运会期间的污染排放显著偏低,特别是春节,平均可降低三分之一。
  • 从2008年以来的污染水平没有明显的改善/恶化趋势。
  • 以月份看,4、5、8、9四个月的污染水平相对较低。