水利信息化技术论坛将召开 中国电动汽车百人会论坛举行 关于开展环保优秀品牌企业...
要闻频道

清华大学战略环境评价研究中心何炜琪:要对环保大数据进行处理和分析才能变得有智慧

2017年11月07日作者:来源:中国环境网

20171104121256442860.jpg

 

  我这边结合我们自己战略环评的工作,把我们在环保实践方面,用大数据技术和智能化技术探索和应用,我们自己的心得和案例跟各位分享一下。

  今天我汇报内容大概包括简单大数据相关的背景,主流技术应用,以及大数据和智能化相关的案例,最后是未来展望。

  首先是相关的政策和工作背景。相信近两三年大家在各种媒体上都经常听到大数据这种名词,那么,其实在大量宣传和媒体推动背后,我认为是有国家大量政策推动,也可以看到从2012年开始,国家已经有相关大数据政策布局,2015、2016密集出台国务院和部里的政策文件,包括我们刚刚十九大习总书记在报告里面提到大数据相关要求。所以在这样的政策推动下近几年大数据研究和应用非常广泛,取得了很多成果,简单总结一下所谓的大数据应用特点。原来是小数据,现在说用了大数据技术进行分析。我们用了这样的技术之后,我们发现里面有三个很主要的特点,首先分析更多的数据,然后大家发现我们在分析数据的时候,研究人员不那么追求数据精准度,分析方法上不再去寻求因果关系,这是我们发现在应用大数据里面,三个很重要的转变。我们把它总结一下,它其实三种方法或者方式上的转变体系了我们思维上的转变,第一个体现了总体思维,我们分析问题,从原来的样本数据,过渡到全部数据,原来我们数据量很少,我们用一些抽样,用样本,用局部代替全体,用外推法等等,寻找规律,帮助我们决策。有了大数据之后,我们想尽办法,能不能拿到所有数据,看整体,这是全局思维。

  第二个容错思维,原来用样本数据的时候,经常做一件事,把有问题数据剔除掉,只保留最好一部分样本数据,供我们研究使用,有了大数据总体思维,希望把所有数据容纳进来,必然面临一个客观现实,现实世界里面大量数据是混杂的,有各种问题,有各种差异,我们要接受,用容错的思维,要追求一种宏观和总体性。

  第三个思维我们称作为相关思维,放弃了因果关系,关注相关性。大数据数据量很大,关系很复杂,我们寻找因果关系非常难,至少目前看来是。但是寻找相关性,相对来说容易得多,在实际实践里面,很多时候已经给我们足够的指导意义,现在的数据挖掘和分析,大数据应用里面,大部分用的是相关性的分析。这是大数据的一些特点。

  大数据应用到我们环保,我想现在它是把我们从原来的环保物联网到我们的目标,想实现我们的智慧环保,提供一个比较可行的路径,十年前我们开始做环保物联网,我们上很多传感器,上很多数据,那个时候想,很多人认为我们有大量的监控数据和实施数据,就能够实现智慧环保。后来我们有了这些数据发现怎么对这个数据进行处理和分析,得到有指导意义的信息,才有智慧。现在这个过程中,大数据和人工智能技术帮助我们看到实现的可能性:首先用大数据技术可以帮助我们把大量环保物联网数据更好进行整合,用云计算方法高效处理,用大数据技术,特别是人工智能技术对数据进行分析,帮助我们对数据进行预测。慢慢就揭示出智慧性,为我们实现目标提供可能性。我们认为像这么一种技术路线和这种结合有可能帮助我们提供整体的生态环境的形态研判,实现监测预报预警,提供便捷的服务,提升综合管理能力。

  说到大数据建设,我们一个很重要的指导思路和方法是我们环保部发布的生态环境大数据建设总体方案,里面的指导思想非常重要。最核心一点就是提出来大数据建设核心是改善环境质量,这样的指导方针是非常重要的。我们做大数据,并不是为大数据而大数据,也不是为了建一个很大的平台,构建很大的平台,我们做这么多工作目的是什么,为了提升我们的能力,为了解决问题,为什么解决问题,因为要改善我们的环境质量,我们在这么一个核心的指导思想之下,可能很多的思路,我们的方法,技术路线都要倒推回去,来思考我们究竟需要做什么,能做什么。

  主要的任务部里给我们提了很清晰的技术路线,从建设大数据平台,推进数据资源整合共享,加强生态环境科学决策,创新生态环境监测模式,完善生态环境公共服务,在这个过程里面提出了一些方向,包括环评大数据,监测大数据,执法大数据,应急大数据,网站大数据。我们部里面2016做了很好的探索方式,给地方做了榜样。

  配合大数据建设,系统平台的建设,我们认为还要配套着相关环保管理制度的完善。因为我们有新的技术手段,新的监管方式,我想我们应该配套新的管理制度,包括一站式污染源管理方式,统一环评监管模式等等。通过我们制度和技术的结合,互相推动,才能最终更有效地提升我们的管理能力,实现我们管理效能的提高。

  这个大数据的基础,是数据资源目录,只有通过数据才能谈环境大数据,这么多年地方做了很多尝试,现在手里有的数据越来越多,更多要扩充外部数据,把外部数据更多纳入进来,包括基于互联网+大数据,用户的信息,我们的基站信息等等。我们只有把数据真正做大,有了大数据基础,才能谈用什么技术实现什么样的目标。

  大数据的一些相关关键技术,应该说近几年已经越来越成熟。大数据比较研究是十年以前,近两三年我们已经有比较统一的解决框架和解决技术路线,包括我们的储存技术,实时处理技术,搜索技术,传输技术等等,在国外提供开源的框架方案。大家可以看到近两三年国内在积极跟进,基于国外的资源,我们国内出台了很多基础的、服务上的提供方案。为我们后续的大数据应用提供了很好的条件,因为很多时候不需要考虑如何实现基础的大数据的支撑是如何解决,我们更专注于我们的业务我们数据是什么,需要用什么方法分析什么样的结果。

  运用这些的大数据框架和技术,我们认为它能够从四个角度比较突出解决我们一些问题。第一能提升我们数据资源的获取能力,第二能加强数据资源整合能力,把不同的格式,不同结构整合一起。第三推动数据资源的共享服务,第四可以提高指挥决策统筹能力,用数据分析和自学习的方法。

  这里面我们逐渐尝试引用人工智能的方式,真正研究已经将近100年了,但是前面几十年没有很大的突破,近几年终于有了突破。从阿尔法狗开始,现在人工智能有新的方向,再利用到不同的领域里面去。人工智能为什么现在有这个爆发,是有前提的,首先要有大数据技术,要有海量数据供它学习,算法也会持法优化,经过几十年研究,从量变有质变。目前AI发展趋势,主要还是自主完成数据分析,自主做出判断和决策,优化算法。应用过程中考虑尽快用到实体世界的应用普及,甚至到个人场景应用,它特别需要学习,需要数据样本,需要不断地训练,才能越来越聪明。现在AI技术可以从几个方面给我们帮助,首先基于它强大的认知功能,能够自主区分情景,智能化保护生态环境的情况,因为它能够通过分析不同的因素,能够自主分析它属于什么情况,属于哪个情景和模式,进行相应推理。第二个结合机器学习,可以快速精准定位污染源,相当于学习执法人员的经验和判断方法,由它帮助我们做这些工作。第三能够比较准确地帮助我们预测行业的动态,促进资源合理分配,保证可持续性的发展,就是帮助我们更合理协调我们的资源,行业的结构和模式,可以有一些方案的比较,帮助我们在可持续发展道路上有更好的选择。

  做大数据和人工智能技术的时候,不可避免用到云计算的技术,也会用到互联网+,硬件的服务,软件的支撑平台都会有这些内容,所以这个大数据和我们的智能化应用跟我们这个会议的主题互联网都是密切相关的。而且互联网+这个因素加入进去之后,会对我们环境监督公开化,环境治理系统化,环境评价的大众化有很显著的促进作用,互联网对我们的环境保护目前的影响是深远的。

  那么应用了大数据技术之后,可以在空气质量监管等等方面都有很实质性支撑,帮助我们构建全方位的环境监管体系。还有一点,今天是基于很多媒体,互联网,结合大数据和AI技术,方便于网络舆情的监控,原来是基于关键字搜索。有了AI技术,可以对语义识别,对发出来的信息,不仅仅是知道关键字,可以知道这个人是什么情绪,是讽刺,还是批判。可以具体区分出每个信息的种类,还可以结合其他大数据,这个发贴人的位置,有没有发生相关政治事件或者事故等等,或者空气质量出现了雾霾,把事件加进去,甚至分析这个人个人大数据,在哪里,跟谁接触过,去过哪里,前前后后大数据都可以放在一起,基于这样的舆情的分析,将有变革性的成果。

  第三部分给大家简单介绍一下大数据和智能化,我们有一些探索和应用。对于战略环评很多同志不是很清楚,说到环评,可能更多接触的是项目环评,每个项目的每个工厂动工之前进行环评,这是点上的,每个点上它的环评,其实都是很微小的,如果只考虑一个点上的环评,每个点对环境影响很小,每年那么多项目上线,每个点叠加起来,对环境影响有多大,这么多点叠加之后,对工业结构,产业结构合理不合,这是项目环评本身解决不了的。很早之前国家提出来规划环评和战略环评,包括空间布局,产业结构,以后的人口规模,产业规模进行评价,从宏观角度规定这个区域发展模式,从最小的产业园区,到一个地市,到一个省,到像长三角,珠三角等等,这个做得越来越大。这些战略环评如何结合大数据技术更深入落地,是我们一直在探索的。

  我们国家做了十多年的规划环评和战略环评,做得很扎实,这些成果最后应用的时候,出现管理上的难题,归纳三点,第一战略环评成果非常多,专业性很强,很难使用。有很厚的报告,需要我们的工作人员研读,去理解各项的要求,前后的逻辑关系,才能用这本像法律文书一样的东西,指导后续工作,其实是很难。

  第二战略环评很多成果,毕竟是基于当初的年份做出来的,可以指导下一年,往往管的期限很长,五年,十年都有,用这个来指导工作五年十年不变,不科学的,这个成果本身需要定期更新调整,所以静态的环评报告是不足以支撑后续的业务化运行。

  第三个落实到具体工作上,我们项目越来越多,审批难度越来越大,需要高效的技术,不是由人学习环评报告,人工批,结合三点要求,我们利用大数据技术和智能化技术,做出了一些尝试。

  首先我们基于大数据的技术框架,按照部里面最新的战略环评三线一单要求,可以把大量的结构和要求,通过结构化,数字化,和大数据化,做到平台里面去,具体有什么要求,不用翻书,我们通过这个地图上,只要点击任何一个点,告诉你有什么要求,这是基础数据的管理。方便我们工作人员的使用。第二部分我们需要把日常业务环境业务数据用大数据模式把它都整合在一起,形成一个数据平台,包括我们水环境,大气环境,污染源,风险源等等核心的业务数据。所有数据纳入到统一平台进行监管和分析,一方面帮助我们管理人员进行管理,更重要是我们要基于这些业务数据动态分析我们战略环评的要求,比如说给出每年指标,每年末的时候要评估一下,看环境质量有没有按照预期改造,如果没有,明年指标要做更严格的调整,而不是用同样标准,指导未来五到二十年的业务。

  最后我们有战略环评的成果,如何用这些帮助项目的具体的环评审批,一个项目进来以后,通过战略环评成果,三线一单各种规则(包括生态保护红线、环境质量底线、资源利用上线,环境准入负面清单)要求等等各方面要求,都用我们的这种大数据基础,用AI智能分析技术,自动给你分析,哪个通过了,哪个没有通过,没有通过的原因是什么,可以怎么样修正它,把大量的信息提供给决策者,大幅度提高他们的工作效率,避免工作的遗漏。

  然后我们还进一步基于大数据基础,我们有大量历史环评的项目,包括本地和全国的。我们有可能来分析出来一个项目,它的绿色发展水平,就是单位GDP能效,水效,各种污染物排放强度,因为刚才说准入条件很多时候根据排污浓度决定的,但是浓度不高,不代表这个项目是好项目,也许根本产值很差,这种项目对于地方来说也是不值得推荐的,对于我们审核人员和管理人员来说,也很难判断上这样的项目,是不是一个优秀项目。但是放到历史大数据里面很容易看到,是江苏做的一个例子,给出三个档,江苏省平均和江苏省先进地市的平均,可以很快告诉你是怎么样,很容易判别筛选相应项目。

  这样一个平台,希望不仅仅给我们管理人员或者环保局在用,希望通过手机等等形式提供不同的功能,比如说环评编制人员,评审专家,招商引资的人员,企事业单位,每个人员都拥有不同的信息权限,帮助他们在不同的需求的范围之内,得到相应的数据的帮助和相应决策的支持。

  后面简单说一点其他的应用,我们在做战略环评的时候,对水环境进行综合管理,用大数据技术把流域的,全流域各种数据进行统一管理,对河网进行规划,用模型计算,评分,用大量的大数据技术整合,用AI技术对它进行评分和评估。这里面可以看到不同的数值,有哪些项目是通过的,哪些没有通过的。

  刚才说了水,现在说空气质量,现在很多地方做区域性的空气质量预警预报,如果精确到每个街道,如何做,这个时候不能用简单的气象场,把很多大数据内容放进去,包括气象数据,交通数据,基站数据等等,特别是兴趣点,把餐饮、购物各种人类活动涉及的点位融合进去,结合大区域空气质量的模拟,对它进行差值和细化,就能够做到具体街区里面每条街道,实时的甚至更细的空气质量的差值和模拟。同样方式,我们也可以做交通流的数据分析,也是基于视频监控信号,GPS信息、基站的信息、网约车的信息等等,包括用户属性信息,也进行叠加和分析,最后可以细化出来一个实时的每条街道的一个交通流量的模拟,从而识别出敏感的区域和点,而且做健康影响的分析和污染分析。还有噪声的大数据分析,基于交通的数据,举报信息,交通路网的信息,兴趣点的分析,用大数据技术方式对它进行模拟,从而实现城市噪声的一个失控分布,高精度的,可以到百米级,到小时的模拟。

  未来的展望,我们认为大数据和智能化使用目前正在越来越广泛,的确能给我们带来很多的帮助,觉得它可以帮助我们推动环境管理的战略转型,建立我们新体系,深化环保领域改革,利用信息化创新我们的环境管理,推动生活方式绿色化,最终帮助我们环境保护的大格局,都可以期待的。我认为对政府、企业、公众都有价值,对政府的价值,不仅仅是提升环保部门的业务能力,这是很重要的一块,不是全部。


编辑:宋阳