基于随机森林算法探析光伏设施规模规划问题

(整期优先)网络出版时间:2023-09-23
/ 3

基于随机森林算法探析光伏设施规模规划问题

周晓宏  杨俊峰

广东省城乡规划设计研究院有限责任公司  广东广州   510290

摘要:本文研究是基于随机森林算法,结合GIS平台(地理信息系统)分析太阳能资源、土地资源、市政设施、电力系统等空间地理信息,以研究太阳能光伏发电及供需系统预测,以基于人工智能技术解决太阳能光伏发电站发电规模的数据支撑和电网接入资源分配问题。

关键词:光伏设施规划电网接入随机森林算法

AnalysisofPhotovoltaicFacilityPlanningBasedonRandomRorestAlgorithm

ZHOUXiaohong,YANGJunfeng

(GuangdongUrban&RuralPlanningandDesignInstituteCo.,Ltd.Guangzhou510290,GuangdongProvince)

Abstract:ThisresearchisbasedonRandomforestalgorithm,combinedwithGISplatform(geographicinformationsystem)toanalyzespatialgeographicinformationsuchassolarenergyresources,landresources,municipalfacilities,andpowersystem,tostudysolarphotovoltaicpowergenerationandsupplyanddemandsystemprediction,andtosolvethedatasupportandgridschedulingproblemsofsolarphotovoltaicpowerstationpowergenerationscalebasedonartificialintelligencetechnology.

Keywords:photovoltaicfacilityplanning,powergriddispatching,Randomforestalgorithm

一、研究背景

随着光伏发电技术进步和产业化步伐的加快,光伏发电装机规模大幅提高,展现出良好的发展前景,但随着应用规模的不断扩大,在高比例的光伏发电能源接入必然对电力系统可靠性以及城市空间规划带来影响。一是土地资源约束光伏项目落地。光伏发电受到土地资源、生态红线、水利、林业、海域使用等因素制约,随着生态文明建设要求的不断提升,光伏发电建设在土地资源等方面约束进一步趋紧,存在项目找地难、落地难、推进难等情况,发展空间受到一定限制。二是高比例光伏发电对电力系统的冲击。大规模不可调度的可再生能源并网消纳是是阻碍光伏发电建设的主要原因之一。在传统电力规划负荷预测上通常采用指标法和空间域电力预测,导致产业电能消纳弱、电力电量不平横,加之大规模光伏发电馈入电网、远距离传输,必然对会给电力系统的稳定和能源安全带来一定挑战,这些挑战包括宽频带振荡、换相、调峰等。

二、研究内容

人工智能与机器学习的相关技术已在可再生能源选址、负荷预测、电力系统故障诊断与优化调度、电网数据可视化等方面获得了广泛的应用。本文主要从随机森林算法分析影响光伏发电气象因子进行发电负荷预测以及供需系统的电网调度探析。

2.1指标分析法不再满足高质量光伏设施负荷预测规划

光伏电站设施科学规划设计是作为本论文研究的目的,分析目前研究一般采用用地指标法来进行负荷预测,主要通过需求侧和用地规划来预测光伏变电站的发电规模。但过去在光伏变电站设施规划出现的问题:一、在规划方案制定过程中,一味的追求节能减排效益,过多的考虑清洁能源或可再生生能源应用,忽略了这些节能新技术较高的固定成本带来的整体


经济效益的下降,这种以节能减排目标为导向的规划方法,导致规划在实施过程中,提出的节能指标过高,往往难以被大众所接受,使得预期的规划方案难以落地;二、将微尺度的区域能源规划思路照搬到广域范围的能源规划中。由于作为规划对象的部分区域具有地域广、地块数量多、建筑功能复杂、可利用能源形势多样等特点,各地块之间的能源系统相互独立,这就使得区域内的能源系统方案可以有非常多的排列组合,难以采用传统的“提出方案-分析方案-确定最优方案”的解决途径。

所以,需要科学筛选影响光伏发电特征贡献度后进行光伏电力系统供需负荷预测,预测结果指导光伏电站,同时亦可作为电网调度问题的的理论依据。

2.2随机森林算法在光伏发电特征筛选的优势分析

随机森林是一种集成算法,属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使整体模型的结果具有较高的精确度和泛化性能。影响光伏发电气象因子的数据库具有特征变量明显,而数据量不多的特点,因此随机森林可通过有放回的重复采样(Boost-rapSampling)方式,从初始样本B集中随机抽取若干个样本生成新的样本子集,然后根据各个子样本生成k个决策树组成的森林组合,其本质是一种组合决策树算法,通过将多个决策树排列组合,获得泛化学习能力更强大的模型。本次重点研究该算法在光伏发电特征贡献度的实用性和精确性。

未命名文件(5)

图1Bagging型结构图及数据分类逻辑

2.3构建模型基本原理

随机森林在数学上的定义,比如现有由h1(x),h2(x),……hk(x)构成的随机森林。

边际函数定义:

(2-1)

边际函数表示的意思是,在正确分类的情况下得到的票数比在不正确分类的情况下得到得票数多的程度,显然,函数越大,说明原分类器分类效果越可靠。

泛化误差定义:

(2-2)

代表概率定义空间。

随机森林边缘函数:

(2-3)

是正确判断的概率,为错误判断的概率最大值。

每棵决策树生成随机森林时,总是有一个初始数据集和没有被抽取的数据集表示x在的比例。即:

(2-4)

为正确分类的概率估计,由此可对对随机森林强度和相关性进行分析。

随机森林强度定义:

(2-5)

将式(2-4)代入式(2-5)得:

(2-6)

随机森林相关度定义:

(2-7)

的OBB估计,的OBB估计。

计算公式如下:

(2-8)

(2-9)

将式(2-8)和式(2-9)带人式(2-9)得:

(2-10)

随机森林的性能体现在其收敛程度、强度和相关程度。收敛性在于决策树的泛化误差都收敛,出差会有上限,这说明随机森林对未知事物具有良好的适应性,不会造成很大的误差,也不易造成过拟合。

由上述可见,随机森林的泛化性良好,所以在构造特征值明显的光伏发电预测模型中可减少因数据量不多而导致的误差值。

2.4基于随机森林算法探析光伏设施发电负荷预测与设施规划技术路线

2.4.1研究方法思路:

(1)现状分析:分析目前光伏发电站现状问题及建设情况

(2)数据库建立:收集某试验区光伏发电相关数据,建立数据库

(3)案例分析法:分析影响光伏发电的主要因素,初步筛选特征值

(4)借鉴复现法:复现相关论文及优化基于随机森林对光伏发电特征值贡献度

(5)组合创新:基于随机森林算法学习器单独学习,筛选组合一套以提高光伏负荷预测精度的集成学习算法模型

(6)模型校验:用较为成熟的GIS平台进行负荷预测并与集成学好算法对比分析

(7)利用光伏预测模型指导光伏设施规划建设

未命名文件(8)

图2基于随机森林算法探析光伏设施发电负荷预测技术及指导规划路线

2.4.2关键技术:

(1)关于光伏发电与历史气象数据的分析和建立数据库

(2)对光伏发电特征贡献度的分析和其神经网络学习内容

(3)筛选组合多元化算法以提高光伏发电负荷预测的精度

(4)获得基于人工智能技术的数据导入GIS平台进行空间域分析

2.4.3创新点:

目前从业务分析上,影响光伏电站选址因素权重普遍是基于专家意见投票,无法避免存在主观性;也还有不少学者对不同算法进行科学分析,但往往缺少对空间域、经济适用性等人文因素分析,本文研究创新点是结合人工智能算法和GIS平台空间域的分析,以提高科学研究的实用性。

2.5实验过程

本次研究实验在Python3.10编写语言环境,导入粤港澳湾区某地方光伏-气象数据数据库(公开)进行学习判断。数据初步筛选的输入特征包含天气数据与历史数据,其中天气数据为从数值天气预报获得的7个特征变量,包括湿度、气压、空气密度、表面温度、太阳辐射强度、平均露点、云覆盖率。

由表2-1,所选择的备选特征都具备良好的特征贡献度。其中太阳辐射强度、表面温度、云覆盖率是对光伏预测影响较大的天气因素。其中太阳辐射强度贡献度达0.38,表面温度贡献度0.28,云覆盖率0.2。

实验结果:

(1)横向对比其他同类研究成果,数据成果具有参考性

(2)科学性说明在光伏设施规划布置除重点考虑太阳辐射强度外的其他气象因子的重要性

(3)模型成果具有一定广泛适应性,在光伏设施规划用地具有理论支撑

(4)学习模型是具有迭代性,可随着数据库更新而迭代

三、结论

目前光伏发电站存在峰值无法并网消纳等问题,这种问题的出现往往只在供能侧对光伏电站规模进行研究,本研究主要运用了随机森林、集成学习等人工智能理论。通过复现已有关于随机森林筛选影响太阳能光伏发电特征值贡献度理论的成果,重新筛选出实验区域的特征值贡献度,并讨论以此为理论依据影响对太阳能光伏发电站进行选址规划的可行性研究。通过多模型学习器融合,筛选组合一套基于stacking结构的集成学习以提高光伏发电系统供需能的负荷预测,以提高关于光伏发电系统负荷预测的精度,并通过指标法和空间域电力预测法进行校验。

但是在理论实验研究过程中,光伏发电量数据往往是电能企业保密数据,在构建模型中数据量有限,分析出的特征值具有局限性。虽然在现行构建模型方法来对光伏设施规划具有一定指导性,在接下来的研究中,更需着重数据量的分析和模型的优化以提高规划设计系统的使用性能和适用性。

参考文献

[1]张冰.集中式地面并网光伏发电站选址因素分析[J].价值工程,2015,34(29):256-257.DOI:10.14018/j.cnki.cn13-1085/n.2015.29.099

[2]史佳琪.区域综合能源系统供需预测及优化运行技术研究[D].华北电力大学(北京),2019.

[3]史佳琪,张建华.基于深度学习的超短期光伏精细化预测模型研究[J].电力建设,2017,38(06):28-35.

[4]方匡南,吴见彬,朱建平,谢邦昌.随机森林方法研究综述[J].统计与信息论坛,2011,26(03):32-38.

[5]TinaG,GaglianoS,RaitiS.Hybridsolarwindpowersystemprobabilisticmodelingforlong-termperformanceassessment[J].SolarEnergy,2006,80(5):578-588.

[6]DeshmukhMK,DeshmukhSS.Modelingofhybridrenewableenergysystems[J].RenewableandSustainableEnergyReviews,2008,12(1):235-249.

作者简介:周晓宏(1993—),男,研究生,工程师,主要研究方向为新能源设施规划及人工智能技术。