编辑: 笨蛋爱傻瓜悦 2013-03-26

2005 年以来全省约2500 个厂站的超过40

000 只电表的上下网电量数据和关口计量数据.(4)外部数据.自

2006 年以来全省13 地市71 个气象站10 min / 点的温度、湿度、雨量、风速等气象数据,以及江苏13 地市54 县的宏观经济数据.2.2 配用电大数据的预处理从大数据平台目前集成的所有数据类型来看, 脏数据 主 要有3种大类型,11 个小类,如 表1所示.表1 脏 数据 类 型Tab.1 Type of dirty data 脏数据 类型详细分类负荷数据缺点数据缺失电量数据为空温度数据为空负荷数据异常(跳大数、跳小数)负荷数据为负值数据异常负荷数据超容电量数据异常(跳大数、跳小数)电量数据为负值温度数据异常数据不同步负荷数据采集频率不同(24 点、48 点、96 点)负荷数据与温度数据频率不同(温度10 min/ 点,负荷15 min/ 点)数据异常从某种程度上来说,与数据缺失的结果是类似的,因此针对需预处理的3种数据类型,分别提出了两种不同的数据清洗方法.2.2.1 数据缺失/异常的清洗方法数据缺失/异常的清洗主要采用了替代法和插值法.(1)插值法.负 荷数据缺点(异 常 )较 少时,可以基于当日负荷曲线,采用插值法(如 拉格朗日插值、三次样条插值等)实 现负荷曲线的补全;

电量数据缺点(异常)较 少时,可以基于当月电量曲线,采用插值法实现电量数据补全.(2)替代法.负 荷数据缺点(异 常 )较 多,无法采用插值法时,可以用相似日(工 作日选取上一周工作日,周末选取上一周周末)同 一时段负荷数据替代;

电量数据缺点(异 常 )较 多时,可以用相似日(工作日选取上一月工作日,周末选取上一月周末)的电量数据替代;

温度数据为空时,处理方法类同负荷数据缺点.2.2.2 数据不同步的清洗方法数据不同步的情况下,通常采用平均值法、强制同步法进行数据清洗.22(1)平均值法.由 于极少部分终端采集频率为48 点/日,因此需要将48 点负荷数据扩展为96 点负荷数据,可以采用平均值法(如 8:

45 的数据取为8:

30 和9:

00 的平均值)进行数据扩展.(2)强制同步法.温 度数据为10 min / 点,而负荷数据15 min / 点,强制将00:

10 的温度数据与00:

15 的负荷数据匹配,00:

30 的温度数据与00:

30 的负荷数据匹配,00:

40 的温度数据与00:

45 的负荷数据集匹配,以此类推.3多维用电影响因素模型的构建3.1 模型构建的总体思路用电量受气象因素、节假日、经济形势等众多因素的影响,因此筛选合适的影响因素加以分析,建立精确的用电影响因素模型,是分析用电特性、开展用电预测的基础.由 于经济数据发布频率太低,而且经济环境在一段时间内相对于气象因素而言比较稳定,因此本文只考虑气象因素和节假日建立用电影响因素模型.用 电影响因素模型的总体构建思路如图2所示.图2用电影响因素模型构建思路Fig.2 Construction of electricity consumption impact model 模型构建思路主要包括以下4个步骤:(1)原始数据收集和清洗.收 集电量、负荷数据,历史气象信息和节假日数据,按2.1 ~2.2 所述方法处理电量和负荷数据,按2.3 处理气象数据,根据历史节假日前后电量数据适当增加节假日的长度(如春节假期规定7d, 但实际上春节前一周、后两周很多行业都处于停工状态),得到清洗后的各项数据.(2)相关因素分析.逐 一计算气象因素、节假日与电量、负荷的相关系数,得到与电量、负荷相关性最高的影响因素.(3)数据标准化处理.获 取(1)中清洗好的温度、电量(负荷)数 据,计算得到各温度档位下的平均电量(负荷),绘制温度电量(负 荷 )影 响曲线,将电量(负荷)走 势较为平缓的温度区间作为基准电量(负荷)温度区间.(4)用电影响模型构建.以 ℃ 为单位,将各温度区间下的电量(负荷)进 行归类并计算平均值,对于负荷模型还要考虑分时特性,得到电量温度影响模型、负荷温度影响模型等.3.2 相关因素分析........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题