第4 4卷 第8期 2 O 1 7 年8月 湖南大学学报(自然科学版) Journal of Hunan University(Natural Sciences) Vol_44,No.8 Aug.2 0 1 7 文章编号:1674—2474(2O17)O8一O145一O7 DOI..10.16339/j.enki.hdxbzkb.2017.08.022 面向群智感知车联网的异常数据检测算法 徐艺文,徐宁彬,庄重文, 陈忠辉 (福州大学物理与信息工程学院,福建 福州 350116) 摘要:群智感知车联网利用普通用户的手机或平板电脑等智能终端获得交通数据,解 决了车联网以低成本获取足够数据的问题,但却凸显了数据“质”的问题.为此,在分析群智 感知车联网的数据结构及数据异常特点的基础上,提出一种适用于群智感知车联网的异常 数据检测算法,并依此剔除异常数据,提高数据质量.算法利用核密度估计理论对车联网数 据的概率密度进行估计,进而构建信任函数计算被检数据的信任度,后根据统计学理论将信 任度小于0的数据判定为异常数据.最后对该算法的可行性及性能进行了仿真,结果表明该 算法的性能可满足实用需求,且对比传统的统计检测法在检测率和误检率上具有更好的 性能. 关键词:车联网;群智感知;异常数据检测;核密度估计 中图分类号:TP391 文献标志码:A An Algorithm of Abnormal Data Detection for Internet of Vehicles Based on Crowdsensing XU Yiwen,XU Ningbin,ZHUANG Zhongwen,CHEN Zhonghui (School of Physics and Information Engineering,Fuzhou University。Fuzhou 350116-China) Abstract:Internet of Vehicles(IoV)based on crowdsensing technology,which gets traffic data by sm— artphone or panel PC from ordinary person,has solved the problem that getting sufficient data at low cost. However,it also makes a new problem that the data quality of the system iS deteriorated.To solve this problem。by analyzing the structure of crowdsensing data and the characteristics of abnormal data in crowdsensing IoV,a data detection algorithm is put forward to eliminate the abnormal data in IoV system and consequently improve data quality.In the algorithm,kernel density estimation theory is used to estimate the probability density of traffic data,and a belief function iS then constructed to derive the confi— dence value of every detected data.According to the statistical theory。the data whose confidence value is less than 0 is regarded as abnormal data.Finally,the feasibility and performance of the presented algorithm are simulated.The results show that the proposed algorithm can meet practical demands and achieve better performance than that of traditional statistical detection methods. Key words:internet of vehicles;crowdsensing ̄abnormal data detectiom kernel density estimation *收稿日期:2017—02-21 基金项目:国家自然科学基金海峡联合基金重点支持项目(U1405251),Key Project of National Natural Science Foundation of China (U1405251);国家自然科学基金资助项目(61571129,61601126),National Natural Science Foundation of China(61571129,61601126); 福建省自然科学基金资助项目(2015J01250,2016J01299),NaturalScienceFoundation of FuiJanProvince(2015J01250,2016J01299) 作者简介:徐艺文(1976一),男,福建漳州人,福州大学副教授,博士 十通讯联系人,E-mail:czh@fzu.edu.cn 146 湖南大学学报(自然科学版) 近年来,随着汽车数量的持续增长,许多城市 的道路承载容量已近饱和,道路拥堵问题日益严重. 车联网技术在智能交通系统中的成功应用,使其被 认为是解决道路拥堵问题的最佳方法,吸引了大批 研究人员的兴趣L1 ],本文的研究也是基于该应用 文献El1]采用小波分析方法分离交通流数据中的 高频与低频分量,进而求得原始信号与重构信号的 差值并结合最小二乘法找出异常数据.此外,文献 El2]提出一种加人时间关联因子曲线拟合的交通 流异常挖掘方法,并运用分箱思想设定正常值动态 范围,从而剔除异常数据.这些方法都有各自的优 势,但它们均主要针对传统车联网数据进行检测, 场景.传统车联网的数据采集方式分为固定式采集 和浮动式采集两种,但它们都存在明显缺陷,前者 安装和维护成本偏高,后者存在浮动车数量少而可 不适用于群智感知这种具有特殊数据结构及异常 能出现数据量不足的问题.为解决以上问题,有些学 者提出了群智感知车联网的思路,即利用普通用户 的手机或平板电脑等智能终端作为基本感知单元 获取所需的交通数据,例如,文献E3]通过读取智能 手机的加速度传感器信息,并经过坐标旋转获得车 辆的三轴加速度,结合从手机内置GPS获得的车速 信息,判断车辆运行的颠簸状况及刹车状况,进而 判断交通状况是否良好;文献E4]通过实测评估了 智能手机用于实时交通流预测的性能.以上研究均 验证了群智感知技术应用于车联网数据采集的可 行性. 群智感知以极低的成本获得海量交通数据,很 好地解决了车联网数据“量”的问题,但是另一方 面,这些数据来源于大量未经训练或认证的普通用 户,恶化了数据“质”的问题,因此如何实现高效、高 可靠的异常数据检测在群智感知车联网中显得尤 为重要.车联网中,传统的异常数据检测算法主要有 物理检测法和统计检测法[5 ],前者主要应用交通 流理论针对不同类型的交通数据设置相应阈值,若 数据超过阈值则判定为异常,该方法实现简单、检 测速度快,但它只适用于交通流理论涉及的数据类 型(如速度、流量、时间占有率),不适用群智感知车 联网中新的数据类型(如三轴加速度),而且该方法 在判定过程中使用大量的经验值作为阈值,导致算 法适用范围窄且性能偏低;后者应用统计学理论确 定一个置信上限,若数据误差超过该上限则判定为 异常,该方法在理论上具有较高的检测性能,但它 是在假设数据服从正态分布的前提下进行异常检 测的,而实际生活中由于驾驶行为和车辆性能的随 机性,车联网数据并不一定服从正态分布,导致该 方法在车联网应用中的实际检测性能远不如理论 性能.近几年也有学者提出其他一些车联网异常数 据检测方法,文献E9]利用支持向量机的回归估计 模型,通过计算实际值与预测值之间的残差来判别 异常数据;文献ElO]以k近邻算法为基础,根据数 据点与其相邻数据节点之间的距离判断异常数据; 特点的应用场景.为解决以上问题,本文分析了群智 感知车联网的数据结构及数据异常特点,在此基础 上提出一种适用于该场景的基于核密度估计的异 常数据检测算法,并通过Matlab仿真验证其性能. 1群智感知车联网的数据结构及数据异常 的特点 群智感知车联网中,由于群智用户的手机或平 板电脑等智能终端内的传感器有限,实际应用中往 往不能直接从其内置传感器获得我们所需的数据, 而是必须先对读取的传感器数据进行某种变换后 才能获得,即群智用户上传的数据(以下简称群智 数据)往往体现出如式(1)所示的结构: X 一{z ,z ,…,z ,C) (1) 其中{z , ,…,xff,C)代表第i次测量获得的 M个传感器数据(以下简称测量值),C代表通过对 第i次测量值进行变换后获得的系统需要的数据 (以下简称变换值),且c一1,2,…,N.例如,在文献 E3]的应用场景下,{z ,z ,…,z ,c)代表直接从手 机传感器读取的三轴加速度和速度,C代表通过三 轴加速度和速度判断所得的路面颠簸状况.实际应 用中,式(1)所示数据可能出现以下几种异常情况: ①因智能终端传感器自身原因造成测量值出现误 差;②群智数据的提供者未经专业训练,在某些情 况下可能使变换值出现偏差,极端情况下可能因误 操作而导致变换值严重偏离正常水平;③群智数据 的提供者未经事先认证,可能出现用户发送假数据 甚至恶意数据的情况.以上3种情况中,第①种情况 是因设备原因产生的固有误差,考虑到大样本情况 下该误差可得到有效弥补,而且测量值由智能终端 直接测量所得,数据质量相对可靠,所以本文忽略 该误差,即假设式(1)所示的群智数据中的每一项 测量值都是准确的;第②,③种情况尽管缘由不同, 但它们造成的后果最终都体现为群智用户将测量 值{z ,x;,…,z ,C)错变换为C 上报给服务器,这 一 第8期 徐艺文等:面向群智感知车联网的异常数据检测算法 。 147 是群智场景下特有的数据异常,也是本文的研究 对象. 根据以上分析,本文将通过核密度估计获得群 智数据x 中各元素的概率密度的估计值,进而计 算测量值{z ,z ,…,z }变换为c的概率,并依此 构建信任函数,根据该函数值检测异常数据. 2基于核密度估计的异常数据检测算法 2.1算法原理 为了便于理解本文所提算法,现将算法中涉及 的各个符号及其定义统一说明,如表1所示. 表1符号定义说明 Tab.1 Notations -definition 定义 群智数据,包含测量值与转换值,即x c={z ,z ,…,z ;c) 第i次测量值的第s个分量 测量值分量的序号,s=1,2,…,M 变换值,c一1,2,…,N 变换值c对应的积累数据集 群智数据中第 个测量值分量的概率密度 第i次测量值转变为变换值z的概率密度 群智用户将变换值z认定为变换值c的概率 被检群智数据x 的信任度 置信概率 车联网数据库中的每个变换值分量C对应积累 数据集D ,每个D 中各个测量值分量下的所有元 素都服从相同的概率分布厂 ( ).假设通过核密度 估计可足够精确地获得l厂 (z ),则在此基础上,可 将每个群智数据x 中的测量值z 代人计算: 一【J厂z(z;);z一1,2,…,N (2) 式中 的物理意义是测量值{ ,z ,…,z }变换 为z的概率密度.定义一个先验概率P ,表示对于 某个变换值z,一个未经训练的群智用户将之变换 为C的概率,则测量值{ ,z ,…, )可变换为c 上报的最大可能概率密度为: P(X )一man(r P );Z一1,2,…,N (3) 实际应用中,P 一般可通过多次实验获得,对于无 法确定该值的应用场景,可以用Kronecker delta函 数近似,即: f1 —C Plc一 z≠c 统计学理论告诉我们: ①概率密度函数,( )表征的是数据在 附近 的概率嘲; ②具有不寻常低概率的数据对象可定义为异 常数据 . 因此,P(x )相当于{z ,.z ,…,z )变换为C 的最大概率,则通过P(x )可以进行异常数据检 测.基于以上分析可构建信任函数: r(x )一log—P(Xic) (5) —式中a为置信概率,在实际应用中一般采用经验值 或通过样本训练获得.式(5)采用对数函数是为了使 数据具有线性可加性,且具有更紧凑的数量级分布. 最后,根据式(5)可计算出所有群智数据的信任度, 若满足: r(X )>0 (6) 则认为该数据正常,反之则认为其异常. 以上算法的关键是厂 (z )的获得,本文通过核 密度估计实现. 2.2核密度估计的实现及其在实用中的修正 从数据集中提取样本X ,X z,…,X ,假 设该样本与数据集具有相同的概率密度函数f(x), 则根据核密度估计理论[1 ,该数据集的核密度估 计为: z)一 K( ) (7) 式中 为样本容量,h为窗宽,K(・)为核函数.理 论和大量的实验已证明,在样本容量足够大的情况 下(群智感知数据显然符合这一前提),核函数的选 取对核密度估计效果的影响不大,只需满足对称和 单峰特性即可[1 ,所以本文选择Epanechnikov核 (简称依潘核),即: 0/1——..2、 K( )=== 4 ,l I≤1 (8) 在核密度估计的实现中,核函数K(・)的支撑 集是全体实数.因此,当数据样本的真实密度函数的 支撑集(函数厂(z)的支撑集指{z I f(x)≠0))有 边界时,核密度估计会在其边界处出现偏差,具体 体现为边界外的概率密度值仍大于0,这种现象称 为核密度估计的边界效应.例如,车联网数据中的车 速是一个非负值,因此在车速为负值时其实际概率 密度值应为0,但是由于边界效应的存在,根据式 (7)算得的核密度估计结果在负半轴上却非零,这 种情况会影响式(2)的计算结果,造成车速负值情 况下 却非零,可能引起后续异常数据检测的误 判.为解决该问题,本文采用“边界核”的方法_1。]对 式(7)进行修正,边界核的表达式为: 148 湖南大学学报(自然科学版) 一 ㈩ 和速度并进而判断路面颠簸程度的算法,这是群智 感知车联网的一个典型应用,本文将其作为仿真的 应用背景.为此,我们设计了一个基于Android平台 式中: )一J K( ) 其中 为0,l,2;“为上边界;6为下边界;K( )为 的应用软件,该软件可实时读取手机内置的三轴加 速度传感器数据以及GPS模块给出的车辆速度数 据,并根据文献[3]的算法判断当前车辆行驶路面 的颠簸程度.陔应用软件的运行界面如图1所示,数 据记录示例如表2所示. 核函数;厶为窗宽.将B(“)替换式(7)中的核函数, 可得边界核的核密度估计为: 一 71h i=1 B( ) (10 核密度估计的边界效应及修正结果将在本文 第3部分的仿真中给出. 2.3算法流程 I-止谖取 综合以上分析,本文所提出的基于核密度估计 的异常数据检测算法流程如下. 车辆行驶速厦:39 6 km/h x方向匀a速度:1 4938743 m/s2 y方向加速虞:1 619646481 m/s2 z方向加遭度:3 7775965 m/s2 丑寸间:2016—06-06 14-52—51 ①划分子数据集:将数据集D中的所有数据记 录按照变换值c(r一1,2,…,N)划分成『\,个子数据 集D 并从中分别提取样本用于后续核密度 估计; ②核密度估计:利用步骤①提取的数据样本, 根据式(10)计算出各子数据集D 中各测量值分量 的概率密度函数-厂 (j’ ),/ ( ),…,-厂 (j’M); ③计算被检数据的最大可能概率密度:针对每 一麟簸检测皇吉集:2 (a)主界回 (b)路面颠簸实时检测结果 图1应用软件运行界面 Fig.1 Application user interface 个被检数据 一{ , ,…, |Ⅵ;c),根据式(3) 计算x 中的测量值{ ,…, Ⅵ}变换为c 上报 利用上述应用软件,我们在福州的多条道路上 的最大可能概率密度P(x ); 进行了一个多月的实验,获取了超过500万条数据 记录,将其作为后续仿真的数据源. 3.2核密度估计结果 ④计算信任度:根据式(5)计算每一个被检数 据的信任度,一(x ); ⑤异常数据检测:若被检数据 的信任度大 于0,则判定其为正常数据,否则判定为异常数据. 表2中,数据集每条记录的内容为: 一{ z’ , ,,z ,u ;f} 其中 . , 和 ,分别代表第i次测量所得的三轴 3仿真与分析 3.1数据来源 加速度和速度 代表该次测量变换所得的路面颠 簸程度,且c、∈{1,2。3,4}(应用软件中将颠簸程度 按不颠簸、轻度、中度和重度颠簸分为4级,且分别 对应数值l~4). 文献[3]给出了通过手机获取汽车三轴加速度 表2数据记录示例 Tab.2 Examples of data 时间 车速/(km・h-1)一轴加速度/(m・S )Y轴加速度/(m・s。) 0.569 489 84 0.526 362 36 0.752 266 94 1.493 874 30 0.747 930 60 第8期 徐艺文等:面向群智感知车联网的异常数据检测算法 149 图2给出了c一2(即轻度颠簸)情况下车辆速 (8))进行核密度估计的结果,可以看出在速度为负 度和三轴加速度的核密度估计结果.从图2可看出 值时其概率密度却不为0,并且区间[o, ]( 为窗 车速明显不服从正态分布,与传统的统计检测法的 宽)内的概率密度值明显小于真实值,即出现了边 假设前提不符.车辆发生颠簸时会造成z轴加速度 界效应.图2(d)中实线给出了利用边界核进行修正 在正负值之间变化,因此图2(c)的曲线显示出双峰 后的效果,可以看出在速度为负值时的概率密度值 结构,也不服从正态分布. 被修正为0,而且该曲线与点划线给出的实际概率 图2(d)中虚线所示为直接使用依潘核(如式 密度曲线基本相符. 稚 栩 斟 横卜 鏖 aJ(m‘s。 ) a/(m・S。) (a) 轴加速度 O,)y轴加速度 船 瓣 a/(m’S。)  ̄/(Van・h ) (c)旃h加速度 (d1车辆速度 图2 车辆速度和三轴加速度的核密度估计结果 Fig.2 Results of kernel density estimation for vehicle velocity and three-axis acceleration 3.3与传统统计检测法的性能对比 别计算它们的均值与标准差; 传统的异常数据检测算法中,物理检测法只能 ③根据拉依达准则判决依据[1引,若被检数据 检测交通流理论涉及的数据类型,不适于本文群智 的任一分量与其对应均值的差超过3倍标准差,则 感知的应用场景,而传统的统计检测法中,狄克逊 判定该数据为异常数据. 准则、格拉布斯准则和肖维勒准则只适用于小样本 为模拟实际应用中的恶意数据,在数据集的随 情况下的异常检测,只有拉依达准则适用于大样本 机位置人为加入了若干明显异常的数据,然后根据 情况,因此我们选择拉依达准则与本文所提算法进 算法检测结果计算检测率Pa和误检率Pf,以此来 行性能对比.在对比实验中,本文所提算法的具体流 对比两种算法在性能上的优劣.Pa和P 的表达式如 程可参见2.3节,而拉依达准则的处理流程简述 式(11)所示. 如下: f①将所有数据记录按照颠簸程度C的不同划 lPd—N /s Pf=:=Nf/sd (11) 分为4个子数据集D (c==:1,2,3,4); 式中:N 代表被判为异常的数据中真正异常的数据 ②对每个子数据集中的4个测量值分量(速度 个数,S 代表实际异常数据的个数,N r代表被误判 和三轴加速度)分别抽样,得到各个颠簸程度下,不 为异常数据的个数,.sa代表被判为异常的数据总数. 同测量值分量的数据样本,并通过这些数据样本分 图3给出了两种算法在不同异常数据规模情况 150 湖南大学学报(自然科学版) 下的检测率和误检率,为使仿真结果更加直观,图 中横坐标叩是异常数据比率的对数值,具体公式为: 7/=101g u n 式中S 代表参与异常检测的数据总数.考虑到实际 应用中异常数据一般较少,所以仿真中r/的取值范 围为一30~一1O dB(即0.1 ~10 ). (dB) (12) q/dB  ̄//dB (a)检测率对比结果 图3与拉依达准则的性能对比 (b)误检率对比结果 Fig.3 Performance comparison with the Pauta criterion 从图3可看出:①本文所提算法的检测率远高 于拉依达准则,这是因为拉依达准则基于数据服从 正态分布的假设进行数据检测,而图2(d)表明车速 和 轴加速度明显不服从正态分布(尤其2轴加速 度的分布呈双峰结构,与正态分布的单峰结构差别 设分布与实际分布不一致而导致的检测性能下降. ②算法针对群智感知场景下的特殊数据结构 而提出,适用性强. ③仿真结果表明,本文所提算法具有较优的检 测性能. 很大),造成拉依达准则实际检测性能差;②本文所 提算法的误检率远低于拉依达准则,其原因与①相 同;③随着异常数据的增加,拉依达准则的检测率 急剧下降,而本文所提算法的检测率却仅下降少 许,这是因为在拉依达准则中,估计的样本方差大 于实际样本方差,随着异常数据的增加,方差偏差 加大,则一些与真实值偏差较小的异常值会被认定 为正常值,从而导致检测率下降,而异常数据的增 加对核密度估计几乎没有影响.综上,对比检测率和 值得一提的是,在实际应用中,对筛查出的异 常数据进行数据挖掘可能获得正常数据所不能提 供的新信息,因此在某些情况下不宜直接丢弃异常 数据.此时可根据式(5)将数据按信任度排序,并针 对不同信任度等级的数据进行区别化的数据挖掘, 从而获得一些隐藏信息. 参考文献 E1]蒋斌,徐骁,杨超,等.路网拥塞控制中的多目标路径决策模型 研究[J].湖南大学学报:自然科学版,2015,42(4):121~129. JIANG Bin,XU Xiao,YANG Chao,et a1.A mult objective routing decision model in vehicle transport network congestion 误检率,本文所提算法具备更佳的性能,且其性能 可满足实际应用需求. control[-J].Journal of Hunan University:Natural Sciences, 4结论 2015,42(4):1Z1—129.(In Chinese). [2]邱敦国,杨红雨.一种基于双周期时间序列的短时交通流预测 针对群智感知车联网系统带来的数据质量恶 化问题,本文提出了一种基于核密度估计的异常数 算法EJ3.四川大学学报:工程科学版,2013,45(5):64—68. QIU Dunguo,YANG Hongyu.A short—term traffic flow 据检测算法,其区别于传统方法的优点主要在于: ①本文所提算法利用核密度估计直接从数据 样本中估计出车联网数据的概率密度,而不依赖对 数据分布的任何假设,避免了传统统计检测法因预 {orecast algoirthm based on double seasonal time series[J]. Journal of Sichuan University:Engineering Science,2013,45 (5):64—68.(In Chinese). r3] MOHAN P,PADMANABHAN V N,RAMIEE R.Nericell: rich monitoring of road and traffic conditions using mobile sm— 第8期 徐艺文等:面向群智感知车联网的异常数据检测算法 151 artphones[C]//Proceedings of the 6th ACM conference on Embedded network sensor systems.New York:ACM Press, 2008:323—336. r4] ANSAR1 R,SARAMPAKHULI P,GHOSHIs,et a1.Evalua- tion of smart—rphone performance for real time traffic prediction [C]//Proceedings of 17th International IEEE Conference on Intelligent Transportation Systems.New York:IEEE,2014: 3O10—3015. [5]李颖宏,张永忠,王力.道路交通信息检测技术及应用[M].北 京:机械工业出版社,2014:239--243. LI Yinghong,ZHANG Yongzhong,WANG Li.Road traffic in— formation detection technology and application[M].Beijing: China Machine Press,2014:239—243.(In Chinese) [6]徐程,曲昭伟,陶鹏飞,等.动态交通数据异常值的实时筛选与 恢复方法[J].哈尔滨工程大学学报,2016,37(2):211—217. XU Cheng,QU Zhaowei,TAO Pengfei,et a1.Methods of real— time screening and reconstruction for dynamic traffic abnormal data[J].Journal of Harbin Engineering University,2016,37 (2):211—217.(In Chinese) [73刘喜梅,刘义芳,高林.,J、样本道路旅行时间数据中的异常点剔 除算法[J].青岛科技大学学报:自然科学版,2015,36(3):346 —354. UU Ximei,LIU Yifang,GAO Lin.Algorithm outlier filtering for small simple data of travel time[J].Journal of Qingdao U— niversity of Science and Technology:Natural science,2015,36 (3):346--354.(In Chinese) [8]陆化普,孙智源,屈闻聪.基于动态阈值的交通流故障数据实时 识别方法[J].土木工程学报,2015,48(11):l26—132. LU Huapu,SUN Zhiyuan,QU Wencong.Real-time identification of traffic erroneous data based on dynamic threshold[J].China Civil Engineering Journal,2015,48(11):126—132.(In Chinese) [9]李成兵,姚琛.交通流异常数据检测研究及实证口].计算机工 程与应用,2013,49(20):244--246. LI Chengbing。YA0 Chen.Study of recognizing discrepant traffic data and its validation[J].Computer Engineering and Applications,2013,49(2O):244—246.(In Chinese) [101 DANG T T,NGAN H Y T,LIU W.Distance-based k-nearest neighbors outlier detection method in large-scale traffic data EEl//Proceedings of IEEE International oCnference on Digital Signal Processing.New York:IEEE,2015:5O7—510. [11]李志敏,易良友,薛平,等.基于小波分析的交通流量异常数据 检测[J].计算机应用研究,2011,28(5):1677—1678. LI Zhiming,YI Liangyou,XUE Ping,et a1.Short-term traffic flow detection based on wavelet[J].Application Research of oCmputers,2011,28(5):1677—1678.(In Chinese) [12]陈珂,邹权.融入时间关联因子曲线拟合的交通流异常挖掘方 法[J].计算机工程与设计,2013,34(7):2561--2565. CHEN Ke。ZOU Quan.Traffic flow anomaly mining method of curve fitting of adding time correlation factor[J].Computer Engineerign and Design,2013,34(7):2561—2565.(In Chi nese) [13]邓泽清,陈海英.概率论与数理统计[M].北京:科学出版社, 2014:26—32. DENG Zeqing,CHEN Haiying.Probability and statistics[M]. Beijign:Science Press,2014:26—32.(In Chinese) [14]王星.大数据分析:方法与应用[M].北京:清华大学出版社, 2O13:31. wANG Xign.Big data analyze:methods and applications[M]. Beijing:Tsinghua University Press,2013:31.(In Chinese) [151张夏菲.非参数核密度估计负荷模型在电网可靠性评估中的应 用[D].重庆:重庆大学电气工程学院,2010:31--35. ZHANG Xiafei.The application of non-parametric kernel density estimation load model in power system reliability eval— uation[D].Chongqing:School of Electrical Engineering, Chongqing University,2010:31—35.(In Chinese) [161 SIMONOFFJ s Smoothing methods in statistics[M].Germ- any:Springer,1996:49—54.