继电保护压板图像识别与模型聚类匹配

李铁成 任江波 刘清泉 赵宇皓 王志华 胡艳娇

摘 要:针对电力系统二次设备工作中,人工校核继电保护压板位置、描述和状态,工作量大、易出错、效率低等问题,提出了基于图像识别技术和模型聚类匹配算法的继电保护压板自动识别与校核方法。该方法首先运用图像识别技术获得压板设备、文字标签的特征信息,然后采用图像模型聚类匹配算法重新排列压板顺序得到其具体位置信息,再进行压板设备与文字关联得到压板的详细描述信息,最后通过识别得到的压板的完整信息与拍摄录入或者配置导入的压板库比对,对压板进行自动校核。实际场景应用测试结果表明,该压板自动识别与校核方法,能够准确地识别压板状态及对应文字,显著地提高了现场运维的效率,具有较高的实际应用价值。

关键词:继电保护压板;图像识别;聚类匹配;文字识别;自动校核

DOI:10.15938/j.jhust.2021.04.010

中图分类号:TM732;TP29

文献标志码:A

文章编号:1007-2683(2021)04-0070-08

Abstract:Aiming at the problems of manual checking relaying plate in secondary equipment of power system, such as heavy workload, error-prone and inefficiency, an automatic recognition and checking method of relaying plate based on image recognition technology and model clustering matching algorithm is proposed. In this method, the position, description and state of the relaying plate obtained by using image recognition technology and image model clustering matching algorithm, and then the complete information of the identified relaying plate is compared with the relaying plate library input by photographing or configuration to realize the automatic verification of the relaying plate. The field test results show that the automatic recognition and verification method has universal practicability, it can accurately identify the status and description of the relaying plate, improve the efficiency and accuracy of field operation and maintenance.

Keywords:relaying plate; image recognition; clustering matching; character recognition; automatic checking

0 引 言

目前電力系统二次设备运维管理[1]工作中,人工校核压板的位置、描述和状态,工作量大、易出错[2]。随着工业和科学技术的发展,电力变电站的规模和数量也都急剧上升,人工校核继电保护压板的问题变得更加突出。压板形态和布局规整的特点,为其自动化识别提供了基础,继电保护压板自动化识别[3-5]与校核研究随之迅速发展。

目前,继电保护压板自动化识别主要是基于特殊材料采集[6,7]、视觉信息[8]提取压板状态信息,判断其是否符合对应规程,实现压板投退状态的自动识别与校核[9,10],但是对压板的描述和位置信息是否与电力二次设计相符无法自动识别[11,12],且建设和维护成本大,应用场景单一。文[12]基于图像识别的压板投退状态的应用,虽然维护成本低,但是同样存在没有对压板文字和位置进行识别的问题,应用场景局限性较大。

随着图像识别技术[13-16]迅速发展,计算能力的不断提高,现代图像识别技术涌现了很多优秀的对象识别、文字识别算法[17-19]和技术。本文提出基于图像识别技术和模型聚类匹配的继电保护压板运维技术的方法,基于图像识别技术提取压板设备、文字标签的特征信息,基于图像模型聚类[20,21]匹配对压板进行排列计算压板的行号、列号,再对上述压板设备与文字进行聚类算法组合获取压板的描述,最后对识别得到的压板的完整信息与拍摄录入或者配置导入的压板库进行比对,实现压板的自动校核。

1 图像识别

1.1 压板图像识别技术原理

压板图像识别主要分为压板设备和文字标签的识别,通过识别获得压板设备的坐标位置和投退状态,以及文字标签中文字的内容和坐标位置,其流程如图1所示。

数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。由数组或矩阵表示,其光照位置和强度都是离散的,准确度依赖于几何和光度学或者传感器校准。数字图像处理[22]是研究数字图像与现象、实物的变换算法,通过计算机对图像进行一系列处理的方法和技术,数字图像处理的发展主要依赖于计算机和数学的发展,以及工业、医学等应用需求的增长。

压板设备在不同的图像中大小、角度、位置不同,需要对数字图像进行旋转、缩放、平移等变换,通过图像配准实现该变换过程,压板图像配准流程如图2所示。

1.2 压板智能运维需求分析

压板智能运维通过机器自动识别代替人工识别,完成对压板的自动识别与校核。首先对继电保护压板进行拍摄得到数字图像,然后对其进行图像识别得到需要的压板模型,再根据业务需要对模型数据进行处理,最后输出识别结果到移动终端或者台式计算机上。

运维需求按照功能划分模块,主要有压板验收、压板巡视、压板安措校核等业务模块,提供参数设置和查询的设置模块,提供业务支撑的压板库模块。

设置模块主要用于辅助图像识别,普适的图像识别算法难以实现所有待识别对象属性,如“压板设备与文字标签的位置关系”、“属于同一个文字标签的文字对象”,通过设置模块中的参数设置来辅助图像识别,可以减小图像识别难度,提高识别准确性。

压板库是压板验收比对的依据,并且可以提高压板巡视、压板安措校核的识别率。由于人工录入压板库工作量大,可以导入带图元属性的计算机输出设计文件建立压板库,也可以通过图像识别技术识别设计图纸的方式建立压板库,对于未能准确导入或者识别错误压板,通过人工干预进行修正。

压板验收主要关注其文字标签是否贴错,而压板库的录入则需要识别文字标签的内容作为对应压板的描述,它们仅需要关注压板的位置和描述,不关注压板的投退状态。所以压板验收和压板库的录入仅需要识别压板设备对象的位置和文字标签中的文字,对其进行组合得到压板的描述。

压板巡视、压板安措校核主要关注压板的投退状态是否与压板库/压板定值一致,仅需要关注压板的位置和状态,可以使用相同的算法流程。首先进行压板设备对象的识别,然后对压板类聚参数进行判断,超出正常范围则通过提取的文字信息与压板库比对对压板的位置进行修正,否则结束识别过程。

2 模型聚类匹配

2.1 压板模型聚类匹配

压板图像模型聚类匹配,是将图像的压板设备模型与对应的文字标签通过聚类算法进行组合,得到整个压板的位置、描述、状态信息,匹配流程如图3所示。通过聚类算法将压板设备对象坐标位置进行排列,得到压板在图像中自然排列的行号、列号,然后根据文字对象之间的间隔对文字对象进行拼接得到压板标签描述,最后与压板设备对象进行组合。

设备聚类按照给定的坐标点将设备分成行与列,得出行号与列号并记录其状态。

文字聚类是将属于单个压板文字标签的文字内容进行组合拼接,按照文字的方向参数配置,如“先左右后上下”、或者“先上下后左右”,将范围内的文字对象进行拼接。为了提高文字识别结果的准确性,文字聚类基于设备聚类的结果进行聚类。

文字与设备组合聚类是通过设备聚类、文字聚类得到结果,将文字标签与压板设备一一对应,组合为一个完整的压板模型对象。聚类算法采用 K-means算法,步骤如图4所示。

图4中,K为接收输入量,算法将n个数据对象划分为K个类聚,使获得的类聚在同一类聚中对象相似度较大,而不同类聚中的对象相似度较小。

在压板设备的识别过程中,首先经过图像识别得到压板坐标数据,然后使用K-means算法将该数据与所要分成的行数N,将压板按行分组。K-means算法完成按行分组之后,对每行压板纵坐标的平均值升序排列得到压板在照片中所处的行号,对每行内的压板按照横坐标升序排列得到压板在照片中所处的列号,最后对所有行的每列纵坐标的平均距离与相邻列號的横坐标距离的倍数对列号进行右移调整,避免压板漏识别造成的压板位置识别错误。

文字识别通过将属于同一个矩形框的文字聚类到一起,得到设备对应的完整文字描述。识别的关键在于求解矩形框高度、宽度等参数,相关参数如图5所示。

第i行文字矩形高度计作hi,如式(1)所示。

式中:hij为第i行第j列压板与第i+1行第j列压板纵向距离;

第i行第j列文字矩形框宽度计作wij,如式(2)所示。

式中:d1为压板与左边第一个压板的横向距离;d2为压板与右边第一个压板的横向距离;w0为对应压板对象的宽度。

第i行第j列设备的文字对象则为处于i行j列设备下高度为hi、宽度为wij的矩形框中所有文字对象。

文字对象拼接采用与设备识别相同的聚类算法K-means,基于书写的规律,按照先左右后上下的顺序拼接。因此要把设备对象下的文字对象集合分成行与列。先对每行内的文字进行拼接,再对拼接好的每行文字进行拼接。

多图片识别,基于基准照片将多个照片中的对象拼接起来,也就是以基准照片的行号、列号作为参考对象调整不同图片的行号、列号,保证行号、列号的唯一性和连贯性。由于多图片拼接通过文字匹配来判断是否有相同对象,要求单张图片中文字串唯一,不能重复。在实际场景会存在“备用”、空白字符串等情况文字串的重复,此类对象不参与业务, 判断是否有相同文字时,排除此例。

在多图片拼接过程中,如图6所示,“压板6”在基准照片中所处的行列号的向量值为a→=(2,3),在非基准照片中所处的行列号的向量值为b→=(1,1),因此将非基准照片中的行列号转换为基准照片中的行列的转换向量为n→=(1,2),计算公式如(3)所示。

根据转换向量可以依次求得非基准照片中其他压板在基准照片中的行列号,如压板11在非基准照片中的行列号为c→=(2,3),其在基准照片中的行列号向量计算如式(4)所示,结果为d→=(3,5)。

2.2 算法优化

为了提高压板设备对象的识别准确率,需要对K-means算法进行优化,根据压板分布特点,可以通过数据预处理、初始类聚点选择、K值的选择多方面进行。

在压板的数据预处理中,各个压板之间的距离比较远,离散度较大,类聚效果不明显,如图7(a)所示;为了使类聚效果明显,将压板横坐标x做归零化处理,使得行间压板距离较大,而行内压板之间的距离较小,如图7(b)所示。因此,归零化处理使压板的类聚效果更加明显,能够明显降低压板归入错误行的概率。

初始类聚点的确定,最简单有效的就是随机选择K个点作为初始的类簇中心点,但是该方法在有些情况下的效果较差,容易造成局部最优解。图像识别中中心点的初始化方案为,选择彼此尽量远离的K个点。

K-means初始化中心点的选择如图8所示,首先在原始数据链表ψ0中随机选择一个点作为第一个初始类簇中心点P1,并存入新的数据链表ψ1,选择距离该点最远的点作为第二个初始类簇中心点P2,然后选择距离前两个点的最近距离最大的点作为第三个初始类簇的中心点P3,以此类推,直至选出K个初始类簇中心点。

K值的选择,由于单个屏柜的压板行数一般在1~10,类聚需要K值大于1,K值按照2~10遍历,得到类聚结果,再将类聚结果进行计算得到其轮廓系数,选出轮廓系数最小的那个K值。

轮廓系数(silhouette coefficient)结合了聚类的凝聚度(cohesion)和分离度(separation),用于评估聚类的效果,记作Si。该值处于-1~1之间,值越大聚类效果越好,具体计算方法如下:

第一步:对于每个压板i,计算每个压板i与其同在一个行内的所有其他压板的距离wj的平均值,用于量化行内压板的凝聚度,记作Xin,计算过程如式(5)所示。

式中:n为参与统计的距离的个数。

第二步:选取压板i外的另一行压板第i+j行,计算第i行与第i+j行中所有压板的平均距离hij,遍历所有其它行,找到最近的这个平均距离,记作Yi,即为第i行的邻居类,如式(6)所示。用于量化每行压板之间分离度。

第三步:计算压板的轮廓系数,如式(7)所示。

第四步:计算所有压板的轮廓系数,求平均值,记作Sn,度量压板聚类的紧密程度,如式(8)所示。

式中:n为参与统计的轮廓系数的个数,即压板的行数。

3 测试验证

本文根据图像识别技术的特点,分别通过压板设备识别、文字标签识别、压板设备与文字标签组合、集成测试,依次对压板设备状态、文字相似度、文字与设备组合、图像模型聚类匹配优化算法进行测试验证。

3.1 压板设备识别测试

选取8个比较常见的压板图片样本,对压板位置及状态的识别结果如表1所示。

表中合计的状态识别准确率不是采用均值的方法,与单个图像识别正确率计算方式相同。由表1的数据记录以及识别准确率可见,压板对象的识别准确率为99.3%,准确率较高。

3.2 文字标签识别测试

为了初步测试文字识别的效果,选取一个典型压板图像进行文字识别测试,压板文字标签识别数据与人工查看图像的数据如表2所示。

表中文字相似度计作δ。由表2可以看出,大部分文字对象是可以识别的,平均相似度达到84.37%,识别错误主要由两方面导致:两个文字标签的内容识别为一个文字对象,以及形近字识别错误。

测试选取8个图像样本进行批量识别,识别结果与图像原始文字内容进行人工比对,测试结果如表3所示。

表中文字识别率是指识别的文字与图像的文字进行模糊匹配得到的结果;错误识别词条包含漏识别词条、多识别词条,其个数为漏识别词条个数与多识别词条个数相加。

对表3的数据以及对应的图片样本进行人工分析,发现导致文字识别率低的原因主要有倾斜文字、竖排文字、分辨率低,结果如表4所示。

综上所述,文字识别错误率主要由图像分辨率低、倾斜文字、竖排文字等原因导致。图像分辨率高、横排文字普遍识别效果比较好,均在90%以上。

3.3 压板对象与文字标签组合测试

压板对象需要与文字标签组合才能满足验收时对压板描述自动识别的需求,采用与压板对象识别测试相同的样本对其进行测试,统计结果如表5所示。组合准确率计算方程为:

式中:accuracyg为组合准确率;k1为压板总个数;k2为文字与压板组合正确的个数,组合正确是指组合后压板的行号、列号、文字均与原始图像相符。

由表5可知,压板与文字的组合效果非常理想,是因为组合准确率与压板对象的漏识别及其状态、以及文字的识别错误、文字漏识别无关,仅关注组合结果,且压板设备排列整齐、间距分隔明显。这个结果同时也验证了模型聚类匹配算法组合压板对象和文字标签的准确率很高,为压板完整信息识别提供了坚实的技术基础。

3.4 集成测试

将样本分为标准样本、复杂样本,各选取180张进行自动识别。标准样本为压板数量较少、水平排列的样本,复杂样本为压板数量较多、压板对象倾斜的样本。统计结果如图9所示。识别准确率的计算方程式如(11)所示。

式(10)中:accuracy0为单张样本的识别准确率; δ为文字识别相似度。式(11)中:accuracys为N张样本的识别准确率,其中N为样本的个数;

从图9可知,对标准样本的识别比复杂样本识别准确率稍高,差值为2.32%;经过算法优化后标准样本识别准确率达到95.37%,比算法优化前提高15%左右,结合人工校正,可以满足工程应用需求。

3.5 现场典型案例

变电站保护屏柜宽度比较固定,每行可容纳的压板一般每行在10个左右,采用常用手持设备对典型的继电保护压板拍照,如图10所示。

将图10的电子图片传入系统,经过图像识别获得压板的文字描述、状态和位置,结合模型聚类匹配压板获得压板所在的行号、列号,与压板库进行比对是否一致。第一行和第二行压板识别的结果如图11所示,所有压板识别的结果均显示验收通过,与压板库一致,人工比对图10、图11可以看出,压板的描述、行号、列号均识别正确。

4 结 论

基于图像识别技术和模型聚类匹配算法实现了对继电保护压板状态、排列位置、描述的自动识别,并通过与压板库的比对实现了压板的自動校核,实现了压板巡视、压板验收、压板安措校核等运维工作中压板的自动化校核,解决了电力系统二次设备运维工作中人工校核压板工作量大、易出错、效率低的问题。经过测试与验证,压板设备识别、压板文字标签识别及其聚类组合准确率高、效果明显。随着图像识别技术的不断成熟,为变电站智能化、信息化建设提供了先进的技术基础,该研究可以广泛应用于压板巡视、压板验收、压板安措校核、压板资料管理工作中,实现电力系统继电保护压板运维工作智能化。

參 考 文 献:

[1] 秦红霞, 武芳瑛, 彭世宽, 等. 智能电网二次设备运维新技术研讨[J].电力系统保护与控制, 2015, 43(22):35.

QIN Hongxia, WU Fangying, PENG Shikuan, et al. New Technology Research on Secondary Equipment Operation Maintenance for Smart Grid[J]. Power System Protection and Control, 2015, 43(22):35.

[2] 邓应松, 段秦刚, 宋小松. 基于图像识别的保护压板投退状态辨识方法[J].陕西电力, 2015, 10(67):49.

DENG Yingsong, DUAN Qingang, SONG Xiaosong. State Identification of Relaying Plate Based on Image Recognition[J]. Shaanxi Electric Power, 2015, 10(67):49.

[3] 任俊杰, 蒋岚. 电力系统继电保护压板图像识别系统[J].北京联合大学学报(自然科学版), 2004(2):60.

REN Junjie, JIANG Lan. Image Recognition System of Relay Protection Plate in Power System[J]. Journal of Beijing Union University(Natural and Social Science), 2004(2):60.

[4] 付文龙, 谭佳文, 吴喜春, 等. 基于图像处理与形态特征分析的智能变电站保护压板状态识别[J].电力自动化设备, 2019, 39(7):203.

FU  Wenlon, TAN Jiawen, WU Xichun, et al. Protection Platen Status Recognition Based on Image Processing and  Morphological Feature Analysis for Smart Substation[J]. Electric Power Automation Equipment, 2019, 39(7):203.

[5] 许超, 陈昊, 刘少情, 等. 基于模型聚类匹配和形态特征识别的保护压板状态辨识技术[J].陕西电力, 2017, 1(85):32.

XU Chao, CHEN Hao, LIU Shaoqing, et al. Relaying Plate Condition Recognition Technology Based on Model-based Cluster Matching and Morphological Characteristics Recognition[J]. Shaanxi Electric Power, 2017, 1(85):32.

[6] 郭兴旺, 吕珍霞, 高功臣. CFRP层压板脉冲热像检测的图像重建与增强[J].红外技术, 2006, 28(5):299.

GUO Xingwang, L Zhenxia, GAO Gongchen. Image Reconstruction and Enhancement of Pulsed Infrared Thermography of CFRP Laminates[J]. Infrared Technology, 2006, 28(5):299.

[7] 黄景兴, 朱政, 丁能圣, 等. 复合材料层压板的超声相控阵检测[J].无损检测, 2012(1):43.

HUANG Jingxing, ZHU Zheng, DING Nengsheng, et al. Ultrasonic Phased Array Testing of Composite Material Laminate[J]. Nondestructive Testing, 2012(1):43.

[8] 夏志宏, 罗毅, 涂光瑜, 等. 基于视觉信息的继电保护压板投退位置的自动识别研究[J].继电器, 2005, 33(4):40.

XIA Zhihong, LUO Yi, TU Guangyu, et al. Image Auto-recognition of Relay Pressed Board in on/off States Based on Visual Information[J]. Relay, 2005, 33(4):40.

[9] 肖立军, 莫玲. 基于模式识别的继电保护压板状态检定系统[J].新技术新工艺, 2017(11):56.

XIAO Lijun, MO Ling. Verification System of Relaying Plate Status Based on Pattern Recognition[J]. New Technology & New Process, 2017(11):56.

[10]吕志宁, 宁柏锋, 周子强. 基于图像处理的保护压板定位及状态识别研究[J]. 数字技术与应用, 2018, 36(6):82.

L Zhining, NING Baifeng, ZHOU Ziqiang. Research on the Location and Condition Recognition of Protection Plate Based on Image Processing[J]. Digital Technology & Application, 2018, 36(6):82.

[11]赖秋频, 杨军, 谭本东, 等. 基于YOLOv2网络的绝缘子自动识别与缺陷诊断模型[J].中国电力, 2019, 52(7):31.

LAI Qiupin, YANG Jun, TAN Bendong, et al. An Automatic Recognition and Defect Diagnosis Model of Transmission Line Insulator Based on YOLOv2 Network[J]. Electric Power, 2019, 52(7):31.

[12]赖宝鹏, 沈靖龙, 韩成辉. 基于图像识别的保护压板投退状态APP设计[J].山东工业技术, 2018, 18(93):114.

LAI Baopeng, SHEN Jinglong, HAN Chenghui. The Design of App for The On / Off State of The Protection Pressing Plate Based on Image Recognition[J]. Shandong Industrial Technology, 2018, 18(93):114.

[13]蒋树强, 闵巍庆, 王树徽. 面向智能交互的图像识别技术综述与展望[J].计算机研究与发展, 2016, 53(1):113.

JIANG Shuqiang, MIN Weiqing, WANG Shuhui. Survey and Prospect of Intelligent Interaction-Oriented Image Recognition Techniques[J]. Journal of Computer Research and Development, 2016, 53(1):113.

[14]孙凤杰, 齐京亮, 李媛媛, 等. 输电线路视频图像识别管理系统[J].中国电力, 2013, 46(4):83.

SUN Fengjie, QI Jingliang, LI Yuanyuan, et al. Video and Image Identification Management System for Transmission Lines[J]. Electric Power, 2013, 46(4):83.

[15]杨钰, 杨磊, 张晓楠. 一种应用于物流行业的自动分拣控制系统[J]. 哈尔滨理工大学学报, 2019, 24(4):71.

YANG Yu, YANG Lei, ZHANG Xiaonan. An Automatic Sorting Control System Applied to Logistics Industry[J]. Journal of Harbin University of Science and Technology, 2019, 24(4):71.

[16]黄序. 变电站智能巡检系统的图像识别及处理技术[D].武汉:华中科技大学, 2017.

[17]陈宇, 周雨佳, 丁辉. 一种XNet-CNN糖尿病视网膜图像分类方法[J]. 哈尔滨理工大学学报, 2020, 25(1):73.

CHEN Yu, ZHOU Yujia, DING Hui. An XNet-CNN Diabetic Retinal Image Classification Method[J]. Journal of Harbin University of Science and Technology, 2020, 25(1):73.

[18]袁优, 康积涛, 王德林, 等. 考虑空间效应的风电场动态特性等值方法研究[J].中国电力, 2016, 49(12):144.

YUAN You, KANG Jitao, WANG Delin, et al. A Dynamic Equivalence Method Considering the Effect of Spatial Wind Farms[J]. Electric Power, 2016, 49(12):144.

[19]付智军. 基于深度学习的计算机设计场景文本与非文本图片分类算法研究[N].科技报, 2019, 35(9):106.

[20]蒋正邦, 吴浩, 程祥, 等. 基于多元聚类模型与两阶段聚类修正算法的变电站特性分析[J].电力系统自动化, 2018, 42(15):157.

JIANG Zhengbang, WU Hao, CHENG Xiang. et al. Analysis of Substation Characteristics Based on Multivariate Clustering Model and Two-stage Clustering-correction Algorithm[J]. Automation of Electric Power Systems, 2018, 42(15):157.

[21]吳杰, 丁明, 张晶晶. 基于云模型和k-means聚类的风电场储能容量优化配置方法[J].电力系统自动化, 2018, 42(24):67.

WU Jie, DING Ming, ZHANG Jingjing. Capacity Configuration Method of Energy Storage System for Wind Farm Based on Cloud Model and k-means Clustering[J]. Automation of Electric Power Systems, 2018, 42(24):67.

[22]来凡盛, 潘瑞霞. 数字图像处理技术综述[J].甘肃科技,2015, 31(22):30.

LAI Fansheng, PAN Ruixia. Overview of Digital Image Processing Technology[J]. Gansu Science and Technology, 2015, 31(22):30.

(编辑:温泽宇)

猜你喜欢图像识别图像识别技术的应用与发展科技视界(2019年31期)2019-12-02人工智能背景下图像识别技术浅析数码世界(2019年6期)2019-09-09基于图像识别的智能下棋机器人物联网技术(2019年3期)2019-03-28《图像识别初探》教学案例中国信息技术教育(2019年2期)2019-01-28浅析纸币清分包装系统把数的核验方法价值工程(2018年21期)2018-08-29无人机高空图像的识别技术电子技术与软件工程(2018年2期)2018-03-21基于图像识别与雷达测距技术的开车看手机安全预警系统科技资讯(2017年32期)2018-01-09基于字典学习的正则化鲁棒稀疏表示肿瘤细胞图像识别计算机应用(2016年10期)2017-05-12落叶松球蚜种群密度林间调查辅助系统的设计与实现农民致富之友(2017年7期)2017-04-27图像识别交互系统中国信息技术教育(2016年21期)2016-12-05 相关热词搜索: