企业动态
当前位置:首页 > 新闻资讯 > 企业动态

一种基于卷积神经网络的数显仪表读数识别方法与流程

作者: 来源: 发布于:2024-01-30 10:45:41
技术领域:
本发明涉及模式识别与人工智能具体的说,是涉及一种基于卷积神经网络的数显仪表读数识别方法。
 
背景技术:
仪表读数的自动识别在各种测量和监测系统中具有广泛的应用。例如水电气热的抄表计费应用中,需要定期读取仪表读数。在监测系统中,也需要定期或实时地读取仪表读数,以实现对系统的监测与控制。目前,仪表读数的获取主要有以下几种方式:(1)在一些应用领域,仪表读数还主要采用人工读取的方式,例如水电气热数据的人工抄表。这种方式费时费力,也不利于系统的自动化。(2)仪表读数的自动获取可以通过对测量仪表数字化改造,以直接获取数字化读数。然而,这种方式需要较大的成本投入。例如对现有水表进行数字化改造,需要拆卸管道并更换数字化水表,投入较大,也给用户带来不便。另外,在一些领域,机械表具有数字化表难以替代的优势。例如机械水表具有成本低,测量准确,无需电源等优势。(3)基于计算机视觉的读数自动识别,通过摄像头拍摄仪表图像,利用计算机视觉技术自动识别仪表读数。该方法具有即装即用,无需改造原有测量仪表,成本低廉等特点。目前,基于计算机视觉的数显仪表读数自动识别方法,主要采用单字识别的方法,即将读数图像分割为单个的数字,然后对每个数字利用传统分类器(如支持向量机等)进行识别。该方法的不足是,字符分割过程中容易受到图像噪声的干扰,产生误分割,识别准确率也不高。上述缺陷,值得解决。技术实现要素:为了克服现有的技术的不足,本发明提供一种基于卷积神经网络的数显仪表读数识别方法。本发明技术方案如下所述:一种基于卷积神经网络的数显仪表读数识别方法,其特征在于,包括以下步骤:S1:数据获取:采用摄像设备拍摄包含读数区域的仪表图像;S2:数据处理:通过人工标注方式,对仪表读数值进行标注;S3:深度网络模型构建及训练:将仪表图像和相应标注数据输入到深度网络模型进行训练,训练过程中采用残差回传算法进行参数学习;S4:仪表读数识别:输入仪表图像,深度网络模型给出相应的仪表读数识别结果和识别置信度。根据上述方案的本发明,其特征在于,在所述步骤S1中,拍摄的仪表图像时,仪表表盘读数部分正对镜头,居中且占据图像面积的三分之二以上。根据上述方案的本发明,其特征在于,在所述步骤S2中,标注内容为仪表读数,读数的每个数字之间使用“,”隔开。进一步的,对于正在进位的读数位,标注格式为X.5。根据上述方案的本发明,其特征在于,在所述步骤S3中,具体包括步骤:S31:构建深度神经网络模型;S32:网络模型训练参数设定;S33:对模型参数进行随机初始化,然后进行深度神经网络模型的训练,得到识别模型。进一步的,在所述步骤S31中,深度神经网络模型包括特征提取模块、上下文信息融合模块和分类模块:其中,所述特征提取模块从仪表读数图像中提取数字特征信息,通过卷积神经网络得到高级特征图;所述上下文信息融合模块根据高级特征信息,进行上下文信息的融合;所述分类模块根据上下文信息模块对数字高级特征进行增强,并对读数进行分类和预测。进一步的,在所述步骤S32中,网络模型训练参数包括迭代次数、优化器、学习率、学习率更新策略以及权重衰减系数。更进一步的,所述迭代次数为1000000,所述优化器采用ADADELTA方法,所述学习率为1.0,所述学习率更新策略采用固定不变的学习率,所述权重衰减系数为0.0005。进一步的,在所述步骤S33中,训练过程采用残差回传算法进行参数学习,通过从模型的最后一层开始计算传递残差,并逐层向前传递,从而对模型参数进行更新,以达到网络训练的目的。根据上述方案的本发明,其特征在于,在所述步骤S4中,具体包括以下步骤:S41:将仪表读数图像输入网络,采用训练得到的识别模型及参数,对读数进行预测和识别,得到识别结果;S42:返回识别结果,并对每一位读数的识别置信度进行算术平均,得到识别置信度。根据上述方案的本发明,其有益效果在于:1、与传统人工抄表相比,本发明能够实现完全自动化的仪表读数识别,节省大量人力物力资源,同时在实时性、大批量数据处理等方面,具有明显优势。2、与已有的基于计算机视觉的读数自动识别方法相比,本发明具有以下优点:(1)本发明采用深度网络模型结构,避免了进行显式的字符分割、特征提取及字符分类过程。模型能够从大量数据中自动学习数据分布,模型更能适应真实场景的图像特点,识别精度更高。(2)本发明通过残差反传算法,自动调整卷积核,得到更鲁棒的滤波器,能够应对模糊、透视变换、光线变换等复杂的实际应用场景。附图说明图1为本发明的整体流程框图。图2为本发明深度网络模型的结构示意图。图3为本发明数显仪表读数识别实例的示意图。具体实施方式下面结合附图以及实施方式对本发明进行进一步的描述:如图1所示,一种基于卷积神经网络的数显仪表读数识别方法,包括数据获取、数据处理、深度网络模型构建及训练以及仪表读数识别等过程。一、数据获取:采用手机、专用硬件等摄像设备拍摄仪表表盘图像。拍摄过程中,仪表表盘读数部分正对镜头,居中且占据图像面积的三分之二以上,仪表表盘允许一定程度倾斜,但读数区域需要拍摄完整。所拍摄的仪表图像应涵盖不同规格的待检测仪表,仪表图像数量不少于100000张。二、数据处理:对拍摄的图像进行标注,标注内容为仪表读数,读数的每个数字之间使用“,”隔开,标注内容无需包含任何坐标信息。其中,对于正在进位的读数位,标注格式为X.5,例如某读数位的值介于7和8之间,则需要标注为“7.5”。每位共有0-9即10个数字状态,加上进位状态,则每位共存在20类标注状态。三、深度网络模型构建及训练:将仪表图像和相应标注数据输入到深度网络模型进行训练,训练过程中采用残差回传算法进行参数学习。具体包括以下步骤:1、构建深度神经网络模型如图2所示,所构建的深度神经网络模型包括特征提取模块模块、上下文信息融合模块和分类模块模块。其中,特征提取模块从仪表读数图像中提取数字特征信息,通过卷积神经网络得到高级特征图;上下文信息融合模块根据高级特征信息,进行上下文信息的融合;分类模块根据上下文信息模块对数字高级特征进行增强,并对读数进行分类和预测。(1)特征提取模块结构为:网络层具体操作特征图尺寸输入层-3×40×144卷积层核数量64,卷积核3×3,步长1×1,补边64×40×144非线性层-64×40×144池化层池化核2×2,步长2×264×20×72卷积层核数量64,卷积核3×3,步长1×1,补边64×20×72非线性层-64×20×72池化层池化核2×2,步长2×264×10×36卷积层核数量128,卷积核3×3,步长1×1,补边128×10×36非线性层-128×10×36池化层池化核2×1,步长2×1128×5×36卷积层核数量128,卷积核2×2,步长1×1128×4×35非线性层-128×4×35卷积层核数量256,卷积核3×3,步长1×1,补边256×4×35非线性层-256×4×35池化层池化核2×2,步长2×2256×2×18卷积层核数量512,卷积核2×2,步长1×1512×1×17归一化层-512×1×17非线性层-512×1×17如上表所示,特征提取模块中,卷积层的贴边操作运算为,在原特征图的上下左右均贴上一圈像素点,像素值为0;非线性层采用ReLU激活函数;池化层采用最大池化方式;归一化层将每一张特征图归一化为高斯正态分布。(2)上下文信息融合模块结构为:网络层具体操作特征图尺寸长短时记忆层结点数128128×1×17长短时记忆层结点数256256×1×17如上表所示,上下文信息融合模块中,长短时记忆层为LSTM模型结构。(3)所采用的分类模块结构为:网络层具体操作特征图尺寸全连接层结点数256256×1×17全连接层结点数256256×1×17全连接层结点数2121×1×17如上表所示,分类模块采用具有17个位置的预测结构,将预测结果进行CTC(ConnectionistTemporalClassification)解码,得到仪表读数的识别结果。上述的特征提取模块、上下文信息融合模块和分类模块均使用了深度网络模型,表格中的神经网络层为顺序连接形式,采用残差回传算法更新神经网络中的参数。其中:特征提取模块的输入为仪表读数图像,输出为高级特征图,并作为上下文信息融合模块的输入;上下文信息融合模块的输出为上下文信息的融合特征图,并作为分类模块的输入;分类模块的输出为17个位置的预测结果,并进行CTC(ConnectionistTemporalClassification)解码。3个模块均使用监督学习方法,通过训练,学习得到数字图像特征和标签的映射关系。2、训练参数的设定:迭代次数:1000000;优化器:采用ADADELTA方法;学习率:1.0;学习率更新策略:采用固定不变的学习率;Weightdecay(权重衰减系数):0.0005。3、对模型参数进行随机初始化,然后进行深度神经网络模型的训练,得到识别模型。训练过程采用残差回传算法进行参数学习,通过从模型的最后一层开始计算传递残差,并逐层向前传递,从而对模型参数进行更新,以达到训练网络的目的。四、仪表读数识别仪表读数识别过程具体包括:(1)将一张仪表读数图像输入网络,采用训练得到的识别模型及参数,对对数进行预测和识别,得到识别结果;(2)返回识别结果,并对每一位读数的识别置信度进行算术平均,得到识别置信度。如图3所示,其显示了数显仪表读数的识别结果与置信度。其中,左列为识别结果,包括了读数识别结果、识别置信度,右列为仪表读数的图像。本发明采用整体识别方法,无需对读数中数字进行显式分割,具有较高的识别性能。实际测试中,本发明的方法可以达到99.0%的识别准确率,识别速度为每张仪表读数图像不超过30毫秒,可以满足实际应用的需要。本发明一方面有效利用了深度网络模型的特征学习能力和分类性能,同时可以更为有效地发现隐藏于大量仪表图像数据中的数据特征,从而实现一种高精度的仪表读数自动识别方法。本发明具有较好的实际应用价值,可以广泛应用于涉及仪表读数识别的领域,如水、电、气、热等各种计量表读数的自动识别中。应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。上面结合附图对本发明专利进行了示例性的描述,显然本发明专利的实现并不受上述方式的限制,只要采用了本发明专利的方法构思和技术方案进行的各种改进,或未经改进将本发明专利的构思和技术方案直接应用于其它场合的,均在本发明的保护范围内。


2018 大导电气(上海)有限公司 版权所有 沪ICP备15021236号-1
网站地图 | 技术支持:云鼎科技
收缩