基于机器学习应用的图像数据处理问题研究

来源：星星旅游

ACADEMIC RESEARCH 学术研究

基于机器学习应用的图像数据处理问题研究

◆ 陈邦国

摘要：在互联网视频图像生产领域，视频与图像产生的数据量在持续增加的同时，也对图像数据处理能力提出更高的要求。因此，如何应用科学合理的计算方法，使图像数据的价值能能够被最大化的挖掘出来，已经成为提高图像处理能力的首要问题。论文针对图像数据处理以及机器学习进行相关研究，对当下比较流行的图像处理机器学习算法进行概括，并且对相关计算流程做出阐述，最后指出了深度学习与图像处理有机集合的良好发展趋势。

关键词：图像数据处理；机器学习；信息熵

一、前言

近年来各大论坛以及视频网站等互联网终端的快速发展，使视频数据与图像数据的应用量持续激增，尤其是后者，在当前大数据时代飞速发展的过程中始终作为重要角色，而且越来越多的用户更加青睐图像与视频。传统的图像数据处理功能已经无法满足当今需求，需要更加先进的机器学习算法。而人工智能的出现，有效解决了机器学习过程中的相关难点，进而衍生出多种处理图像数据的有效工具，并且学习效果十分明显，使图像处理功能得到了进一步的提升，增加了自身的商用价值。

二、基于机器学习技术进行图像处理的技术发展

（一）机器学习与图像处理的结合

上世纪中后期产生了机器学习这一概念，发展至今逐渐衍生成针对大数据的主要处理方式。其应用理论为通过计算机对人类活动进行模拟学习，使计算机能够有效整合旧数据，获取新数据，对数据进行学习从而完善自身相关功能。其学习过程还具体包括了半监督学习、无监督学习以及有监督学习三种方法。机器学习还涵盖了概率统计、博弈论、微积分、线性代数、生物学、信息论以及神经生物学等学科的主要成果[1]。成为了融合多领域的人工智能系统，机器学习涉及的范围也十分广泛，包括图像处理、自然语言处理、自动驾驶、推荐系统等领域。尤其是图像数据处理功能，为互联网技术提供发展助力的同时，其自身的成长速度也较为明显。

（二）传统机器学习过程中的图像处理流程

在通常情况下，机器学习非深度模式时普遍应用传统图像数据处理方法，也就是采用认为方式对数据属性集做出寻找。具体包括两个方面，首先，通过数据表层的数据特征，也就是能够较为直观发展的纹理特征以及颜色特征等，随后进行量化处理；其次，通过空间拓扑特征对局部对象数据进行分析，同时在量化过程中使用数字方式，比如针对局对象之间采用欧氏距离去刻画相似度等，除此之外还要将两者进行结合，作为属性集的构建基础[2]

。在确定属性集后，还要根据所有样本建造样本集，从而使成为二维矩阵。通过在此模型中录入相关数据即可进行训练[3]。总而言之，模型的选择与训练、特征提取能够明确影响到图像数据处理结果。由于本次研究将机器学习与图像处理作为重点研究对象，因此不过多介绍特征工程相关的原理与概念。

（三）常用的机器学习算法1.决策树

决策树指的是在进行数据分类时采用树形结构，对人类日常生活习性进行模拟，并且以此来分类样本属性，决策树的内部节点代表样本分类属性，叶节点代表划分的类别。其核心理论为将样本集中整合进行建造出新的分类规则。因为属性结构的复杂性，导致最优决策树的构建过程比较困难。因此在实际应用中，决策树方法普遍使用启发式学习方法，也就是实现局部最优。为了得到更好的属性选择，进而提出了熵的定义[4]。熵值能够有效对样本的复杂凌乱程度作出表示，使机器能够更加合理的把握每一级别的属性标准，信息熵公式与条件熵公式具体为：

H(X)n=−∑P(Ai)logP(Aii)=1H(X丨D)n

=∑P(di)H(X丨D=di)i=1 上述公式一中将代表样本集合 X 的信息熵设定为 H（X），

将属性A的第i段取值设定为Ai，上述公式二中将属性D取值为di的概率设定为 P（di）。根据以上两个公式，能够获得决策树的具体算法：首先对待划分的信息熵进行计算，随后对所有属性作出依次遍历，从而取得当前属性所对应的条件熵，计算二者之间的差值，也就是相关属性的信息增益，将信息增益最大值作为属性节点，按照此规律自动生成下级节点，直到节点熵值减少到阈值为止，上述流程便是决策树的计算原理与流程，由于此算法的复合效果以及可解释性，因此在图像数据处理中得到了普遍应用。

2.K 均值聚类

K-Means是机器计算时十分有效的聚类计算方法，其能够在没有样本标签的前提下对样本信息作出分类挖掘。是一种将距离划分作为基础的算法，其计算过程中判定样本之间的相似程度时通常使用欧氏距离，通过多次划分过程进而计算出具体的 K 个族[5]。K-Means计算方式的具体过程为：根据提前给定的 K 值，对目标类别数进行确认，随机在样本数据中随机产生 K 个中心点，并且根据中心点与样本之间的距离进行重新归类，直到分类结果与上次结果相同时完成分类计算。但是，K-Means计算方法同时也存在不足之处，比如 K 值在计算过程中的重要性，如果 K 值错误，便会影响到计算结果。尽管如此，K-Means计算方法仍然影响了众多领域，由于其自身简单的计算流程以及极计算方式的不断改良，从而使结果的准确性得到大幅度提升。

信息系统工程 │ 2019.10.20147

ACADEMIC RESEARCH 学术研究

三、深度学习与图像处理有机集合

由于传统图像数据处理方法普遍将人工设计作为基础，导致计算环节不够全面具体，同时缺乏一定的深度，只能对图像表层信息进行分析，而无法针对深层次的信息进行较为系统的分析，进而使机器学习速度缓慢，图像数据处理能力逐渐无法满足发展需求，因此便研发了深度学习方法，能够对图像处理功能进行良好优化，使识别效果得到大幅度提升。接下来便介绍深度学习与图像处理有机结合后的理论体系。深度学习系统的典型模型为多隐层的多层传感器，根据不同层次采取不同的连接方式，同时将学习中枢划分为三类模型。其中有两种类型普遍应用于图像数据处理。其一为全连接神经网络，也就是有效连接邻层之间的节点；其二为卷积神经网络，将卷积核作为模型，使邻层之间能够进行数据互换。以上两种模型在进行分类计算时都会应用较差熵方式，二者虽然学习训练过程不同，但是均应用反向学习训练方法，从而有效解决局部最优问题。反向训练算法在实践时普遍应用随机梯度下降，进而通过局部信息来对整体梯度进行计算，最终能够跳出局部最优的循[6]。针对不同问题使用不同模型，在图像数据处理时，卷积神经网络能够有效解决各类问题，以此实现自适应的特征识别，相比传统识别模式有着大幅度的提升。

四、结语

综上所述，本次研究首先对传统图像数据处理流程以及方法作出介绍，随后阐述了机器学习与图像数据处理结合后的常用计算方法，通过分析方法中的优点与缺点进而引出深度学习与图像处理的有机结合，介绍了当下的研究现状以及应用原理，提出了深度学习的优势，即计算范围的广泛性与计算结果的准确性，进而指出了深度学习能够满足互联网的高速发展需求。H参考文献

[1]董明.基于机器学习与图像处理的目标Mark识别算法[J].计算机与数字工程,2016(12):2488-2492.

[2]胡刚,荆磊,朱磊.基于机器学习的图像特征提取技术在图像版权保护中的应用[J].科技创新与应用,2016(31):14-15.

[3]周子焜.机器学习在图像处理中的应用[J].电子制作,2018,359(18):70+73-74.

[4]刘飞,张俊然,杨豪.基于深度学习的医学图像识别研究进展[J].中国生物医学工程学报,2018(1):86-94.

[5]刘燕,董蓉,李勃.基于机器学习的图像分割算法研究[J].电视技术,2017(11):32-39.

[6]张传娟.机器学习在智能交通中的应用关键技术研究[J].电子世界,2017(22):188-1.

（作者单位：深圳市新锐宝科技有限公司）

（上接第146页）

仿真实验中，输入和输出参数的基本论域标定如下：e为[-30，30]，单位V；ec为[-100，100]，单位V/s；∆Kp为[-12，12]；∆KI为[-03，03]；∆KD为[-0.6，0.6]。因此，输入和输出变量的比例因子分别为

（3）

（4）

将模糊PID控制器替PID模块，并结合XX型坦克电源系统模型图，开展突加/突卸80A阻性负载和发电机起励条件下的励磁控制性能仿真实验，结果如图6所示。

五、结论

本文以同步发电机为控制对象，设计开发了数字式励磁控制系统，有效提高了该型坦克发电机的输出稳压精度，并结合PID和模糊控制特点，利用Matlab构建模糊PID励磁控制器。通过与模拟式比例控制和传统PID的仿真对比，得到基于模糊自适应PID 控制算法的数字励磁控制系统，其具有超调小、动态响应速度和稳态控制精度高等特点。H参考文献

[1] 石辛民, 郝整清. 模糊控制及其 MATLAB 仿真[M]. 北京：清华大学出版社, 2008:6-9.

[2] 高景德, 王祥珩, 李发海. 交流电机及其系统分析[M]. 北京：清华大学出版社, 1993:1-87.

[3]Sung-Geun Song, Feel-soon Kang, Sung-Jun Park, et al. Zero-voltage and Zero-current Swithed Fuel-cell Powered DC-to-DC converter. In: Signals, Circuits and Systems ISSCS 2007, Volume: 2,1-4.

[4] 秦岭,谢少军,周晖.一种新型 ZCS PWMBuck 变换器研究[J]. 电力电子技术, 2007,41(2).

[5] 秦岭,谢少军,周晖.一种基于改进型零电流开关单元的PWM 变换器[J]. 电工技术学报, 2007, 22(4):91-99.

[6] 刘继伦. 一种基于模糊PID 控制策略的微型同步发电机励磁系统[D] 河北工业大学硕士论文, 2007:7-8.

图6 突加/突卸80A负载（左）和发电机起励条件下（右）

的发电机输出电压仿真波形

图6所示仿真结果表明，基于模糊PID控制算法的励磁控制系统具备较好的控制性能，不同波动条件下，发电机输出电压超调较小且动态速度快，能够满足坦克电气设备对电源系统供电品质的需求，模糊PID作为数字式励磁控制系统的核心控制算法是非常有效的。

148

（作者单位：陆军装甲兵学院兵器与控制系）

信息系统工程 │ 2019.10.20

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文