美章网 资料文库 机器学习在视频智能识别中的运用范文

机器学习在视频智能识别中的运用范文

本站小编为你精心准备了机器学习在视频智能识别中的运用参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

机器学习在视频智能识别中的运用

摘要:近年来以摄像头以采集工具获取实时视频数据,直观而客观地展现目标对象的动态变化过程的智能监控方法成为各行各业监控与管理的主流方法。以视频智能识别为研究对象,探讨了机器学习视频智能识别中的应用,并以Google的VideoIntelligenceAPI为重点阐述了其工作原理以及演示案例,对于提高视频监控系统系统自动检测,识别、跟踪等能力具有重要意义。

关键词:机器学习;视频数据;智能识别

图像识别是机器学习算法的重要应用方向,基于机器学习算法的图像识别的应用场景众多,例如国土部门基于遥感影像识别房屋、道路等目标物体、快递公司根据快递单号实现快递分拣与递送、交警部门基于违章拍摄视频实现违章车辆车牌号码识别等等。近年来随着物联网技术的发展与普及应用,城市的各个关键监察点均布设了各类摄像头以供不同单位与部门调用、分析与数据挖掘,以支撑智慧城市的信息化建设与智能化发展。目标识别的对象早已开始由像素的世界延伸到图像以外,视频是大量的图像在连续时间序列下所形成的动态监控信息,一直以来视频都被视为计算机视觉里面的“暗物质”,其无法像图片一样实现便捷的搜索,也无法像图片一样以像素为基本单元进行像素灰度差异化分析与图像识别,因此对于全球范围内的目标识别研究人员而言,视频智能识别是一项极具挑战性的研究。

1机器学习

机器学习是人工智能的核心,其专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,通过糅合各类算法与技术使得计算机具有自动化学习与智能化综合分析的能力,其应用遍及人工智能的各个领域。与传统计算机工作不同,其不再是按照操作人员的操作步骤按部就班地完成工作,用户只需要输入数据以及某些必要的参数,机器学习可以根据内在机制自行计算与运行,并给出分析结果以及结果精度,可以说机器学习某种意义上具有了人类处理事情的能力。机器学习与模式识别、统计学习、数据挖掘、计算机视觉、语音识别、自然语言处理等领域有着很深的联系。从范围上来说,机器学习跟模式识别、统计学习、数据挖掘是类似的,同时,机器学习与其他领域的处理技术的结合,形成了计算机视觉、语音识别、自然语言处理等交叉学科。最常用的机器学习算法包括线性回归、逻辑回归、决策树、支撑向量机、贝叶斯模型、随机森林、K-均值聚类等算法,现实世界中的大部分数据问题都可以通过上述机器学习算法加以解决。

2机器学习在视频智能识别中的应用

视频数据相较于图片数据而言具有动态、海量、实时的特征,作为结构化大数据的典型对象,运用机器学习算法对视频数据中的目标对象进行高效率、高精度分类与识别是当前结构化大数据挖掘与分析的重要研究方向。基于机器学习的视频智能识别方法基本原理在于依托机器学习算法对视频中的对象所构成的训练样本进行训练与模拟,构建能够满足智能识别精度要求的机器学习模型,以训练好的模型为核心依托,对待识别视频数据进行模型实践与推理,从视频数据中快速检测并识别出响应的目标对象或指定地物。当前国际主流的IT企业均在推进其视频智能识别研究工作,2017年Google公布了新的机器学习API:VideoIntelligenceAPI,它可以自动识别视频中的物体,开发者可以开发能在视频内部侦测目标的应用程序,让视频变成可以搜索、可以发现的视频。比如开发者可以用动词、名词代表这些目标对象,例如“跑”“狗”,然后进行搜索,使得从视频中提取信息变得跟从图像中提取信息一样简单。VideoIntelligenceAPI的工作原理为:其相当于服务与应用的桥梁,新API连接到“谷歌云机器学习”(GoogleCloudMachineLearning)平台,这个平台主要用来计算;同时VideoIntelligenceAPI又将带注释的视频存储到“谷歌云存储”(GoogleCloudStorage)。用谷歌新API开发的应用程序可以获得一些特殊功能,让终端用户在视频内搜索目标变得更加容易。用户可以在视频文件中搜索每一个瞬间,可以查找事件,探寻意义;VideoIntelligenceAPI还可以帮助用户在视频中确定名词实体,确定目标对象在视频中出现的时间以及出现的频次,还可以检索视频、照片、每一帧之中的相关信息,将信号与噪音分离。如图1所示为基于VideoIntelligenceAPI的智能识别演示案例,在演示案例中,用户在MP4视频文件中搜索动物,文件时长约为1.5分钟。CloudVideoIntelligence会生成标签,比如动物、野生动物、动物园、陆生动物、自然、旅游、旅游景点等标签。新API可以侦测视频场景,例如,在同样的演示视频中,CloudVideoIntelligence发现场景变化了48次,它可以实时侦测,当场景变化时为目标物贴上标签;有一幕场景显示的是老虎Tom,API生成了7种标签;有一幕场景对准动物园的标志,系统生成了2种标签,这些标签都是实时生成的,这是视频智能识别区别于图像识别的重要特征,基于VideoIntelligenceAPI,用户可以利用工具在视频中搜索目标,正如在文档中搜索一样,同时搜索与识别的效率以及精度均能满足用户的视频数据挖掘需求。

参考文献

[1]张传娟.机器学习在智能交通中的应用关键技术研究[J].电子世界,2017(22):186-187.

[2]郭利敏,刘炜,吴佩娟,张磊.机器学习在图书馆应用初探:以TensorFlow为例[J].大学图书馆学报,2017,35(06):31-40.

[3]吕云翔,马连韬,熊汉彪,徐宇楠.基于机器学习的监控视频行人检测与追踪系统的设计与实现[J].工业和信息化教育,2016(11):66-72.

[4]吕益民,吴旻中,苏伟杰.基于Spark大数据平台在视频中搜索特征车辆的研究[J].警察技术,2016(04):80-82.

作者:穆雪漫1;宫法明2 单位:1.同济大学电子与信息工程学院,2.中国石油大学(华东)计算机与通信工程学院