美章网 资料文库 教学环境下头部姿态检测系统探讨范文

教学环境下头部姿态检测系统探讨范文

本站小编为你精心准备了教学环境下头部姿态检测系统探讨参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

教学环境下头部姿态检测系统探讨

摘要:在线上教育越来越普及的今天,人们往往只迷恋于自己学了几门课程,看了几个视频,家长往往也只是单纯的为了让孩子学而去报,但是之于孩子真的有没有在学,有没有认真去看,或者学生在观看过程中有没有不自觉的走神而错过哪些内容,这些问题的出现大大影响了在线教育的质量水平,往往只是达到了量而达不到质的要求。针对此问题,本文提出了一种教学环境下的头部姿态检测系统,该系统首先利用haar特征以及svm分类器对人脸部位进行检测,检测到目标后,利用基于meanshift的跟踪算法对目标区域进行跟踪,防止出现用户扭头或者低头抬头等动作导致人脸检测目标丢失问题,然后利用光流法追踪目标区域左右、上下两组子区域的光流来检测用户到底是头部平移还是发生了扭头抬头等动作,并将此结果在系统内表示出来。

关键词:haar特征;svm算法;meanshift算法;光流法检测头部姿态

0引言

近些年来出现了各种各样的网上课堂,如网易云课堂、慕课,计蒜客等等在线教学平台,他们的出现无疑为广大学者提供了更加方便的途径去学习知识,但是无论是主动学习还是被动学习,都存在着走神甚至是应付的情况出现,尤其是被动学习,学生被家长报名了各种各样的在线课程,尽管看似能够学到很多东西,但是很多学生只是单纯的为了应付课程,根本没有学到想要的知识。而面对走神这种情况,很多时候更是学生不自觉的走神,自己都没意识到,此时所听课程的掌握往往也会很差。针对以上问题,本文提出了一套教学环境下的头部姿态检测系统,该系统可以利用电脑所带摄像头来检测学生头部运动姿态,进而为判断学生是否认真听讲,是否走神,从而有针对性的对学生进行课程推荐或者为家长、学生提供一个知识点的掌握程度汇总,方便家长、学生对学习过程进行评价。目前市面上的线上教学系统更多的是依靠学生自己的自觉性来进行学习,无论是网易云课堂还是慕课,或者某些开源的教学平台,例如moodle,都是学生自主选择所要学习的课程,然后自主选择该课程中的某一章节,至于学习效果如何,还需要学生主动填写网站所提供的测试题来进行判断,无法自动根据学生学习时的表现来进行推断。在线下课堂中,目前也很少有学校将行为姿态运用到日常教学当中,为数不多的学校采用了类似的技术,如最为出名的杭州第十一中学的“智慧课堂行为管理系统”,也只是处于实验阶段,目前对于该方向的关注度还处于较低水平。本文共分为4个部分,其中第二部分具体介绍了本文所提出的方法以及所涉及到的技术,第三部分进行了实验验证,第四部分是对本文的总结与展望,对系统提出了进一步的改善方向。

1本文方法

本文首先利用haar特征[1]以及svm[2]分类器对视频进行目标定位,定位到以后,利用基于meanshift的目标跟踪算法对目标进行持续的跟踪,此过程除了可以避免因用户面部运动幅度过大引起的面部检测不到的问题,还能准确的将同一个人不同时刻的行为对应起来,最后,我们利用基于光流法的检测算法对追踪区域进行持续的检测。

1.1haar特征

Haar特征是一种反映图像的灰度变化的,像素分模块求差值的一种特征。它分为三类:边缘特征、线性特征、中心特征和对角线特征。用黑白两种矩形框组合成特征模板,在特征模板内用黑色矩形像素和减去白色矩形像素和来表示这个模版的特征值。之后,Viola以及Lienhart等人又提出了更多的矩形特征、边缘特征、线特征等更加贴切描述图像区域特征的特征模板。尽管模板的种类多种多样,但其计算规则都是相同的,即利用加权的方法使得黑色区域与白色区域的像素个数相同,然后利用黑色矩形区域像素和减去白色矩形区域像素和来得到该模板的特征值,但是随着模板大小的改变,计算量也会随之发生改变,为了解决此问题,采用积分图的方法计算haar特征。积分图是将图片左上角作为(0,0)点,然后计算每个点与(0,0)所形成对角线的矩形区域的像素和,将该值填入该点所在像素,形成积分图,如此一来,无论计算哪个区域的像素和,都只需要计算4次加减法即可。

1.2svm算法

SVM算法又称支持向量机算法,是机器学习领域当中常见的并且效果出众的判别算法。其本质上与线性回归类似,先训练出一个线性分割超平面,然后该线性分割超平面既是决策边界,在超平面两边的划分为两个不同的类别。

1.3基于meanshift的目标跟踪算法

[3]目标跟踪的基本原理是相邻帧之间内容相差非常微小,同一目标在相邻帧中的位置坐标也不会发生太大的变化,只要在前一帧所确定的目标区域附近搜索目标特征,即可确定下一帧中目标所在位置。

1.4基于光流法的头部姿态检测

光流法是一种计算物体、像素运动方向以及运动趋势的方法。利用相邻帧在时间域上的相关性,可以找出特征点在相邻帧上的位置,比较前后帧之间的位置信息,即可得到相关的特征点的运动趋势以及运动大小。光流所形成的光流场既是运动场在二维平面内的投影。光流的计算有两种方法:稀疏光流法,稠密光流法。在本文中因为我们采用的是局部区域运动趋势,所以采用稠密光流法。

2实验验证

本文采用FacePix数据库[4]数据进行实验,FacePix数据库中除了基本的人脸图像外,还有姿态视频数据库,该数据库包含了被采集者从中心向左、向右、向上、向下旋转,然后回到中心的姿态,满足我们所要检测的姿态种类。其中,基于haar的人脸检测是目前已经十分成熟的技术,在光照适合、拍摄状况良好的情况下检测效果已经得到了大众的认同。本次试验主要集中在如何界定基于光流的头部姿态检测的比值问题。根据实验发现,当上半部运动趋势与下半部运动趋势(或者反过来)的比值在1-1.3之间时,人的低头抬头行为较为不明显,当左半部运动趋势与右半部运动趋势(或者反过来)的比值在1-1.4之间时,人的扭头行为则不十分明显,因此,最终设定上半部运动趋势/下半部运动趋势大于1.3时为低头,下半部/上半部运动趋势大于1.3时为抬头,左半部/右半部的运动趋势大于1.4时为向左扭头,右半部/左半部的运动趋势大于1.4时为向右扭头。但是在实际运用过程中,我们进行测试时发现有时这个比值并不十分的准确,究其原因,我们所设定的比值是当摄像机从正面进行拍摄时的比值,但是在实际运用时,摄像头可能俯视或仰视,甚至从侧方拍摄,导致我们的比值不符合当前运行环境,此问题尚未解决,但当我们对摄像头位置进行规定后,检测的效果还是十分满意的,邀请班内同学进行测试后,在光照条件良好的情况下,较为明显的头部运动都能检测出来。

3总结与展望

本文首先利用基于haar的svm算法检测出目标区域,然后利用基于meanshift的追踪算法对目标区域进行持续追踪,并利用基于光流的头部姿态检测算法持续对目标区域进行头部姿态检测。在环境状况良好的情况下,能够达到较好的效果,但是该方法因为是基于比值的头部姿态检测,对于摄像头拍摄的角度要求较为严格,下一步工作将尝试寻找新的头部姿态算法来代替比值,进而解决此问题。

作者:张麟琛 单位:浙江省杭州第四中学