美章网 资料文库 卷积神经网络的教师打卡系统设计探讨范文

卷积神经网络的教师打卡系统设计探讨范文

本站小编为你精心准备了卷积神经网络的教师打卡系统设计探讨参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

卷积神经网络的教师打卡系统设计探讨

摘要:借助于大数据人脸识别技术,可方便学校管理者快速实现对教师是否准时上课、准时监考进行监督管理。对教师打卡系统进行了总体设计,包括硬件设计和流程设计,在此基础上,对人脸识别系统的设计进行了介绍,在对比多种人脸检测模型的基础上,选择利用Dlib的MMOD模型实现人脸检测功能,利用卷积神经网络模型实现教师人脸特征的提取和识别,该模型的训练过程采用不同光照、不同角度和不同距离的多种样本。结果证明,该系统很好地完成了人脸识别功能,能够实时地对教师是否准时上课、准时监考进行监督。

关键词:人脸识别;Dlib库;卷积神经网络

1概述

教师按时上课、按时监考是教学绩效考核的重要环节。传统的依靠巡视的方式来进行管理,大大降低了教学绩效考核的力度。依靠人脸识别技术,实现教师上课自动化打卡,再将教师打卡信息实时地传输到教学系统中来,与教学安排进行匹配,生成教师按时上课、监考的绩效信息,供教学管理者进行监督和管控,加强了学校教学管理的力度,提高了教学管理的效率。

2系统架构

教师上课打卡系统架构如图1所示,主要包括网络摄像头、互联网、云平台以及终端,其中网络摄像头将图像以数据流的形式通过互联网传输到云平台,云平台首先将这些图像利用Dlib库进行人脸识别,然后利用识别结果与教学系统课程数据进行匹配,生成教师按时上课、监考的绩效信息,这些绩效信息以图形化报表的形式来展示,管理者通过PC机或移动终端进行信息的查看。系统流程设计如图2所示,首先教师走到摄像头前,摄像头不停捕捉图像,当进入可识别范围内后,抓取人脸并进行识别。教师需要在摄像头前,等待系统传回的反馈信息,信息包括已识别或识别不成功等,教师平均等待时间为1.32s。

3人脸识别

人脸识别系统主要分为两部分,(1)图像检测,(2)图像识别。如图3所示,当教师走到网络摄像头前,系统利用Dlib进行人脸检测,当检测到人脸后,利用OpenCV截取人脸图像,将该图像转换为64*64*3的数据集,再将该数据集作为卷积神经网络的输入,卷积神经网络通过卷积层和池化层对数据集进行操作,得到512维的特征向量,将该特征向量输入给全连接层,全连接层进行分类,得到分类结果,并将分类结果标注在图像或视频上,识别出来的会标注名称,没有识别出来的会标注“其他”。

(1)人脸检测。人脸检测并不是人脸识别,它是对任意一幅图像或视频帧,确定图像中是否包含人脸的操作,如果包含,则返回脸的位置、大小等信息。进行人脸检测的开源软件包有很多,应用较广泛的主要有Arc鄄Face和Dlib,由于Dlib是C++工具箱,除了具有模型多样化的特点外、在适用场景和适用系统上具有很高的普适性。内置的人脸识别算法主要有两种:HOG+线性SVM的方法和MMOD-CNN的方法,其中HOG+线性SVM的方法的人脸识别度比MMOD-CNN稍低一些,主要体现在不能容忍视角旋转的变化、光照强度的变化上,而MMOD-CNN能够从不同的视角、光照条件和遮挡条件下检测人脸,虽然CPU运行速度稍逊于HOG+线性SVM,但它可以在NVIDIAGPU上运行,速度会变得更快。系统利用Dlib的MMOD-CNN的方法实现教职工人脸检测功能。

(2)基于卷积神经网络的人脸识别。卷积神经网络的优点是不用自己提取具体的特征,避免对图像进行前期的复杂预处理,也避免出现特征提取分类效果不好、相关度高等问题,它可以直接输入原始图像,通过卷积等操作,逐步抽象出图像的特征向量,被广泛应用到图像识别中。卷积神经网络的基本结构包括两部分,一是特征提取,二是分类。

(1)特征提取。卷积神经网络包含多个卷积层,每个卷积层利用卷积核扫描整个图像,得到特征图,前面的卷积层捕捉局部信息,有小的感受野,后面的卷积层感受野逐层加大,用于捕获更复杂、更抽象的图像信息。经过多个卷积层的运算,最后得到图像在各个不同尺度的抽象表示。这与人们观察图像的方式是一致的,图像的局部像素联系比较紧密,而较远的像素相关性比较弱,所以每个神经元没有必要对全局图像进行感知,只要对局部进行感知,而到了更高层次再对局部的信息进行综合操作得出全局信息。由于卷积之后产生大量的参数,再采用池化层来稀疏参数,从而降低网络的复杂度。

(2)分类。通过卷积神经网络的特征提取功能得到了特征向量,再利用卷积神经网络的全连接层实现分类的操作。全连接层就相当于传统的前馈神经网络中的隐含层,它位于卷积神经网络的最后部分。全连接层的作用是对提取的特征进行非线性组合以得到输出,它利用特征向量完成机器学习的目标。系统获取3247名教师进行不同时间段的每人75张人脸图片,共计243525张人脸图片,来训练卷积模型,如图4所示,保存的人脸图片的大小为64*64,分为R、G、B3个通道,把截取的小图片送入神经网络进行训练,输入的图片64*64*3,网络共3层卷积层,卷积核大小为(3,3),卷积步长为[1,1,1,1]。卷积层用来提取特征,增加通道个数,但是图片大小没有变化,采用最大值采样的池化层采用,把特征图分割成许多个2*2大小的矩形,取每个矩形的最大值,形成特征图,输出的特征图的长和宽均是输入特征图大小的一半。

4结语

系统采用光照、距离和角度3个维度来制定训练样本,如图5所示。其中,光照维度有5种类型,分别是白天4讲课和晚上一讲课上课时对应的不同光照强度,距离维度有5种类型,分别到网络摄像头的距离是10cm、20cm、30cm、40cm和50cm,角度维度主要有3个,分别是正面、左侧面、右侧面。全校3247名上课教师,每名教师收集75张人脸照片,共计243525样本,做好分类结果的标注,形成3247位老师的人脸特征向量。每位老师进行50次识别测试,测试者走进网络摄像头,不断调整距离和角度,以5s作为识别时间期限,共计162350次识别结果中,有8次没有检测到人脸,有32次识别错误,漏报率仅为0.0049%,误报率为0.0197%,识别效果良好。

作者:张培培 单位:华北理工大学管理学院