美章网 资料文库 上下文感知手写数学公式结构范文

上下文感知手写数学公式结构范文

本站小编为你精心准备了上下文感知手写数学公式结构参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

上下文感知手写数学公式结构

《湘潭大学自然科学学报》2014年第二期

1数学公式书写结构分析

书写过程有规范和即兴两类,本文仅针对规范书写过程讨论.数学公式书写结构分为一般和非一般两大类.一般书写结构指后续字符书写空间位置位于当前符号的紧邻8个区位上,即右区位,右上区位、右下区位、上区位、下区位、左区位、左上区位、左下区位.分段函数、分数及水平括盖等结构为具有典型意义的规范型非一般书写结构.(1)分段函数结构:图1为规范型的分段函数书写结构,花括符右边第一行方格为第一子段函数数学式子,加粗的橄榄球形状表示条件符号链的最后一个符号;加粗的长方形表示靠近大“{”的下一个子段函数数学式子的第1个符号书写区位.在书写至条件符号链的最后一个符号之后,下一个符号位于靠近大“{”的下一个子段函数数学式子的第1个符号书写区位.(2)分数结构:图2为规范型分数三种常见书写过程结构.图2(a)的加粗方框所占的区位代表了分数的最后分子符号区位,箭头所指的方框代表分母最先符号区位.图2(b)的加粗方框所占的区位代表了分母最后符号区位,箭头所指的方框代表脱离分数子式首符号区位.图2(c)的加粗方框所占的区位代表了分母最后符号区位,箭头所指的方框代表分子最先符号区位.(3)水平括盖结构:图3为上水平括盖的两种写法,图3(a)为自下而上书写,每写一个主链符号联想括盖符号起始区位和下一个一般书写结构的主链符号区位;图3(b)先写上水平括盖,每写完一个主符号链符号联想两个区位,一个是该符号的一般书写结构后继区位,另一个就是加粗椭圆所表示的区位.下水平括盖结构按相反方向描述.白板书写教学过程难免即兴书写,即兴书写的结构识别需进行专题研究.

2区位上下文感知模型设计

2.1一般书写结构上下文感知模型设计源位符号的紧邻空间区域按8方向定义,如图4所示.面向电子白板,源位符号的紧邻后续符号将处于8方向的何目标位置,或者说处于何目标位置的概率,不同的符号类别有不同的分布,不同的教学层次分布也存在区别.将数学公式符号分为数字、一般运算关系符、不同文种的数学变量字母及特殊意义数学关系符四大类符号.特殊意义数学关系符主要指∑、∏、∫、槡等.前三类符号作为源位符号的书写链接结构均按一般书写过程完成,称之为一般书写结构.一般书写结构中源位符号后续链写符号8方向目标位置的感知模型由教学层次代码、感知区位状态码及符号链接结构所属教学层次的应用概率(简称为教学概率)等三类字段组成,通用结构如表1所示.)为感知区位,SACi∈{0,1},SACi取1系统对相应的表示区位提供符号及区位识别服务,反之不予服务;教学概率参数表明相应区位与源位符号的链接结构在该教学层次的出现概率,系统按概率大小,由大到小监测目标符号所在的区位,即系统的后继服务区位不但要是可感知区位,而且优先考虑教学概率高的区位.当源位符号为数学公式首写符号,后续符号处于8方位的任何一个区位均有可能,但根据教学层次仍可分为系统服务区位和不服务区位;非首写符号至少存在1个固定系统不服务区位;系统服务区位数大于等于1,但有效目标区位仅为1个.源位符号关于教学层次的区位上下文感知模型的向量结构记为的各元素均为二元结构,为便于分析时的数据提取,元素位置与图4所示方位序号严格对应.

2.2规范型非一般书写结构上下文感知模型设计非一般书写结构指的是不能按图4表达后继符号的书写区位,但这些书写过程结构仍是相对规范的,即系统仍可根据源位符号为用户提供相对稳定的服务区位.限于篇幅,本文仅以分段函数结构和分数结构为例讨论规范型非一般书写结构上下文感知模型构造方法.

2.2.1分段函数结构分段函数的标志性符号为大左“{”,多见结构为“={”.如图1所示,第1子段函数式子的第1个符号按一般书写结构提供服务,最后1个符号与条件符号链的首符号至少相距一个符号宽度,子段函数的每一个符号均应联想一般和相距一个以上宽度的两个后继区位;条件符号链的每一个符号同样应考虑两个后继区位,一个是符合一般书写结构规律的后继区位,另一个是靠近大“{”的下一个子段函数数学式子的第1个符号书写区位.基于此联想结构,在一般书写结构区位上下文感知模型的基础上增加两个服务区位,一个是距离子段函数式子至少一个符号宽度距离的条件符号链首字符服务区,二个是进入条件符号链后靠近大“{”的新子段函数式子首字符服务区位.分段函数感知模型表示为LLB,其结构为在(1)式中按序增加(SAC9,PEL9),(SAC10,PEL10),SAC9为距离子段函数式子一个符号宽度距离的感知区位状态码;SAC10为新子段函数首符号感知区位状态码;PEL9、PEL10为相应的教学概率.

2.2.2分数结构依据图2联想结构,在一般书写结构区位上下文感知模型的基础上增加三个服务区位,一个是分数分母首字符服务区,另外两个是分数分子首字符和脱离分数子式首符号服务区.以FL表示分数感知模型,其结构为在(1)式中按序增加元素(SAC9,PEL9),(SAC10,PEL10),(SAC11,PEL11),SAC9为分数分母首字符感知区位状态码;SAC10为分数分子首字符感知区位状态码;SAC11为脱离分数子式首符号感知区位状态码;PEL9、PEL10、PEL11为依次相应的教学概率.

2.3特殊意义数学关系符书写结构上下文感知模型设计围绕特殊意义数学关系符书写辅助符号串,辅助符号的完全不可感知区位是不能直接套用一般书写结构的产生原理,特殊意义数学关系符的上下文感知模型需综合一般书写结构与规范型非一般书写结构的感知模型构建.特殊意义数学关系符的感知模型由三部分组成,一部分是特殊意义数学关系符的后续首符号区位服务;第二部分是辅助符号串中后继符号区位服务;第三部分为脱离特殊意义数学关系符符号体系后的后继首符号服务区.

2.3.1∑感知模型构建(1)书写完∑,需要联想∑符号的上表达式首符号区位、下表达式首符号区位和右表达式首符号区位;(2)书写∑的上表达式时,如果下表达式没有书写,那么每写完一个上表达式符号之后,都要联想两个后继区位,一个是符合一般书写结构规律的后继区位,另一个后继区位是下表达式首字符区位;如果下表达式已经书写,那么每写完一个上表达式符号之后,还是要联想两个后继区位,一个是符合一般书写结构规律的后继区位,另一个后继区位是右表达式首字符区位.同理有下表达、右表达式的联想.以SUM表示∑感知模型,其结构为在(1)式中按序增加元素(SAC9,PEL9),(SAC10,PEL10),(SAC11,PEL11),(SAC12,PEL12),SAC9为下表达式首符号感知区位状态码;SAC10为上表达式首符号感知区位状态码;SAC11为右表达式首符号感知区位状态码;SAC12为脱离特殊意义数学关系符符号体系后的后继首符号区位状态码;PEL9、PEL10、PEL11、PEL12分别为依次对应的教学概率.与∑相似结构的有∏、∫等.

2.3.2槡感知模型(1)书写完槡,需要联想槡符号的左上表达式首符号区位、内表达式首符号区位.(2)当书写槡的左上表达式时,如果内表达式没有书写,那么每写完一个左上表达式符号之后,都要联想两个后继区位,一个是符合一般书写结构规律的后继区位,另一个后继区位是内表达式首字符区位;如果内表达式已经书写,那么每写完一个左上表达式符号之后,还是要联想两个后继区位,一个是符合一般书写结构规律的后继区位,另一个后继区位是脱离特殊意义数学关系符符号体系后的后继首符号服务区.同理有内表达式书写的联想.以NRT表示槡感知模型,其结构为在(1)式中按序增加元素(SAC9,PEL9),(SAC10,PEL10),(SAC11,PEL11),SAC9为内表达式首符号感知区位状态码;SAC10为左上表达式首符号感知区位状态码;SAC11为脱离特殊意义数学关系符符号体系后的后继首符号区位状态码;PEL9、PEL10、PEL11分别为依次对应的教学概率.

3结构分析实现

利用字符位置上下文感知模型实现对数学公式在线书写过程进行跟踪而实现结构分析.

3.1区位优先级确认对于当前的SBS,根据其符号属性建立相应的现场实时跟踪感知模型,模型的内容取自该符号所在的综合模型库.现场实时跟踪感知模型的区位感知状态码根据当前SBS的设置,可服务区位的优先级由教学概率大小排序.记→SBS为现场实时跟踪感知模型向量。

3.2区位服务按→SBS确定的区位优先级有序的区位扫描采集数据.对于一般书写结构,图4中各箭头线为各区位的方向线,与各区位质心和源位符号质心的连线相重叠,1区位方向线吻帖二维坐标系横轴,设αi为第i区位与横轴的夹角,i∈{1,2,…,8},[αi-22.5°,αi+22.5°]为第i区位的角度范围,按此分别建立8个相应的区位书写信息监测与获取函数.此外,非一般书写结构的数学公式根据各自结构特点增加区位书写信息监测与获取函数,如分段函数增加2个,分数结构增加3

3.3区位确认根据→SBS与区位预测所获得的i、A、(cx,cy)进行最终的符号区位确认.A内容用于识别书写模式.第i区位为优先考虑区位,当该区位不能确认为当前书写模式所在区位时,依据→SBS内容进行有序确认.不同结构采用不同区位确定依据与方法,一般书写结构的确定依据为质心连线与横轴坐标的夹角、教学概率,当夹角处于两相邻区位区域交界线的非稳态角偏移角区,按教学概率判决;分段函数的特征结构通过设置后继首符号质心与“{”的上端点间距阈值、条件符号链与子段函数末符号间距阈值进行判决;分数函数的特征结构通过分数线的质心坐标、左端点坐标和右端点坐标与当前输入符号的质心坐标之间的关系进行分子、分母、脱离分数子式等的首符号区位区分;∑符号体系的特征结构通过∑符号的质心坐标、左上端点坐标及右下端点坐标与当前输入符号的质心坐标之间的关系进行上表达式首区位、下表达式首区位、右表达式首区位及脱离特殊意义数学关系符符号体系后的后继首符号区位区分;槡符号体系结构的特征结构通过槡符号中一横的左端点坐标、右端点坐标以及槡的外包矩形的右下端点坐标与当前输入符号的质心坐标之间的关系进行左上表达式、内表达式及脱离特殊意义数学关系符符号体系后的后继首符号区位区分.区位确认的主要步骤如下(1)依据A进行符号识别;(2)源位符号是否属于特殊意义数学关系符体系符号?是则调用对应的确认子模块,转(5);(3)源位符号是否为规范型非一般书写过程结构体系符号?是则调用对应的确认子模块,转(5);(4)调用一般书写结构符号区位确认子模块;(5)建立相应符号体系或结构的标准区位标识数据.

4实验与效果分析

符号识别借鉴[8],实验符号集如表2中源位符号栏所示,教学概率分别取自[10~12].表2给出按符号属性分类的各类书写结构上下文感知模型设计.取αi=(i-1)×45°,第i区位的可靠区位偏移角度△αi1=22.5°,非稳态偏移角度△αi2=5°;分段函数结构分析阈值△σ1=△σ2=15.以小学为例,图5(a)为触摸屏书写的正方形面积计算公式的手写结构,图5(b)为投影显示的识别结果的印刷体.“S”字符为首字符,→SBS=[(SAC1,0.50),(SAC8,0.50)],区位1和区位8的监测时间都为500ms,因为区位1排在区位8的前面,所以优先考虑字符“S”的区位1.当系统监测到penUp事件后,开始严格按照各个区位的监测时间反复在“S”字符的区位1和区位8监测“S”的下一个字符的笔迹坐标是出现在区位1的范围还是区位8的范围.在1200ms的时候,利用算法2在区位1采集到“-”的笔迹坐标,因此区位监测函数返回假设区位码1.在系统监测到penUp事件后,返回“-”的整个坐标点集,接着区位识别函数优先考虑“-”是否真的在“S”字符的区位1当中,“-”与“S”形成的角度β=2°,α1-△α11+△α12≤β≤α1+△α11-△α12,因此“-”确实在“S”的区位1当中.后续的服务与识别过程大同小异.图6(a)、(c)、(e)分别是三个手写数学公式,(b)、(d)、(f)分别为对应识别结果的印刷体投影显示.表3给出源位符号为数字符号时其后继符号区位跟踪时间的比较,数据表明,本文方法对于可服务区的区位确定时间差异不大,而文献[1]使得常链区位与不常链区位的区位确定时间相差较大,在不常链区位的确定时间上,本文方法明显快于现有方法.书写过程中不常链区位出现越多,本文方法的速率优势越突出。图7为本文方法与文献[1]、文献[2]方法就高中层次中20个实验公式所含301个区位的识别率比较.数据表明本文方法具有更高的区位识别率.

5结束语

利用不同教学层次的公式复杂度及子结构出现概率的区别进行手写数学公式识别有利于深化数学公式识别研究.本文给出基于上下文感知联机手写数学公式符号区位跟踪结构识别方法,取得的成果主要有:(1)提出了结合区位感知与教学概率的上下文感知联机手写数学公式符号区位跟踪模型;(2)设计并实现了基于区位跟踪的结构分析算法.关键指标明显改善.本文方法也可借鉴于其他与结构相关的教学内容实现手写模式转换为印刷体模式的投影显示,如化学分子式、乐谱、基本图形及工程图学等。

作者:冯任昆戴永王求真李璇喻世东单位:湘潭大学智能计算与信息处理教育部重点实验室