美章网 精品范文 自动识别技术论文范文

自动识别技术论文范文

前言:我们精心挑选了数篇优质自动识别技术论文文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

自动识别技术论文

第1篇

关键词:超高频;射频识别;车辆管理

1 引 言

随着我国城市化建设的快速发展,人民生活水平的不断提高,车辆数量和道路交通流量急剧增加,而道路的建设远赶不上车辆的增长,伴随而来是交通拥堵、车辆违章违法等现象的日益突出,传统的车辆管理系统已经面临巨大挑战。目前发展的射频识别(RFID)技术为这个问题的有效解决提供了理想的解决方案,同时也是以后车辆管理自动化的发展方向[1-7]。

而对公交公司而言,其停车场平时需要管理大量的公交车辆,同时车辆停放比较分散,出入频繁,车辆日常管理和安全监管难度较大。因此,需要采用高智能化的管理手段来实现停车库信息化管理的建设[8-10]。

在深入分析国内外成熟的基于RFID的智能停车场管理系统关键技术基础上,以某公交公司的车辆管理为典型应用背景,本文提出的一种基于超高频射频识别(RFID)技术的车辆管理应用方案。该方案可有效降低车辆信息查询复杂程度、车辆定位等问题。该系统采用自行研发的FR520读写器等关键设备,并通过立体停车库的大量测试结果证明方案合理可行,运行稳定可靠[11-15]。

2 射频识别技术

自动设备识别系统(Automatic Equipment Identification, AEI)是国际上正在努力开发并快速推广普及的技术。它适用于安全性要求较高的部门的车辆电子自动管理系统。该项技术的基本思想是通过采用一些先进的技术手段,实现人们对各类物体和设备在不同状态(高速移动、静止、恶劣环境)下的自动识别和管理,特别是采用超高频RFID技术的自动设备识别系统正日益广被使用。

RFID也称智能标签,是继个人电脑(PC)、互联网、无线通信之后的第四次信息技术革命。一个RFID系统通常由三部分组成:读写器、标签及相关的天线。读写器天线发射无线电信号给标签,标签通过自己的天线接收此信号,利用该信号得到的能量启动标签上的集成电路芯片工作。作为条形码的无线版本,智能标签技术具有条形码所不具备的防水、防磁、耐高温、使用寿命长、读取距离大、标签上数据可以加密等一系列优点,正在许多领域得到应用。

在图1所示的简单RFID系统中,现将阅读器(Reader)、天线(Antenna)和标签(Tag)的作用分别描述如下:

阅读器:读取(有时还可以写入)标签信息的设备,可设计为手持式或固定式;

标签:由耦合元件及芯片组成,每个标签具有唯一的电子编码,附着在车辆上标识目标对象,标签编写成车辆的编码唯一识别;

天线:在标签和读取器间传递射频信号。

图1 系统工作原理示意图

3 车辆管理系统设计

针对公交公司车辆管理背景,以其所属的一个典型的立体停车场为例,车辆管理系统设计过程中需要重点考虑的问题包括:

(1) 建设目标

为立体停车场管理人员提供实时监控车辆信息的平台、实现智能化车辆规范有序定位管理;还可以在管理立体车库的车辆进出,严密监视出入车辆,有效控制定位车辆的作息位置,保证系统运行稳定可靠。

(2) 丰富的功能

具有自动识别、智能控制、车辆定位管理、报警提示、信息记录、数据通信、查询、统计、分析等功能;同时具备扩展方便,升级容易等特性。

(3) 运行稳定可靠

具有冗余容错性能;系统处理速度快,可靠性高,稳定性好,错漏率低,并具有数据备份、数据恢复能力。

(4) 车辆实时定位管理

对于立体车库内车辆进行数字化管理;通过自动识别车牌卡信息,可以对车辆进出时间进行跟踪,同时定位车辆停放及作息位置的信息。

4 车辆管理系统方案

(1) 系统分部网络结构

图2所示的智能车辆管理系统是以后台管理系统和前端控制系统通过专用网络传输设备组成的管理系统,网络通信协议采用TCP/IP协议。而前端控制系统内的通道识别系统则采用10/100M以太网组成的一个小的局域网系统,进行识别和外设控制管理。

图2 系统分布网络结构

(2) 立体车库平面结构

图3所示为该立体车库的读写系统覆盖效果图。系统软件可以控制读写器的四根天线的轮询读取车辆标签时间顺序,根据每个天线能管理定位对应停车区域的车辆,能把实时的公交停车位置区域上报到公交公司的调度室,方便管理人员对车辆管理与停放位置的查询定位。

(3) 车辆管理平台组成

后台管理平台包括:管理计算机、发卡读写器、读写器、读写器专用天线及电缆。其中上层应用软件及其数据库系统安装并存储在管理计算机上。

5 固定式阅读器选型

图4所示是一种能满足本文系统需求的四通道远距离超高频RFID固定式阅读器产品HIK-FR520,支持DRM工作模式,具有良好的防冲突和抗干扰性能,识别率高,功能强,可靠性高,可扩展性好等特点。

该产品可广泛应用于智能交通、服装盘存、智能仓储等领域,能够实现现代化的物流管理,海关智能通关、城市车辆自动识别、智能停车场、高速公路不停车收费应用等集成系统。其主要特点包括:

兼容EPC C1 Gen2/ISO 18000-6C;

PowerPC架构CPU MPC8308,128 MB RAM;

具有载波消除功能,抗干扰能力更强;

支持EPC密集型读取模式(DRM);

远距离读取,RF输出功率达到32.5 dBm;

支持4路天线接口;

支持640 Kb/s标签数据读取速率;

配置以及参数设定灵活,提供最大化标签阅读量和最佳工作性能;

智能交通及车辆管理

大规模RFID系统应用

图3 读写系统覆盖效果图图 4 超高频固定式读写器

HIK-FR520的主要性能指标如表1所列。

6 车辆管理系统的特点

公交立体停车管理智能是运用超高频自动识别技术,利用现代计算机技术和自动控制技术等多领域技术,综合实现车辆自动识别和定位管理。本文提出的超高频RFID车辆管理系统具有以下主要特点:

整个系统具有远距离快速识别、智能控制、高可靠性、高保密性、易操作、易扩展等特点;

建立安全可靠的注册车辆档案,通过高新技术加强车辆监管防盗功能;

提供一个对进出车辆自动识别、智能管理的先进、可靠、适用的数字化平台,使公交公司对所有公交车辆出行、位置进行实时动态管理的能力得到质的提高;

能有效、准确的对进出停车库的车辆(装有车辆电子号牌的车辆)的数据信息识别、采集、记录、跟踪;

实时数据可以通过网络及时传送到后台管理系统,使管理人员在办公室内就可以及时了解公交车辆的停车在立体车库位置的情况。

7 结 语

基于射频识别的智能车辆管理系统是一种高效、快捷及科学的车辆管理手段。本文提出的超高频车辆管理系统应用于停车场车辆管理中,具有效率高、准确性好、安全性高的优点。该系统易于操作维护,自动化程度高,大大减轻管理者的劳动量。该方案的主要创新点在于为立体停车场管理人员提供实时监控并识别车辆信息的平台、实现车辆的智能化规范有序定位管理,系统功能丰富,运行稳定可靠,具有广阔的市场应用前景。

参 考 文 献

[1]杨笔锋,詹艳军. 基于射频识别的智能车辆管理系统设计[J]. 计算机测量与控制,2010,18(1):97-99.

[2]黄银龙,张辉,徐旭,等. 车辆管理RFID电子标签内存规划研究[J]. 通信技术,2010,43(2):141-145.

[3]王庆安. 基于RFID和GPRS的非机动车辆管理系统研究[J]. 中国制造业信息化,2007,36(13):66-68.

[4]狄巨星,赵建光,范晶晶,等. 车辆管理RFID标签电源低功耗研究[J]. 电源技术,2013,37(7):1233-1274.

[5]尼涛,杨宏,艾春安. 基于RFID技术的车辆管理门禁系统设计[J]. 工业控制计算机,2005,18(9):1-2.

[6]马凯. 基于多节点射频卡的车辆管理系统研究[J]. 交通标准化,2013(13):34-36.

[7]孙欣. 基于超高频RFID的第三方物流车辆管理解决方案[J]. 自动化博览,2012(2):80-82.

[8]杨洋. 基于RFID技术的武警车辆管理系统研究[D]. 哈尔滨:黑龙江大学(硕士学位论文),2011.

[9]杨国荣. 基于RFID技术的智能小区车辆管理系统设计[J]. 信息技术,2012(6):182-185.

[10]程仁镇. 基于车辆管理的RFID读写器设计[D]. 武汉:武汉理工大学(硕士学位论文),2012.

[11]张圣仟,杨小天,迟耀丹. 基于RFID在车辆信息自动识别技术的研究与应用[J]. 吉林建筑工程学院学报,2012(2):76-78.

[12]李元忠,余权,姚海天,等. 构建智能交通平台——RFID技术在城市车辆管理中的应用[J]. 中国自动识别技术,2008(4):90-92.

[13]王煌城,王宇歆. RFID應用於交通管理之研究[C].海峡两岸智慧型运输系统学术研讨会, 2006.

第2篇

论文关键词:物联网,大学管理,应用研究

 

一、物联网的概念

物联网(Internet of Things,简称IoT)是新兴的IT技术,它是指通过把射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,嵌入和装备到公路、建筑、电网、供水系统、大坝、油气管道等各种各样的物体中,再结合现有的互联网,实现人类社会与物理系统的整合的一种IT技术。

在这个经过整合的物联网当中,通过互联网实现物品的自动识别和信息的互联与共享,另外中心计算机群也能对整合网络内的人员、机器、设备和基础设施进行实时的管理和控制。通过这样一种技术手段,人类就能以更加精细和动态的方式管理生产和生活,达到“智慧”状态,从而提高资源利用率和生产力水平大学管理,改善人与自然间的关系。

二、基于大学校园管理的物联网关键技术

1. 感知技术

物联网多通过RFID技术、传感器来达到感知的目的。

RFID(Radio Frequency IDentification)技术,中文名为射频识别技术,它是一种非接触式的自动识别技术,通过射频信号自动、快捷、方便地识别目标对象并获取相关数据,从而实现对各类物体在不同状态(移动、静止、恶劣环境)下的自动识别和管理。

传感器是能感受规定的被测量,并能按照一定的规律转换成可用输出信号的器件或装置,多为敏感元件和转换元件组成,用来感知信息采集点的环境参数。

2. 传感器网络

传感器网络是一个分布式智能化网络系统。它在每个节点配备了传感器、无线电收发器、微控制器和能源装置等部件,再通过这些部件的协作,就可以监控不同位置的物理、环境状况论文参考文献格式。

3. 无线网络

无线网络指的是使用无线电技术进行传输的计算机网络,它是有线网络的延伸,和有线网络功能相似,只是传输技术不同而已。它的优势是在没有有线网络的地方,或是移动的环境下,也能同样地连接上网络。

4. 数据融合技术

数据融合技术是利用计算机技术、人工智能等技术,将来自多个传感器的观测数据进行采集、过滤、自动分析、综合处理,进而得出相应的估计、决策等信息,以便辅助人们进行管理、决策工作。

三、物联网在大学校园管理中应用的前提条件

大学作为年轻人密集的地方,同时也是高级知识分子集结地,在大学校园管理中运用物联网技术,能迅速被人们接受和运用。且目前很多高校都拥有多年的校园网络建设,已拥有校园网及校园无线网络。这些都为物联网在高校管理中的运用提供了前提条件。

四、物联网技术在大学校园管理中的应用

1. 应用于图书馆档案室管理

利用物联网构建新型的高校图书馆、档案室管理平台大学管理,可以创新很多管理办法。

图书馆、档案室工作人员将RFID标签贴在图书、档案中,通过标签中的芯片和天线,再利用物联网构建出RFID的无线射频智能系统,这样就能让图书、档案拥有了GPS的定位功能。图书、档案在移动过程中,一旦经过馆室中的各个检查点,就立刻并跟踪并记录下来,并在服务器中储存相关信息。这样子,师生们在电脑上输入书名、档案的师生姓名,就能实时地掌握图书、档案当前的具置,再使用便携式的扫描设备、手持机等工具进行跟踪,就能快速找到自己想要的书籍、档案。物联网技术的引入,使得以前单纯依靠号码、人工查找的办法得到了智能化的改革。

依据物联网技术,还可以设计出图书自助借还设备,师生们在借还图书时,可以来到自助借还设备前边,让设备自动读取借书证和图书,由于使用RFID技术,设备可以在几十厘米到几米距离内读取图书,还可以一次读取多本图书,这样子就提高了图书借还速度,比之前使用条形码,由图书馆工作人员现场一本一本地办理借还手续高效得多。同时大学管理,设备还可以提供24小时借还图书服务,为高校师生提供更为方便的服务。

在高校图书馆、档案室中引入物联网技术,将能为这些地方的管理提供灵活高效、减少人力的智能化方案。

2. 应用于校园安防管理

在物联网安防管理平台中,通过射频识别、图像识别、GPS、无线传导网络、遥感等技术,并结合日常的视频监控系统,全面感知校园的环境、人和物的变化,而计算机系统将这些感知信息进行汇总、处理,适时地进行提示或报警。通过物联网技术,我们就可以全方位地提升校园的安防自动化程度,实现智能化的识别和管理,提高效率,节省人力,从而更好地进行安防管理论文参考文献格式。

当有物体闯上校园的围墙或其他敏感区域时,系统通过在这些区域的红外激光、次声压传感检测器、感应光纤等传感终端,判别闯入物体的大小和具置,并通过传感网络调转相应的摄像头监控该区域,同时依靠图像识别技术跟踪闯入物体,相应的提醒信息也立即发送到中心和高校保卫人员的手持设备中。在得到提醒后,保卫人员就能立即调取该摄像头的画面。经过观察后,当确实需要派保卫人员赶到现场时,物联网安防管理平台还可以利用地磁传感器、校道旁安置的无线传感节点、无线传感网,以及保卫人员身上的手持终端大学管理,实时把握保卫人员在校园内的定位,以此中心就能方便地调度最近位置的人员前去现场。

物联网技术的引入带来了安防方法的改变,与先前的视频监控系统安防方法不一样了,物联网技术的安防管理不再要求保卫人员一直守着监控屏幕观看。由于传感网络拥有图像识别智能技术,能够在边界内出现异动时,及时感知信息,自动跟踪拍摄和录制画面,并向中心和人员发送提醒信息。保安人员可以只在收到信息后才调取、查看相应摄像头的画面。这将使得高校的安防管理轻松不少。

第3篇

摘 要:介词短语作为一种重要的短语类型在汉语中分布广泛,正确自动识别介词短语在自然语言处理的应用领域具有重要意义和积极影响。本文尝试利用目前比较流行的条件随机场模型,主要面向汉语专利文本,对其中的介词短语进行识别研究。首先在分词和词性标注的基础上对语料进行序列特征标注,然后利用条件随机场工具包训练了识别介词短语的模型,最后设计相关实验来验证方法的效果,实验准确率达到90%以上。

关键词 :介词短语 条件随机场 识别

一、引言

专利文献在国家经济发展和科技交流中发挥着十分重要的作用。近年来,中国专利的申请数量涨速飞快。面向专利领域的文本信息处理(如专利文本机器翻译)逐渐成为自然语言处理的重要应用领域之一,并引起了学术界和业界的广泛关注。

为了满足专利文本特定的表述需要,介词短语作为一种重要的短语类型,在汉语专利文本中分布广泛。据统计,在随机抽取的500句汉语专利语料中,包含介词短语的句子有226句,占到了样本总量的45.2%。[1]可见介词短语的出现比例非常高。汉语介词短语的自动识别具有较大的难度,主要表现在以下几点:

1.介词短语的内部构成相当复杂。介词短语可以由介词与其他词语和短语(动宾短语、名词短语、方位短语、时间短语等)构成,甚至可以由整个句子构成。复杂的内部结构很容易形成远距离的搭配关系。

2.兼类介词的存在。在一定的语境下,介词还可以兼做名词、量词、形容词、连词和动词等,必须结合上下文语境才能判断具体词性。

3.在同一个句子中经常会出现多个并列的介词短语,或者会出现复杂的嵌套介词短语。

下面是一个包含介词短语的真实专利语句示例:

(1)本发明【在条件允许的情况下】【通过[为一个宏块中的不同区域]提供不同的预测信息】而提出了许多更加准确的结果。

从例句可以明显地看出,专利文本中的介词短语通常具有更多的字数和更为复杂的结构。例句中用括号标示出了两个并列的介词短语结构,其中一个的内部还有另外一个介词短语,属于嵌套结构的介词短语。正确识别这些短语就比较困难了。

在句子S=W1,W2,W3……Wn中,假设字符串Wi,Wi+1……Wj为待识别的介词短语,介词短语识别的主要任务就是分别将Wi和Wj识别为该介词短语的左右边界。由于左边界就是介词本身,因此关键问题在于确定右边界位置。介词Wi通常称为前界,右边界Wj称为后界,紧邻右边界的词语Wj+1一般称为后词。

考虑到介词短语分布的广泛性和对专利文本处理的影响,本文尝试利用条件随机场模型(Conditional Random Field,即CRF),主要对大规模专利语料中位于同一分句内部的介词短语进行自动识别研究,希望能做出一些有益的探索。

二、相关研究

针对汉语介词短语识别的难点,国内外学者做了大量研究工作,提出了一些有效的方法,主要包括规则方法,统计方法和将二者相结合的混合方法。梁猛杰等(2013)通过考察介词规则库的处理特点,依据规则的覆盖程度从低到高进行分类,重新调整了规则的前后排序方案,同时对排序的规则进行优选,在保证时间复杂度较低的情况下提高了介词用法自动识别的准确率[2](P152~155)。朱筠(2013)、胡韧奋(2015)等在概念层次网络理论(Hierarchical Network of Concepts,HNC)[3]的指导下,面向汉语专利领域的文本,专门构建了较大规模的汉语专利语料知识库,在利用规则方法开展汉英专利机器翻译研究的过程中探索了介词短语的识别方法和思想[4][5]。于俊涛(2006)釆用基于最大熵模型的方法,通过获取有效的特征集合完成了介词短语识别的任务。奚建清(2007)引入机器学习方法,提出了基于隐马尔可夫模型(HMM)的汉语介词短语边界确定方法。首先基于HMM自动识别介词短语,然后利用依存语法错误校正方法对识别结果进行修正,取得了不错的识别准确率[7](P172~182)。胡思磊(2008)、宋贵哲(2011)、张杰(2013)利用CRF模型对介词短语进行识别,取得了较好的效果。于俊伟(2005)采用了规则和统计相结合的介词短语识别方法,提出了利用搭配模板获取可信搭配关系以及基于词性的三元统计模型和规则相结合的方法识别介词短语[11](P17~23)。昝红英等(2013)在已有工作的基础上,提出了一种规则与CRF模型相结合的介词用法自动识别算法。通过将人工书写的规则与CRF在宏观层面和微观层面进行有机的结合,根据介词的具体特点,选择合适的识别方法,使最终的识别准确率达到了80%左右[12](P2152~2157)。

三、CRF模型介绍

作为一种基于统计的判别式学习模型,CRF模型最早由Lafferty等人在2001年提出。该模型来源于最大熵模型。CRF通过计算和统计已知元素推理计算未知元素的条件概率。与隐马尔可夫模型不同,CRF可以利用上下文信息,而不需要严格的独立性假设,因此在序列标注问题中表现出很好的性能。此外,CRFs还解决了最大熵马尔可夫模型(MEMM)中的标注偏置问题。CRFs被广泛应用于自然语言处理领域的句法分析、命名实体识、词性标注等方面,并取得了很好的效果。CRFs是一种以给定的输入序列X为条件来预测输出序列Y概率的无向图(undirected graphical)结构模型。(X,Y)就是一个以观察序列为条件的随机域。概率计算可以通过如下公式得到:

四、基于CRF的介词短语识别

国外学者已经开发了完整的CRF模型工具包,利用工具包可以快速地训练模型并得到相应的结果。在本文中,将使用CRF++0.53版本的工具包①对中国专利信息中心提供的专利语料进行训练。

(一)序列标注

很多基于CRF模型的语块识别任务通常可以转化为序列标注问题。在识别介词短语的过程中,首先对包含介词短语的句子进行分词处理,然后对每个词语进行标注,确定介词短语的边界。我们采用{B, I, E, O}标记集进行标记。其中B表示介词短语的前界,I表示介词短语的内部成分,E表示介词短语的后界,O表示不属于介词短语的部分。

(2)本发明通过采用有效的方法提高汽车产量。

对于这个例句,可以做出如下标记:

本发明O通过B采用I有效的I方法E提高O汽车O产量O。O

将其反映到序列标注问题上,则可以认为:

输入序列X={本发明 通过 采用 有效的 方法 提高 汽车 产量 。}

相应地,输出标注序列Y={O B I I E O O O O }

(二)特征选择

特征是训练CRF模型必需的。在CRF中,特征选择是一个非常重要的问题,选择合适的特征对模型训练和测试都将十分有益。尽管可以不加限制地定义标记序列的特征,但不代表特征越多就越好。通过考察大规模语料中介词短语的特点,初步确定了以下五个特征及其属性值:

1.词特征。词作为句子的基本构成单元,是最基本的特征,模型可以通过词之间的差异性来寻找词本身的内部特征。

2.词性特征。通过分析发现,词性特征对边界的识别具有很大的提示作用。因此需要标记序列中词语的词性。本文采用北京大学《现代汉语语法信息词典》中的词性标记集进行标记。

3.候选前界特征。从当前词位置开始向前查找,查找位于同一分句中的介词。如果该介词存在,则该特征值为介词本身;否则特征值为“N”。

4.候选后界特征。如果认为当前词语可以作为介词短语的后界,则特征值记为“Y”,否则记为“N”。

5.候选后词特征。后词对介词短语的正确识别也起到了很大的提示作用,判断当前词是否是候选后词也能减小后界的选择范围。如果认为当前词语可以作为介词短语的后词,则特征值记为“Y”,否则记为“N”。

下表是例句2的标注实例:

将以上五个特征分为五列,对分词处理后含有介词短语的每一句语料进行标注,同时在最后一列加入{B, I, E, O}标记集,以确定介词短语的边界,以此形成训练语料和测试语料。

(三)特征模板

对于CRFs模型而言,根据选择的特征设计出不同的特征模板,根据特征模板系统生成不同的特征函数,会影响系统的性能。因此,特征模板选择的好坏将直接影响CRFs模型的效果。所以,特征模板的选择也是CRFs模型在介词短语识别中的重要问题之一。

CRFs模型的特征模板一般包括原子特征模板和复合特征模板。单独使用原子特征模板,只能表现出单个位置的特征信息,容易造成期望值和实际结果的偏差较大,导致参数的估计不准确。可以对原子特征进行组合,构成复合特征模板,通过定义各特征的窗口来描述标注单元和上下文之间的关系。本文将窗口大小定义为2。即分别考虑当前词、当前词前面两个词及后面两个词的五项特征。

当完成了序列特征标注任务,就可以利用CRF工具包对模型进行训练并识别介词短语了。

五、实验及分析

(一)实验结果

在这一部分,设计实验测试CRF模型识别介词短语的效果。从中国专利信息中心提供的专利语料中随机选择了1000句含有介词短语的句子作为测试集进行序列标注。实验采用四倍交叉验证方法,即将测试集按照数量均分为4等份,其中的3份语料作为训练语料,另一份作为测试语料,共进行四次实验,分别计算实验的三个评价指标:准确率(P)、召回率(R)和F1值,并将实验的平均值作为最终的参考结果。评价指标计算公式如下:

其中,“N”代表每次实验的测试集(250句)中介词短语的数量,“N1”代表模型识别介词短语的数量,“N2”代表正确识别的数量。

(二)实验分析

从上表可以看出,实验的整体评价指标都达到了90%以上,表明CRF模型对于识别介词短语的有效性。

通过分析识别错误的结果,初步认为分析错误的原因可能有以下几点:

1.有的介词在训练集中出现次数很少或者几乎没有出现,因此CRF模型无法有效学习到这些介词的特征,当它们出现在测试集中,模型就难以正确识别。

2.有些介词短语具有歧义,模型不容易判断短语的右边界位置。例如:通过墨水着色剂可以有效地使染布上色。这句话中,两个名词“墨水”和“着色剂”挨在一起,不确定二者是否可以组成复合名词,不容易判断到底哪个名词才是介词短语真正的右边界。

3.CRF模型对于序列的标注特征比较敏感。在人工标注的过程中一些难以避免的标注失误或错误也会导致识别错误的现象。

六、结语

本文利用条件随机场模型尝试对汉语专利语料中的介词短语进行了识别研究。在分析大规模语料的基础上,选择了合适的特征,对语料进行序列标注,同时利用CRF工具包训练了识别短语的模型,最后设计了实验检验识别效果。实验整体的准确率达到了90%以上,表明提出的方法对于识别介词短语是有效的。

未来将加强对歧义介词短语的研究,考察更多语料,争取发现更多有效的特征,同时扩大测试规模,希望进一步提高识别的效果与性能。

(本文得到了“国家高技术研究发展计划”[863课题,项目编号2012AA011104],中央高校基本科研业务专项资金以及中国博士后科学基金资助项目的资助,特此表示感谢!)

注释:

①http://crfpp.googlecode.com/

参考文献:

[1]Li Hongzheng,Zhu Yun,Yangyang,Jin Yaohong.Reordering

Adverbial Chunks in Chinese-English Patent Machine Translation[A].Proceedings of CCIS2014.

[2]梁猛杰,宋玉,韩英杰等.基于规则排序的介词用法自动识别研

究[J].河南师范大学学报(自然科学版),2013,41(3).

[3]黄曾阳.HNC(概念层次网络)理论[M].北京:清华大学出版

社,1998.

[4]朱筠.基本句群处理及其在汉英专利机器翻译中的应用[D].北

京:北京师范大学汉语文化学院博士学位论文,2013.

[5]胡韧奋.面向汉英专利机器翻译的介词短语自动识别策略[J].

语言文字应用,2015,1.

[6]于浚涛.基于最大熵的汉语介词短语自动识别[D].大连:大连理

工大学硕士学位论文,2006.

[7]奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算

机工程,2007,33(2).

[8]胡思磊.基于CRF模型的汉语介词短语识别[D].大连:大连理工大

学硕士学位论文,2008.

[9]宋贵哲.汉语介词短语识别研究[D].大连:大连理工大学硕士学

位论文,2011.

[10]张杰.基于多层CRFs的汉语介词短语识别研究[D].大连:大连

理工大学硕士学位论文,2013.

[11]干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学

报,2005,(4).

[12]昝红英,张腾飞,张坤丽.规则与统计相结合的介词用法自动

识别研究[J].计算机工程与设计,2013,(6).

[13]Lafferty J.,Mccallum A.,Pereira F.Conditional