前言:我们精心挑选了数篇优质自动识别技术论文文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
关键词:超高频;射频识别;车辆管理
1 引 言
随着我国城市化建设的快速发展,人民生活水平的不断提高,车辆数量和道路交通流量急剧增加,而道路的建设远赶不上车辆的增长,伴随而来是交通拥堵、车辆违章违法等现象的日益突出,传统的车辆管理系统已经面临巨大挑战。目前发展的射频识别(RFID)技术为这个问题的有效解决提供了理想的解决方案,同时也是以后车辆管理自动化的发展方向[1-7]。
而对公交公司而言,其停车场平时需要管理大量的公交车辆,同时车辆停放比较分散,出入频繁,车辆日常管理和安全监管难度较大。因此,需要采用高智能化的管理手段来实现停车库信息化管理的建设[8-10]。
在深入分析国内外成熟的基于RFID的智能停车场管理系统关键技术基础上,以某公交公司的车辆管理为典型应用背景,本文提出的一种基于超高频射频识别(RFID)技术的车辆管理应用方案。该方案可有效降低车辆信息查询复杂程度、车辆定位等问题。该系统采用自行研发的FR520读写器等关键设备,并通过立体停车库的大量测试结果证明方案合理可行,运行稳定可靠[11-15]。
2 射频识别技术
自动设备识别系统(Automatic Equipment Identification, AEI)是国际上正在努力开发并快速推广普及的技术。它适用于安全性要求较高的部门的车辆电子自动管理系统。该项技术的基本思想是通过采用一些先进的技术手段,实现人们对各类物体和设备在不同状态(高速移动、静止、恶劣环境)下的自动识别和管理,特别是采用超高频RFID技术的自动设备识别系统正日益广被使用。
RFID也称智能标签,是继个人电脑(PC)、互联网、无线通信之后的第四次信息技术革命。一个RFID系统通常由三部分组成:读写器、标签及相关的天线。读写器天线发射无线电信号给标签,标签通过自己的天线接收此信号,利用该信号得到的能量启动标签上的集成电路芯片工作。作为条形码的无线版本,智能标签技术具有条形码所不具备的防水、防磁、耐高温、使用寿命长、读取距离大、标签上数据可以加密等一系列优点,正在许多领域得到应用。
在图1所示的简单RFID系统中,现将阅读器(Reader)、天线(Antenna)和标签(Tag)的作用分别描述如下:
阅读器:读取(有时还可以写入)标签信息的设备,可设计为手持式或固定式;
标签:由耦合元件及芯片组成,每个标签具有唯一的电子编码,附着在车辆上标识目标对象,标签编写成车辆的编码唯一识别;
天线:在标签和读取器间传递射频信号。
图1 系统工作原理示意图
3 车辆管理系统设计
针对公交公司车辆管理背景,以其所属的一个典型的立体停车场为例,车辆管理系统设计过程中需要重点考虑的问题包括:
(1) 建设目标
为立体停车场管理人员提供实时监控车辆信息的平台、实现智能化车辆规范有序定位管理;还可以在管理立体车库的车辆进出,严密监视出入车辆,有效控制定位车辆的作息位置,保证系统运行稳定可靠。
(2) 丰富的功能
具有自动识别、智能控制、车辆定位管理、报警提示、信息记录、数据通信、查询、统计、分析等功能;同时具备扩展方便,升级容易等特性。
(3) 运行稳定可靠
具有冗余容错性能;系统处理速度快,可靠性高,稳定性好,错漏率低,并具有数据备份、数据恢复能力。
(4) 车辆实时定位管理
对于立体车库内车辆进行数字化管理;通过自动识别车牌卡信息,可以对车辆进出时间进行跟踪,同时定位车辆停放及作息位置的信息。
4 车辆管理系统方案
(1) 系统分部网络结构
图2所示的智能车辆管理系统是以后台管理系统和前端控制系统通过专用网络传输设备组成的管理系统,网络通信协议采用TCP/IP协议。而前端控制系统内的通道识别系统则采用10/100M以太网组成的一个小的局域网系统,进行识别和外设控制管理。
图2 系统分布网络结构
(2) 立体车库平面结构
图3所示为该立体车库的读写系统覆盖效果图。系统软件可以控制读写器的四根天线的轮询读取车辆标签时间顺序,根据每个天线能管理定位对应停车区域的车辆,能把实时的公交停车位置区域上报到公交公司的调度室,方便管理人员对车辆管理与停放位置的查询定位。
(3) 车辆管理平台组成
后台管理平台包括:管理计算机、发卡读写器、读写器、读写器专用天线及电缆。其中上层应用软件及其数据库系统安装并存储在管理计算机上。
5 固定式阅读器选型
图4所示是一种能满足本文系统需求的四通道远距离超高频RFID固定式阅读器产品HIK-FR520,支持DRM工作模式,具有良好的防冲突和抗干扰性能,识别率高,功能强,可靠性高,可扩展性好等特点。
该产品可广泛应用于智能交通、服装盘存、智能仓储等领域,能够实现现代化的物流管理,海关智能通关、城市车辆自动识别、智能停车场、高速公路不停车收费应用等集成系统。其主要特点包括:
兼容EPC C1 Gen2/ISO 18000-6C;
PowerPC架构CPU MPC8308,128 MB RAM;
具有载波消除功能,抗干扰能力更强;
支持EPC密集型读取模式(DRM);
远距离读取,RF输出功率达到32.5 dBm;
支持4路天线接口;
支持640 Kb/s标签数据读取速率;
配置以及参数设定灵活,提供最大化标签阅读量和最佳工作性能;
智能交通及车辆管理
大规模RFID系统应用
图3 读写系统覆盖效果图图 4 超高频固定式读写器
HIK-FR520的主要性能指标如表1所列。
6 车辆管理系统的特点
公交立体停车管理智能是运用超高频自动识别技术,利用现代计算机技术和自动控制技术等多领域技术,综合实现车辆自动识别和定位管理。本文提出的超高频RFID车辆管理系统具有以下主要特点:
整个系统具有远距离快速识别、智能控制、高可靠性、高保密性、易操作、易扩展等特点;
建立安全可靠的注册车辆档案,通过高新技术加强车辆监管防盗功能;
提供一个对进出车辆自动识别、智能管理的先进、可靠、适用的数字化平台,使公交公司对所有公交车辆出行、位置进行实时动态管理的能力得到质的提高;
能有效、准确的对进出停车库的车辆(装有车辆电子号牌的车辆)的数据信息识别、采集、记录、跟踪;
实时数据可以通过网络及时传送到后台管理系统,使管理人员在办公室内就可以及时了解公交车辆的停车在立体车库位置的情况。
7 结 语
基于射频识别的智能车辆管理系统是一种高效、快捷及科学的车辆管理手段。本文提出的超高频车辆管理系统应用于停车场车辆管理中,具有效率高、准确性好、安全性高的优点。该系统易于操作维护,自动化程度高,大大减轻管理者的劳动量。该方案的主要创新点在于为立体停车场管理人员提供实时监控并识别车辆信息的平台、实现车辆的智能化规范有序定位管理,系统功能丰富,运行稳定可靠,具有广阔的市场应用前景。
参 考 文 献
[1]杨笔锋,詹艳军. 基于射频识别的智能车辆管理系统设计[J]. 计算机测量与控制,2010,18(1):97-99.
[2]黄银龙,张辉,徐旭,等. 车辆管理RFID电子标签内存规划研究[J]. 通信技术,2010,43(2):141-145.
[3]王庆安. 基于RFID和GPRS的非机动车辆管理系统研究[J]. 中国制造业信息化,2007,36(13):66-68.
[4]狄巨星,赵建光,范晶晶,等. 车辆管理RFID标签电源低功耗研究[J]. 电源技术,2013,37(7):1233-1274.
[5]尼涛,杨宏,艾春安. 基于RFID技术的车辆管理门禁系统设计[J]. 工业控制计算机,2005,18(9):1-2.
[6]马凯. 基于多节点射频卡的车辆管理系统研究[J]. 交通标准化,2013(13):34-36.
[7]孙欣. 基于超高频RFID的第三方物流车辆管理解决方案[J]. 自动化博览,2012(2):80-82.
[8]杨洋. 基于RFID技术的武警车辆管理系统研究[D]. 哈尔滨:黑龙江大学(硕士学位论文),2011.
[9]杨国荣. 基于RFID技术的智能小区车辆管理系统设计[J]. 信息技术,2012(6):182-185.
[10]程仁镇. 基于车辆管理的RFID读写器设计[D]. 武汉:武汉理工大学(硕士学位论文),2012.
[11]张圣仟,杨小天,迟耀丹. 基于RFID在车辆信息自动识别技术的研究与应用[J]. 吉林建筑工程学院学报,2012(2):76-78.
[12]李元忠,余权,姚海天,等. 构建智能交通平台——RFID技术在城市车辆管理中的应用[J]. 中国自动识别技术,2008(4):90-92.
[13]王煌城,王宇歆. RFID應用於交通管理之研究[C].海峡两岸智慧型运输系统学术研讨会, 2006.
论文关键词:物联网,大学管理,应用研究
一、物联网的概念
物联网(Internet of Things,简称IoT)是新兴的IT技术,它是指通过把射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,嵌入和装备到公路、建筑、电网、供水系统、大坝、油气管道等各种各样的物体中,再结合现有的互联网,实现人类社会与物理系统的整合的一种IT技术。
在这个经过整合的物联网当中,通过互联网实现物品的自动识别和信息的互联与共享,另外中心计算机群也能对整合网络内的人员、机器、设备和基础设施进行实时的管理和控制。通过这样一种技术手段,人类就能以更加精细和动态的方式管理生产和生活,达到“智慧”状态,从而提高资源利用率和生产力水平大学管理,改善人与自然间的关系。
二、基于大学校园管理的物联网关键技术
1. 感知技术
物联网多通过RFID技术、传感器来达到感知的目的。
RFID(Radio Frequency IDentification)技术,中文名为射频识别技术,它是一种非接触式的自动识别技术,通过射频信号自动、快捷、方便地识别目标对象并获取相关数据,从而实现对各类物体在不同状态(移动、静止、恶劣环境)下的自动识别和管理。
传感器是能感受规定的被测量,并能按照一定的规律转换成可用输出信号的器件或装置,多为敏感元件和转换元件组成,用来感知信息采集点的环境参数。
2. 传感器网络
传感器网络是一个分布式智能化网络系统。它在每个节点配备了传感器、无线电收发器、微控制器和能源装置等部件,再通过这些部件的协作,就可以监控不同位置的物理、环境状况论文参考文献格式。
3. 无线网络
无线网络指的是使用无线电技术进行传输的计算机网络,它是有线网络的延伸,和有线网络功能相似,只是传输技术不同而已。它的优势是在没有有线网络的地方,或是移动的环境下,也能同样地连接上网络。
4. 数据融合技术
数据融合技术是利用计算机技术、人工智能等技术,将来自多个传感器的观测数据进行采集、过滤、自动分析、综合处理,进而得出相应的估计、决策等信息,以便辅助人们进行管理、决策工作。
三、物联网在大学校园管理中应用的前提条件
大学作为年轻人密集的地方,同时也是高级知识分子集结地,在大学校园管理中运用物联网技术,能迅速被人们接受和运用。且目前很多高校都拥有多年的校园网络建设,已拥有校园网及校园无线网络。这些都为物联网在高校管理中的运用提供了前提条件。
四、物联网技术在大学校园管理中的应用
1. 应用于图书馆档案室管理
利用物联网构建新型的高校图书馆、档案室管理平台大学管理,可以创新很多管理办法。
图书馆、档案室工作人员将RFID标签贴在图书、档案中,通过标签中的芯片和天线,再利用物联网构建出RFID的无线射频智能系统,这样就能让图书、档案拥有了GPS的定位功能。图书、档案在移动过程中,一旦经过馆室中的各个检查点,就立刻并跟踪并记录下来,并在服务器中储存相关信息。这样子,师生们在电脑上输入书名、档案的师生姓名,就能实时地掌握图书、档案当前的具置,再使用便携式的扫描设备、手持机等工具进行跟踪,就能快速找到自己想要的书籍、档案。物联网技术的引入,使得以前单纯依靠号码、人工查找的办法得到了智能化的改革。
依据物联网技术,还可以设计出图书自助借还设备,师生们在借还图书时,可以来到自助借还设备前边,让设备自动读取借书证和图书,由于使用RFID技术,设备可以在几十厘米到几米距离内读取图书,还可以一次读取多本图书,这样子就提高了图书借还速度,比之前使用条形码,由图书馆工作人员现场一本一本地办理借还手续高效得多。同时大学管理,设备还可以提供24小时借还图书服务,为高校师生提供更为方便的服务。
在高校图书馆、档案室中引入物联网技术,将能为这些地方的管理提供灵活高效、减少人力的智能化方案。
2. 应用于校园安防管理
在物联网安防管理平台中,通过射频识别、图像识别、GPS、无线传导网络、遥感等技术,并结合日常的视频监控系统,全面感知校园的环境、人和物的变化,而计算机系统将这些感知信息进行汇总、处理,适时地进行提示或报警。通过物联网技术,我们就可以全方位地提升校园的安防自动化程度,实现智能化的识别和管理,提高效率,节省人力,从而更好地进行安防管理论文参考文献格式。
当有物体闯上校园的围墙或其他敏感区域时,系统通过在这些区域的红外激光、次声压传感检测器、感应光纤等传感终端,判别闯入物体的大小和具置,并通过传感网络调转相应的摄像头监控该区域,同时依靠图像识别技术跟踪闯入物体,相应的提醒信息也立即发送到中心和高校保卫人员的手持设备中。在得到提醒后,保卫人员就能立即调取该摄像头的画面。经过观察后,当确实需要派保卫人员赶到现场时,物联网安防管理平台还可以利用地磁传感器、校道旁安置的无线传感节点、无线传感网,以及保卫人员身上的手持终端大学管理,实时把握保卫人员在校园内的定位,以此中心就能方便地调度最近位置的人员前去现场。
物联网技术的引入带来了安防方法的改变,与先前的视频监控系统安防方法不一样了,物联网技术的安防管理不再要求保卫人员一直守着监控屏幕观看。由于传感网络拥有图像识别智能技术,能够在边界内出现异动时,及时感知信息,自动跟踪拍摄和录制画面,并向中心和人员发送提醒信息。保安人员可以只在收到信息后才调取、查看相应摄像头的画面。这将使得高校的安防管理轻松不少。
摘 要:介词短语作为一种重要的短语类型在汉语中分布广泛,正确自动识别介词短语在自然语言处理的应用领域具有重要意义和积极影响。本文尝试利用目前比较流行的条件随机场模型,主要面向汉语专利文本,对其中的介词短语进行识别研究。首先在分词和词性标注的基础上对语料进行序列特征标注,然后利用条件随机场工具包训练了识别介词短语的模型,最后设计相关实验来验证方法的效果,实验准确率达到90%以上。
关键词 :介词短语 条件随机场 识别
一、引言
专利文献在国家经济发展和科技交流中发挥着十分重要的作用。近年来,中国专利的申请数量涨速飞快。面向专利领域的文本信息处理(如专利文本机器翻译)逐渐成为自然语言处理的重要应用领域之一,并引起了学术界和业界的广泛关注。
为了满足专利文本特定的表述需要,介词短语作为一种重要的短语类型,在汉语专利文本中分布广泛。据统计,在随机抽取的500句汉语专利语料中,包含介词短语的句子有226句,占到了样本总量的45.2%。[1]可见介词短语的出现比例非常高。汉语介词短语的自动识别具有较大的难度,主要表现在以下几点:
1.介词短语的内部构成相当复杂。介词短语可以由介词与其他词语和短语(动宾短语、名词短语、方位短语、时间短语等)构成,甚至可以由整个句子构成。复杂的内部结构很容易形成远距离的搭配关系。
2.兼类介词的存在。在一定的语境下,介词还可以兼做名词、量词、形容词、连词和动词等,必须结合上下文语境才能判断具体词性。
3.在同一个句子中经常会出现多个并列的介词短语,或者会出现复杂的嵌套介词短语。
下面是一个包含介词短语的真实专利语句示例:
(1)本发明【在条件允许的情况下】【通过[为一个宏块中的不同区域]提供不同的预测信息】而提出了许多更加准确的结果。
从例句可以明显地看出,专利文本中的介词短语通常具有更多的字数和更为复杂的结构。例句中用括号标示出了两个并列的介词短语结构,其中一个的内部还有另外一个介词短语,属于嵌套结构的介词短语。正确识别这些短语就比较困难了。
在句子S=W1,W2,W3……Wn中,假设字符串Wi,Wi+1……Wj为待识别的介词短语,介词短语识别的主要任务就是分别将Wi和Wj识别为该介词短语的左右边界。由于左边界就是介词本身,因此关键问题在于确定右边界位置。介词Wi通常称为前界,右边界Wj称为后界,紧邻右边界的词语Wj+1一般称为后词。
考虑到介词短语分布的广泛性和对专利文本处理的影响,本文尝试利用条件随机场模型(Conditional Random Field,即CRF),主要对大规模专利语料中位于同一分句内部的介词短语进行自动识别研究,希望能做出一些有益的探索。
二、相关研究
针对汉语介词短语识别的难点,国内外学者做了大量研究工作,提出了一些有效的方法,主要包括规则方法,统计方法和将二者相结合的混合方法。梁猛杰等(2013)通过考察介词规则库的处理特点,依据规则的覆盖程度从低到高进行分类,重新调整了规则的前后排序方案,同时对排序的规则进行优选,在保证时间复杂度较低的情况下提高了介词用法自动识别的准确率[2](P152~155)。朱筠(2013)、胡韧奋(2015)等在概念层次网络理论(Hierarchical Network of Concepts,HNC)[3]的指导下,面向汉语专利领域的文本,专门构建了较大规模的汉语专利语料知识库,在利用规则方法开展汉英专利机器翻译研究的过程中探索了介词短语的识别方法和思想[4][5]。于俊涛(2006)釆用基于最大熵模型的方法,通过获取有效的特征集合完成了介词短语识别的任务。奚建清(2007)引入机器学习方法,提出了基于隐马尔可夫模型(HMM)的汉语介词短语边界确定方法。首先基于HMM自动识别介词短语,然后利用依存语法错误校正方法对识别结果进行修正,取得了不错的识别准确率[7](P172~182)。胡思磊(2008)、宋贵哲(2011)、张杰(2013)利用CRF模型对介词短语进行识别,取得了较好的效果。于俊伟(2005)采用了规则和统计相结合的介词短语识别方法,提出了利用搭配模板获取可信搭配关系以及基于词性的三元统计模型和规则相结合的方法识别介词短语[11](P17~23)。昝红英等(2013)在已有工作的基础上,提出了一种规则与CRF模型相结合的介词用法自动识别算法。通过将人工书写的规则与CRF在宏观层面和微观层面进行有机的结合,根据介词的具体特点,选择合适的识别方法,使最终的识别准确率达到了80%左右[12](P2152~2157)。
三、CRF模型介绍
作为一种基于统计的判别式学习模型,CRF模型最早由Lafferty等人在2001年提出。该模型来源于最大熵模型。CRF通过计算和统计已知元素推理计算未知元素的条件概率。与隐马尔可夫模型不同,CRF可以利用上下文信息,而不需要严格的独立性假设,因此在序列标注问题中表现出很好的性能。此外,CRFs还解决了最大熵马尔可夫模型(MEMM)中的标注偏置问题。CRFs被广泛应用于自然语言处理领域的句法分析、命名实体识、词性标注等方面,并取得了很好的效果。CRFs是一种以给定的输入序列X为条件来预测输出序列Y概率的无向图(undirected graphical)结构模型。(X,Y)就是一个以观察序列为条件的随机域。概率计算可以通过如下公式得到:
四、基于CRF的介词短语识别
国外学者已经开发了完整的CRF模型工具包,利用工具包可以快速地训练模型并得到相应的结果。在本文中,将使用CRF++0.53版本的工具包①对中国专利信息中心提供的专利语料进行训练。
(一)序列标注
很多基于CRF模型的语块识别任务通常可以转化为序列标注问题。在识别介词短语的过程中,首先对包含介词短语的句子进行分词处理,然后对每个词语进行标注,确定介词短语的边界。我们采用{B, I, E, O}标记集进行标记。其中B表示介词短语的前界,I表示介词短语的内部成分,E表示介词短语的后界,O表示不属于介词短语的部分。
(2)本发明通过采用有效的方法提高汽车产量。
对于这个例句,可以做出如下标记:
本发明O通过B采用I有效的I方法E提高O汽车O产量O。O
将其反映到序列标注问题上,则可以认为:
输入序列X={本发明 通过 采用 有效的 方法 提高 汽车 产量 。}
相应地,输出标注序列Y={O B I I E O O O O }
(二)特征选择
特征是训练CRF模型必需的。在CRF中,特征选择是一个非常重要的问题,选择合适的特征对模型训练和测试都将十分有益。尽管可以不加限制地定义标记序列的特征,但不代表特征越多就越好。通过考察大规模语料中介词短语的特点,初步确定了以下五个特征及其属性值:
1.词特征。词作为句子的基本构成单元,是最基本的特征,模型可以通过词之间的差异性来寻找词本身的内部特征。
2.词性特征。通过分析发现,词性特征对边界的识别具有很大的提示作用。因此需要标记序列中词语的词性。本文采用北京大学《现代汉语语法信息词典》中的词性标记集进行标记。
3.候选前界特征。从当前词位置开始向前查找,查找位于同一分句中的介词。如果该介词存在,则该特征值为介词本身;否则特征值为“N”。
4.候选后界特征。如果认为当前词语可以作为介词短语的后界,则特征值记为“Y”,否则记为“N”。
5.候选后词特征。后词对介词短语的正确识别也起到了很大的提示作用,判断当前词是否是候选后词也能减小后界的选择范围。如果认为当前词语可以作为介词短语的后词,则特征值记为“Y”,否则记为“N”。
下表是例句2的标注实例:
将以上五个特征分为五列,对分词处理后含有介词短语的每一句语料进行标注,同时在最后一列加入{B, I, E, O}标记集,以确定介词短语的边界,以此形成训练语料和测试语料。
(三)特征模板
对于CRFs模型而言,根据选择的特征设计出不同的特征模板,根据特征模板系统生成不同的特征函数,会影响系统的性能。因此,特征模板选择的好坏将直接影响CRFs模型的效果。所以,特征模板的选择也是CRFs模型在介词短语识别中的重要问题之一。
CRFs模型的特征模板一般包括原子特征模板和复合特征模板。单独使用原子特征模板,只能表现出单个位置的特征信息,容易造成期望值和实际结果的偏差较大,导致参数的估计不准确。可以对原子特征进行组合,构成复合特征模板,通过定义各特征的窗口来描述标注单元和上下文之间的关系。本文将窗口大小定义为2。即分别考虑当前词、当前词前面两个词及后面两个词的五项特征。
当完成了序列特征标注任务,就可以利用CRF工具包对模型进行训练并识别介词短语了。
五、实验及分析
(一)实验结果
在这一部分,设计实验测试CRF模型识别介词短语的效果。从中国专利信息中心提供的专利语料中随机选择了1000句含有介词短语的句子作为测试集进行序列标注。实验采用四倍交叉验证方法,即将测试集按照数量均分为4等份,其中的3份语料作为训练语料,另一份作为测试语料,共进行四次实验,分别计算实验的三个评价指标:准确率(P)、召回率(R)和F1值,并将实验的平均值作为最终的参考结果。评价指标计算公式如下:
其中,“N”代表每次实验的测试集(250句)中介词短语的数量,“N1”代表模型识别介词短语的数量,“N2”代表正确识别的数量。
(二)实验分析
从上表可以看出,实验的整体评价指标都达到了90%以上,表明CRF模型对于识别介词短语的有效性。
通过分析识别错误的结果,初步认为分析错误的原因可能有以下几点:
1.有的介词在训练集中出现次数很少或者几乎没有出现,因此CRF模型无法有效学习到这些介词的特征,当它们出现在测试集中,模型就难以正确识别。
2.有些介词短语具有歧义,模型不容易判断短语的右边界位置。例如:通过墨水着色剂可以有效地使染布上色。这句话中,两个名词“墨水”和“着色剂”挨在一起,不确定二者是否可以组成复合名词,不容易判断到底哪个名词才是介词短语真正的右边界。
3.CRF模型对于序列的标注特征比较敏感。在人工标注的过程中一些难以避免的标注失误或错误也会导致识别错误的现象。
六、结语
本文利用条件随机场模型尝试对汉语专利语料中的介词短语进行了识别研究。在分析大规模语料的基础上,选择了合适的特征,对语料进行序列标注,同时利用CRF工具包训练了识别短语的模型,最后设计了实验检验识别效果。实验整体的准确率达到了90%以上,表明提出的方法对于识别介词短语是有效的。
未来将加强对歧义介词短语的研究,考察更多语料,争取发现更多有效的特征,同时扩大测试规模,希望进一步提高识别的效果与性能。
(本文得到了“国家高技术研究发展计划”[863课题,项目编号2012AA011104],中央高校基本科研业务专项资金以及中国博士后科学基金资助项目的资助,特此表示感谢!)
注释:
①http://crfpp.googlecode.com/
参考文献:
[1]Li Hongzheng,Zhu Yun,Yangyang,Jin Yaohong.Reordering
Adverbial Chunks in Chinese-English Patent Machine Translation[A].Proceedings of CCIS2014.
[2]梁猛杰,宋玉,韩英杰等.基于规则排序的介词用法自动识别研
究[J].河南师范大学学报(自然科学版),2013,41(3).
[3]黄曾阳.HNC(概念层次网络)理论[M].北京:清华大学出版
社,1998.
[4]朱筠.基本句群处理及其在汉英专利机器翻译中的应用[D].北
京:北京师范大学汉语文化学院博士学位论文,2013.
[5]胡韧奋.面向汉英专利机器翻译的介词短语自动识别策略[J].
语言文字应用,2015,1.
[6]于浚涛.基于最大熵的汉语介词短语自动识别[D].大连:大连理
工大学硕士学位论文,2006.
[7]奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算
机工程,2007,33(2).
[8]胡思磊.基于CRF模型的汉语介词短语识别[D].大连:大连理工大
学硕士学位论文,2008.
[9]宋贵哲.汉语介词短语识别研究[D].大连:大连理工大学硕士学
位论文,2011.
[10]张杰.基于多层CRFs的汉语介词短语识别研究[D].大连:大连
理工大学硕士学位论文,2013.
[11]干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学
报,2005,(4).
[12]昝红英,张腾飞,张坤丽.规则与统计相结合的介词用法自动
识别研究[J].计算机工程与设计,2013,(6).
[13]Lafferty J.,Mccallum A.,Pereira F.Conditional
关键词:识别;定位;分割;数学形态学
中图分类号:TP391.41 文献标识码:A 文章编号:1674-7712 (2014) 02-0000-01
一、前言
我国公路上的各类车辆数目增长很快,交通环境污染、交通事故和交通拥堵对我国经济社会的生活和发展产生越来越大的影响。智能交通系统能够很好的解决这个问题,其重要性已经得到大部分人的认可。车牌识别系统是现代智能交通系统的重要组成部分,对保证交通系统的顺利平稳运行具有积极的意义。在实际生活中,由于汽车的牌照常常作为汽车的唯一标识供交通管理部门查询和管理,为了交通系统的顺利平稳运行,通常先要识别车辆身份。
二、汽车牌照自动识别流程
(一)采集图像。在行驶的车辆进入到拍摄的范围以后,车辆检测系统就会向处理器发出信号要求启动系统,与此同时,摄像机会自动获得车辆的正面图像。实际应用过程中,为了有效提高系统在不同环境、天气和光线下的适应性,摄像机的技术参数会根据处理器的要求进行调整,例如,当光照条件不足时会自动开启照明,以保证照片的拍摄质量。(二)图像预处理技术。系统最终获取的车辆牌照信息,会经过编码器转换为数字编码格式。由于环境条件的限制,例如,光照不稳定、摄像头和汽车牌照间的距离和角度不合适、车辆通过速度过快等,都非常容易造成照片的模糊、缺损和倾斜现象。因此,需要通过必要的图像预处理,增强汽车牌照的信息特征,以便更好的进行车牌识别。(三)车牌定位过程。车牌定位就是通过图像处理技术将车牌区域快速、准确地从车辆照片中提取出来。这一过程是车牌识别过程的核心内容,车牌定位的准确程度会直接影响到以后车牌的字符分割过程和字符识别过程的准确度,所以,选择合理有效的定位处理技术是保证车牌识别效果的关键。
本文中将定位过程分为如下几个部分,如下图所示。
在实际的应用过程中,通常结合拓扑和数学形态学方法进行车牌有效区域的提取。详细处理流程和使用的技术如图2所示。该方法首先应用车牌大小和纵横比等车牌固有的信息特征,使用Top-Hat方法对获取的车辆图像进行变换、运算等处理,以有效强化车牌区域的特征;然后再应用包括连通体态分析法在内的各项技术粗率定位车牌图像,这样就能够最终获取车牌的有效候选区域。最后,通过欧拉数对车牌的各个候选区判别,这样就能够最终获取准确有效的车牌特征区域。实验表明,该技术不仅能够避免各种复杂的背景环境、不断变化的光照影响、摄取图像缺损和污染等情况对车牌定位的影响,还能够对牌照的有效区域进行快速的搜索,进而实现车牌有效区域的提取。
经过一系列运算和处理之后,剩下的部分就是和车牌形状比较类似的候选区域明亮区域,这类候选区域的个数较少。经过前面的预处理,大部分背景都被削去,图像中只剩下了少数连通性比较好的区域,车牌区域已经被准确的定位识别出来。(四)字符处理技术。车牌定位出来以后需要进行字符的识别,这之前还要对单个的字符进行校正、去噪和平滑处理,以消除提取字符中的各种干扰信号;然后,根据字符的基本特征将字符进行细化处理。另外,还存在一些因为拍摄角度与距离影响造成的字符倾斜状况。这类图像不利于字符的识别,因此,字符分割之前,需要校正牌照的倾斜度。(五)字符分割技术。车牌区域被准确的定位提取以后,还需要将单个字符从中分离出来,这样再传输到对应的车牌识别系统,进行字符识别过程。经过图像预处理后的车牌字符笔划变的更细,字符相对之前更加清晰,而且还删除了细节部分的噪声污染,这样再经过垂直投影以后,汽车的牌照图像就能够被高质量的分割。实现简单,准确率高,运行速度快。(六)字符识别。模板识别技术是车牌字符识别中一种被广泛使用的基于车牌统计特征信息的识别技术。该技术需要借助概率统计学知识,首先将对象的稳定特征信息进行识别提取,组成一组特征矢量,再将这些信息与标准字符模板库中的特征信息进行匹配,进而获得匹配相关度,相关度最大的就是被识别出来的字符。这种技术算法复杂度相对较低,识别率高,具有实现简单、资源占用少的优点。
三、汽车牌照自动识别系统的实现
(一)系统环境。车牌识别系统的硬件环境包括:车辆检测系统、摄像系统、图像采集系统等,软件主要使用VS 2008框架,包括识别系统的管理界面和识别核心算法。其中,应用图像采集系统获取图像,应用OpenCV实现车牌的识别,数据库应用SQL Server 2008。
其中,车牌识别模块是系统的关键,主要包括三个组件:1.应用硬件对来往车辆进行检测;2.传输图像;3.车牌识别。
三个主要组件通过数据库进行时时更新,从而达到汽车牌照的自动识别。
四、结束语
汽车牌照自动识别研究由于受到各个方面的条件限制,在技术上还存在很多的不足。但是,由于现代交通监控与管理的迫切要求,车牌识别技术仍具有巨大的潜力。随着研究的深入,车牌自动识别系统一定会越来越成熟。
参考文献:
[1]冈萨雷斯.数字图像处理(中文版)[M].北京:电子工业出版社,2006.
【关键词】视频图像处理;DirectShow;目标识别;过滤技术
引言
在社会信息化日益发展的今天,信息技术、网络技术、通信技术以及多媒体技术已经渗透到人类生活的各个领域中,视频监控以其直观、方便和内容丰富等特点,日益受到人们的青睐。视频监控是多媒体、计算机网络、工业控制和人工智能等多种技术的综合运用,目前正从传统的图像采集朝着音视频的数字化、系统的网络化和管理的智能化方向发展。
人体检测和跟踪是智能视觉监控中的重要研究内容之一,也是近年来计算机视觉领域中备受关注的前沿方向。对图像序列中的运动人体快速而准确的检测和跟踪是一项十分重要且极具挑战性的工作,同时准确的检测和跟踪也是对行为进行有效理解的基础除了视觉监控之外,人体检测和跟踪在高级人机交互动画制作等方面也有着广泛的应用。
基于智能空间的机器视觉是计算机视觉领域一个新兴的研究方向,它与传统意义上的系统的区别在于其智能性。简单而言,不仅用摄像机代替人眼,而且用计算机替代人协助人,来完成监视或控制任务,从而减轻人的负担。本论文工作的主要任务就是基于DirectShow技术的智能识别系统对摄像机拍录的图像序列进行自动分析来对被场景中人物的变化进行定位、跟踪和识别,并结合人体朝向等分析的基础上判断有关目标的行为。
1.DirectShow系统原理
DirectShow是一套高效的多媒体开发系统,与DirectX开发包一起。它是建立在组建对象模型(COM)基础上的,由许多模块化的组件组成。DirectShow将应用程序、复杂的数据传输、硬件设备的差异以及同步等问题隔离开,多媒体软件开发者只需要按照统一的COM接口来编写应用程序,从而简化了在Windows平台上数字媒体应用程序的开发任务,DirectShow系统框架应用程序与DirectShow系统以及DirectShow所支持的软件、硬件之间的关系如图1所示。
图1 DirectShow系统架构
DirectShow主要由Filter Graph构成,Filter Graph中包含了各种Filter,这些Filter在Filter Graph Manager的统一控制下,按一定顺序连接在一起,从而使数据在由Filte组成的链表中流动,图1中的箭头表示Filter链表中的数据流的方向。在DirectShow系统框架外,是与用户直接交互的应用程序。应用程序要根据实际的功能需求引入相应的Filter, 建立Filter Graph, 然后通过Filter GraphManager来控制系统的数据处理过程。DirectShow通过事件通知机制,实现应用程序与Filter Graph Manager之间的交互控制。Filter Graph运行的时候接收到各种事件,通过消息的方式发送到用户应用程序,用户应用程序则根据事件类型做出相应的处理。
2.基于DirectShow目标识别系统
2.1 目标是识别系统总体框架
采集图像端创建一个Source Filter读取内存缓冲区数据,并加入到Filter Graph Manager,Filter Graph Manager负责视频信息采集,同时通过数据发送线程将从数据流发送。图像处理端接受采集端传送的视频信息,通过Filter Graph Manager创建一个filter graph来对图像帧进行控制,见图2。
图2 自动识别系统总体架构
2.2 图像过滤
图像采集和后端图像处理两个部分组成(如图2)所示。前端图像采集部分包括:高清摄像机、传输线缆、后端图像处理部分、数据管理和图像显示。采用DirectShow提供的辅助组件Capture Graph Builder来创建Filter Graph,流程如图3所示。
图3 Filter Graph Manager创建过程
在Filter Graph Manager创建完成后,调用该组件的QueryInterfaces接口,获取并存储IMediaControl、IMediaEventEx、IBasicVideo、IBasicAudio、IVideoWindow等接口对象。在多媒体软件中,利用这些接口对象可以开发出如图像预览、图片快照、音视频播放控制、屏幕控制等具体应用。
用Filter链路建立调用Capture Graph Builder组件的RenderStream接口对PIN_CATEGORY_PREVIEW类型的Pin完成后续连接,代码如下:
ICaptureGraphBuilder *pBuild;
//第二步获取的对象
Capture Graph BuilderIBaseFilter *pCap;
//第三步获取的对象
Videocapture filterhr=pBuild->RenderStream
(&PIN_CATEGORY_PREVIEW,&MEDIATYPE_Video,
pCap,NULL,NULL);
视频显示部分调用IVideoWindow对象进行指定窗口的显示,调用IMediaControl对象的Run方法控制Filter Graph开始运行, 代码如下:
RECT winRect;
//应用程序传入的窗口对象
IVideoWindow *pIVideoWin;
//第三步获取的
IVideoWindow 对象
IMediaControl *pIMediaCtrl;
//第三步获取的
IMediaControl对象
pIVideoWind->put_Left(0);
pIVideoWind->put_Top(0);
pIVideoWind->put_Width(winRect.right
-winRect.left);
pIVideoWind->put_Height(winRect.bottom
-winRect.top);
pIVideoWind->put_WindowStyle(WS_CHILD|WS
_CLIPCHILDREN|WS_CLIPSIBLINGS);
pIMediaCtrl->Run();
目标识别系统将上述开发过程的DirectShow部分封装为一个独立的类,包括Filter Graph Manager的创建、系统设备的枚举以及对设备各种控制接口的操作等,上层应用程序只需实例化该类的对象,即可调用该类提供的公共接口。
2.3 图像目标识别处理
DirectShow采集进来的图像是BMP格式的。图像处理的大致流程是:一是灰度化;二是二值化;三是标记;四是计算目标区域位置;五是判决当前目标是否被命中。本系统的图像处理采用基于DirectShow系统架构的图像处理流程。图象处理主要实现步骤如下:
(1)初始化COM。
(2)创建Capture Graph Builder组件 , 获取 CaptureGraph接口。
(3)在Filter Graph加入视频源过滤器。
(4)在Filter Graph加入AVI Decompressor Filter。
(5)在Filter Graph加入Sample Grabber Filter并设置媒体类型、缓冲模式。
(6)连接各Filter pBuilder->RenderStre
am(&PIN_CATEGORY_CAPTURE,&MEDIATYPE_Video,m_pFilter,pAviDecompressorF,pGrabberF);
pBuilder->RenderStream(NULL,&MEDIATY
PE_Video,pGrabberF,NULL,NULL);
pBuilder->Release();
(7)定义一个类 CSampleGrabberCB: public IsampleGrabberCB在该类中重载 BufferCB方法。在BufferCB中可以加入用户具体的图像处理函数。在类中可以定义一些公用属性, 用于传递相关参数。
(8)设置Sample Grabber回调模式CSample-
GrabberCB CB;//向类CsampleGrabberCB传递图像类型信息。
CB.Width = vih- >bmiHeader.biWidth;
CB.Height = vih- >bmiHeader.biHeight;
FreeMediaType(mt);
pGrabber- >SetBufferSamples(true);
pGrabber- >SetOneShot(false);
pGrabber- >SetCallback(&CB,1);
(9)用接口对Filter Graph进行控制。
3.实验结果与分析
本实验使用采集人体运动视频来验证系统的有效性,视频1是一段正对面向摄像头行进的运动人体序列。视频采集处理的图像如下图4所示。从图上可以清晰的看出人体被标黑,并且可以准确的跟踪人体运动,达到预期的目标。
图4 正对面向镜头行进的运动人体识别图
为了进一步测试自动识别系统对图像的处理识别能力,下图5所示为垂直于镜头的运动人体序列的情况,自动识别系统依然可以正确识别人体。
实验表明采用基于DirectShow的自动人体识别系统可以在不同的角度对运动的物体进行识别捕获,具有较好的识别能力和推广使用价值。
4.结束语
本文介绍了基于DirectShow的自动识别运动系统,通过分析DirectShow的视频图像处理技术,阐述了DirectShow系统架构,构造了一种目标识别物体物体系统。采用过滤技术实现复杂环境准确人体识别功能,结合实验论证了基于DirectShow的目标识别运动物体系统的可行性。下一步我们将对图像处理过滤部分进行优化设计,提高过滤效率。
参考文献
[1]Kalman R E.A new approach to linear filtering and prediction problems[J].Journal of Basic Engineering,1960,82D:34-45.
关键词 轮胎缺陷;计算机视觉识别;轮胎X射线检测;算法
中图分类号TN29 文献标识码A 文章编号 1674-6708(2013)95-0073-03
0 引言
目前对轮胎X射线检测系统的图像识别都是由人来主观判断的。X光机对轮胎进行扫描成像,将图像传输到计算机中在显示屏上显示,工作人员通过对轮胎X射线图像的识别来判断轮胎是否有缺陷并对其缺陷进行分类,由人工来进行轮胎缺陷图像识别受到外界的干扰较大,并且具有工作量和工作强度大的特点,这些都容易给轮胎缺陷图像的识别带来较大不利影响。采用计算机图形识别技术对轮胎X射线图像进行识别,不仅能提高工作效率,有效解决人工识别过程中带来的问题,使识别的过程客观化,更加科学和规范。轮胎X射线缺陷检测系统能对其图像进行自动处理和归类,通过对轮胎缺陷图像的统计,还可以建立轮胎缺陷图像的数据库,提高企业在轮胎生产过程中的经济效益[1]。
国内厂商大都是用国外生产的X射线检测产品,比较常见的品牌有德国的Collmann和YXLON等[2]。YXLON是国际上轮胎内部缺陷检测设备的最大生产厂家,其产品具有可靠的检测结果、快速的检测时间、维护简单、结构紧凑、操作简单直观等特点[3]。相比较国外,国内对轮胎用X光机图像处理技术的研究不多,对于国内的轮胎制造厂商,如果想要运用轮胎缺陷图像自动识别技术,只能向国外购买,但是价格昂贵。因此,现在国内的大部分厂商还是采用人工肉眼对轮胎X射线图像检测的方法进行质量判断[4]。
1 轮胎X射线检测装置和结构分析
我们采用的轮胎X射线检测图像采集装置为YXLON公司生产的LX-1500型轮胎X射线检测系统,YXLON的轮胎X射线检测系统由X射线管、U型传感器、数字图像转换器、图像处理工作站和显示器等部分组成,该系统具有机械结构设计良好和图像识别系统分辨率高的特点。采用该系统对轮胎进行X射线检测时,轮胎首先通过起重机被装载到检测的支架上,系统操作工使用控制面板输入合适的参数,按照设定好的参数,径向X射线管伸进到轮胎的中部,马鞍型的轮胎线阵列检测器也移动相应的位置,轮胎在支架上保持匀速的转动,从而确保了轮胎X射线检测过程的连续性。
2轮胎X射线检测图像分析
由于轮胎的规格型号极其繁杂,轮胎的内部结构也是千差万别,导致表述轮胎缺陷时没有统一的标准,这里依据对轮胎生产质量的控制要求,结合轮胎缺陷数据分析和文献资料参考的基础上,将轮胎内部钢丝帘线的缺陷特征概括为以下四类:
2.1 帘线的形状
对于质量正常的轮胎而言,其内部的胎体钢丝帘线分布应该是与图像横向平行排列的直线序列,如图1(a)所示。当帘线弯曲时,其检测图像如图1(b)所示。
2.3帘线的细节
轮胎内部钢丝帘线的细节主要表现为钢丝帘线上的不连续点、交叉点或者断点。图3(a)是帘线交叉的X射线检测图像,图3(b)是帘线断开的X射线检测图像。对于胎体异物而言,由于X射线投影成像的关系,异物的影像会与钢丝帘线的影像发生重叠,如图3(c)所示,所以胎体异物也可以归纳为帘线上的细节问题。
4 结论
本文首先介绍了轮胎X射线检测装置,然后对轮胎X射线检测的图像进行了详细分析,并对图像中轮胎的缺陷种类进行了分类,最后介绍了自己设计的轮胎X射线检测缺陷识别算法,针对形状、尺度、细节、排列四种轮胎缺陷,分别设计了相应的轮胎缺陷识别算法。
参考文献
[1]冯霞,郝振平.X射线在轮胎边缘检测中的应用[J].CT理论与应用研究,2010,19(3):61-66.
[2]徐啟蕾.轮胎X光图像自动识别系统算法研究[D].青岛:青岛科技大学硕士学位论文,2006.
[3]张小丽.轮胎缺陷X光检测图像的处理与识别研究[D].天津:天津大学硕士学位论文,2007.
论文摘要:rfid俗称电子标签,是一种非接触式的自动识别技术。目前正在我国高校图书馆推广应用。该技术与图书馆目前普遍应用的条形码系统相比,具有显著的功能优势。文章对rfid技术及在图书馆的应用进行了介绍,并对在应用过程中存在的问题进行了分析。
射频识别(radio frequency identification,简称rfid),俗称电子标签,是一种非接触式的自动识别技术。它通过射频信号自动识别目标,可以快速地对物品进行追踪和数据交换,能够识别高速运动物体并可同时识别多个标签。
rfid是一种简单的无线系统,由一个阅读器(询问器)很多标签(应答器)以及传递信号的天线所组成。其工作原理也并不复杂:标签进入磁场后,接收解读器发出的射频信号,利用感应电流所获得的能量发送出存储在芯片中的信息,阅读器读取信息并解码后,送至中央系统进行有关的数据处理。
20世纪末,国外开始将rfid技术应用于图书馆。2006年,深圳图书馆成为国内首家运用rfid技术的图书馆。到目前,国内使用rfid系统的图书馆已接近百家,但约2/3为公共图书馆,高校图书馆不到1/3,北京地区只有北京理工大学、北京石油化工学院、北京农学院等少数几所高校。
1rfid技术在图书馆管理中的应用
rfid其实就是一种电子条码,与图书馆目前普遍应用的条形码系统相比,rfid系统不仅可以完全替代条形码系统,而且具有更显著的功能优势。
1.1 自助借还书
使用条形码系统,读者借还书籍时,必须由馆员手工一本一本地扫描书籍的条形码。而借助rfid自助借还书系统,rfid可以同时读取多个芯片信息,读者只需将其要借阅的所有书籍放在自助借还机上,按照提示进行操作,就可以自行完成书籍的借阅和归还,无需再由馆员逐一手工进行。馆员的手工劳动量降低,提高了工作效率。
尤其在读者归还图书时,不必受图书馆开闭馆时间的限制,可以在任意时间、任意地点(自助还书系统可以通过网络设置在宿舍、教室、食堂等任意地点)自助办理,方便、快捷。
1.2 图书清点
条形码阅读机必须在近距离才能辨别条形码,因此,清点文献时需要将每本书从书架上取下、翻开,扫入条码后再逐本放回,工作极为繁重。利用rfid便携式点检设备,一次可以读取多个rfid标签的资料,只需要用扫描棒在书架上横扫1~2遍,即可读取全部图书数据,盘点时间大大缩短,这样不但极大地减轻了工作人员的劳动强度,提高了工作效率,而且可以使馆藏清点成为一项经常性的工作,从而提高管理水平。
由于现在的阅览室多采用开架阅览方式,图书乱架现象较为严重。如果书放错了位置,则很难被查找出来。而采用rfid技术,则只需在rfid阅读器中输入该书的相关信息,沿着书架依次扫描,很快便可发现目标,使得查找工作变得非常方便。
1.3 在安全防盗管理中的应用
rfid防盗检测系统具有识别距离远、识别速度快、误报率低等特点,弥补了磁条检测设备存在盲区和不稳定的缺陷,但由于rfid标签的隐蔽性不好,一旦被连书页一起撕掉,便完全失去了安防功能。因此可以将rfid阅读器与传统的磁条检测设备整合在一起,双管齐下,能大大增强检测系统的可靠性。
2主要应用设备
rfid标签转换系统:标签转换系统的主要作用是对rfid标签进行读写、编码及分发。rfid标签中存储了识别和追踪馆藏文献所必需的信息,包括图书编号、图书名称、检索号、所属书架信息、借阅者信息、借阅日期等信息。
便携式rfid点检设备:通过扫描书架上贴有rfid标签的流通资料,实现错架检查、顺架、排架、倒架、剔除以及阅读统计、数据采集处理等功能。
多功能馆员工作站:集rfid识别系统、读者证件识别系统、条码枪、充消磁仪、显示器等设备于一体,具备馆员管理工作和读者自助操作双面、同步显示功能,同时进行多本图书的借还及充消磁操作。
自助借还书系统:可以对粘贴rfid标签的流通文献进行扫描、识别和借还处理的设备系统。用于读者自助进行文献借还的操作,可打印借阅凭条并取得收据,操作简单,可24小时运行。
安全检测系统:当读者出入图书馆经过该系统时。如果有图书被遗漏处理,系统将自动发出提醒,同时可侦测多个标签,误报率较低。
此外还有自动办证系统、封闭式自助还书系统、24小时室外还书系统,以及自动分拣系统、自动上架系统等多种设备,用户可以根据自己的需要进行选配。
3rfid技术应用中存在的问题
3.1 技术标准尚不统一
rfid技术应用于图书馆,按照应用频率分为两种技术流派,即高频(hf)和超高频(uhf)。这两种技术的工作原理并不相同,从应用效果上看,也是各有利弊。高频技术相对比较成熟,国际标准完善,设备和生产厂家较多,国内代表性的厂商有上海阿法迪和深圳海恒;超高频技术在标签隐蔽性和价格上有优势,未来很有发展前景,国内代表性的厂商是深圳远望谷。
不同的技术标准使用户在选择过程中,往往难以抉择,一旦选择了一种,就意味着放弃了另一种。因为标签和阅读器不兼容,不能共用。采用不同标准的图书馆之间,也难以进行馆际互借、数据交流等合作。
3.2 应用成本较高
随着rfid技术的推广和产品的国产化,rfid产品的价格不断下降,一枚电子标签的价格已经从五六年前的一美元降到目前的一元多人民币,但对于藏书量基本都在百万册以上的高校图书馆而言,这仍不是一个小数目,加之上述的系统设备,起步就需要二三百万元,如果没有专项经费的支持,多数高校图书馆是无法承担的。
3.3 传统观念的束缚
凡历史悠久、管理完善的图书馆都有一批经验丰富的管理人员,丰富的经验常常伴随着根深蒂固的传统观念,他们对书架的布局、图书的排列以及图书的流通程序都有自己的规范和习惯,而这些规范使rfid系统难以充分地显示出其功能优势。短时间内,这也是难以改变的现实。
任何一项新技术的推广和普及都不会是一帆风顺的,rfid也一样。但应该相信,rfid技术代表着未来的趋势,随着不断发展和完善,它终将会被高校图书馆广泛接受。在现代信息技术的推动下,图书馆传统的管理体系和服务方式正在发生巨大的变革,正在向电子化、数字化、虚拟化方向迈进。我们必须解放思想,积极接受和利用现代信息技术,不断提高业务工作质量和工作水平,更好地为读者服务。rfid技术的应用,将使高校图书馆工作的整体水平登上一个新的台阶。
参考文献
[1] 王若琳.rfid技术及其在我国图书馆领域的应用前景分析[j].情报杂志,2006,3
关键词:隐喻识别;多学科交叉视角;计算思维;语言教学
中图分类号:TP31
隐喻普遍存在于人类语言中。早在两千多年前,古希腊哲人亚里士多德就在《诗学》中把隐喻归入到修辞学领域中进行了描述。汉语隐喻的历史也非常悠久,最早的诗歌总集《诗经》中就出现了“譬”(metaphor)的纯熟运用。20 世纪30年代,出现了以Richard& Black为代表的语义互动隐喻学派,他们认为人的思维是隐喻生成机制的主要动因,为隐喻从修辞格向认知领域的过渡打下了理论基础。到了70年代,Lakoff & Johnson[1]在《我们赖以生存的隐喻》一书中指出,隐喻是一种思维方式,是人类理解抽象概念、进行抽象思维的重要途径。此后隐喻的认知功能和在思维中的中心作用得到了学术界的普遍认可。90年代著名认知语言学家Turner & Fauconnie[2]创建了概念整合论(The Conceptual Integration Theory),对Lakoff & Johnson的概念隐喻理论进行了整合完善,具有更广泛的解释性。近几年随着计算机科学的迅猛发展,隐喻又成为了自然语言处理的研究热点。目前学者们在多学科研究的基础上对隐喻的识别理解进行多种尝试[3-5],试图推动对自然语言更深层次的认知和理解。隐喻已经成为了一个涉及认知语言学、心理学、教育学、逻辑学、计算机科学等多学科交叉的研究领域。
隐喻自动识别关键的第一步是要解开人类对隐喻理解的认知机制,建立语言的形式化模型,使之能够以计算机能够识别的形式表示出来。这一过程很大程度上需要依赖认知语言学理论的指导。目前关于隐喻计算研究的综述性文章主要针对隐喻模型设计、知识库和数据资源建设及隐喻处理的应用方面进行介绍,而本文将从认知语言学和计算机科学的交叉角度对隐喻识别所涉及的理论和方法进行探究。以期让更多的研究人员不仅停留在技术层面,而是更多的关注计算机技术背后的认知语言学理论基础,同时为语言教育者提供一些计算思维和计算机网络环境下语言教学的新思路和方法。
本文的结构安排如下:第一部分探讨认知语言学视角下的隐喻的本质、识别机制;第二部分介绍计算机科学视角下的隐喻识别的研究进展。第三部分讨论了隐喻识别对于计算机专家及语言学家和外语教育者的启示和展望。
1 隐喻识别的认知语言学视角
1.1 隐喻本质
在认知语言学背景下,隐喻被普遍认为是一种思维方式和认知模式。概念隐喻理论认为隐喻是利用一种概念表达另一种概念,需要这两种概念之间的相互关联。这种关联是客观事物在人的认知领域中的联想。概念隐喻观运用源域与目标域之间的映射以及意象图式来解释隐喻现象,认为隐喻的本质是以一种事物去理解另一种事物的手段,从一个比较熟悉,易于理解的源域映射一个不太熟悉、较难理解的目标领域。人类对隐喻识别是指在语境中发现隐喻表达,找出源域、目标域及映射域的关系。束定芳[6]归纳了人类对隐喻识别的两种基本方法:(1)基于文本线索;(2)基于语义冲突。
1.2 基于文本线索的识别
隐喻表达的特征之一是具有一定的语言标记,可以把这些语言标记作为隐喻识别的线索。这种研究思路在隐喻识别中非常直观,起到一种“路标”的作用,具有较高的价值。通过隐喻标记语的明确指示,做出不能对该话语做字面意义理解而应做隐喻意义理解的明确引导。由于隐喻标记语的介入,人类对隐喻进行推理的时候,就能很容易地领会蕴藏的意图,从而作出正确的隐喻识别。因此,隐喻标记语的使用明示了话语的语义逻辑关系,对隐喻的人脑推理过程起到了明示的语用制约,从而帮助理解与识别。束定芳[7]总结了隐喻表达的七种文本线索标记:
(1)领域信号或话题标志。如intellectual stagnation(智力上的停滞)、psychic eddy current(心理旋涡)、时间隧道、历史悲剧。(2)元语言信号。直接用metaphor,metaphorical,metaphorically或“比如”等字眼。(3)强调词信号。In fact,literally,actually,really,汉语中的几乎、差不多、简直等。(4)模糊限制词。如英语中的a little,practically,汉语中的“有点”“某种意义上”等。(5)表示隐喻转换的上义词。如sort of,type of,“某种”等。(6)明喻。明喻是隐喻的一个种类,其比喻词like,as,“好像”,“仿佛”等明确表明这是隐喻式话语。(7)引号。
根据上述认知语言学理论,在隐喻计算机自动识别领域,有一些研究工作是针对文本中的线索而进行的。本文第3.1节将介绍相关研究方法和技术。
1.3 基于语义冲突的识别
多数隐喻的出现并没有什么明确的信号或标志,需要通过对语义冲突的理解来识别隐喻。语义冲突也称为语义偏离(deviation),指的是在语言意义组合中违反语义选择限制和常理的现象,是隐喻产生的基本条件。语义冲突可以产生在句子内部,也可以产生在句子与语境之间。Ortony[8]认为某一语言表达成为隐喻的第一要素是从语用角度或从语境角度看,它必须是异常的,即从其字面意义来理解有明显与语境不符合之处。人类需要根据话语的字面意义在逻辑上或与语境形成的语义和语用冲突及其性质,判断某一种用法是否属于隐喻。
人类对隐喻的理解首先建立在上下文语境的基础上,根据语言认知系统知识库及涉身概念知识库,对语言形式和字面意思进行分析,确定源域与目标域的语义冲突,并运用概念联想提取机制判断出映射关系,最后作出概念隐喻的判断[9]。如图所示:
2 隐喻识别的计算机科学视角
2.1 基于文本线索的方法
国内外很多学者对隐喻标记及其使用进行了分类和归纳总结[10-12],旨在通过文本线索的方法对隐喻进行自动识别。很多建立在对语料库(如British National Corpus)中隐喻标记统计的基础上,把标记隐喻的语言信号分为若干类别,并考察其在文本中的出现频率与隐喻的使用关系。研究表明,虽然带有语言标记的隐喻句在隐喻句总数量中存在的比例并不大,但是存在隐喻标记语的书面语中隐喻的比例达到了大约1/2的比例。除了隐喻标记语的词汇层面,Ferrari[13]还把句法分析作为文本线索进行隐喻识别的研究。例如,通常作为隐喻标记的单词metaphor,在句子“A metaphor is a figure of speech where comparison is implied.”中作为主语出现,此句不再是隐喻,metaphor也失去了标记的功能。这种方法概括起来就是利用规则约束与机器学习相结合,从语料库中统计隐喻的语言标记和句法信息出现的概率,以此作为文本线索进行隐喻计算机自动识别。
因为更多的隐喻不具有明显的语言标记,所以这种基于文本线索的方法只能作为一种辅助来提高识别效果。在前面1.2节中认知语言学中提到的语义冲突关键作用基础上,接下来探讨从计算机自动语义分析角度进行隐喻的识别。
2.2 基于语义知识的方法
由于技术的局限,对这种方法的研究很少到应用认知语言学中的语言系统知识库和系统概念知识库,只是把字面上出现的语义或者逻辑不一致当作隐喻进行识别。例如:对于隐喻句“my car drinks gasoline”,由于动词drink的语义优先公式为((* ANI SUBJ)(((FLOWSTUFF)OBJE)(MOVE CAUSE))),发出drink这个动作的主语即drink应是生命体,而car属于不具备生命体的语义类别,与系统中汽车文本中语义框架中出现的例如“消耗”等语义并不相符,因此造成了语义类搭配异常,形成隐喻的识别。
Fass[14]对基于语义知识的方法进行了早期的研究,建立语义冲突分类体系,并手工建立了语义知识库,但对大规模的语料分析具有局限性,也耗时耗力。Mason[15]通过大规模语料库自动获取词汇的优选语义,从领域语料库获得词汇的语义特征,对比特征语义冲突完成概念映射的优选。但由于领域知识库规模不足,此方法只能处理与动词相关较简单的概念隐喻,对于复杂映射具有很大的局限性。
利用词典和语义搭配知识是基于语义知识方法的另一项应用。如Krishnakumaran利用英语词典word-Net得到语义知识,计算词语在语料库中语义搭配的概率[16] 。同样,杨芸利[17]用《同义词词林》和《词语常规搭配库》来识别汉语语义搭配型隐喻。
另外,机器学习方法是隐喻自动识别研究的一个新方向,在处理海量信息上有着明显的优势和广泛的应用[18-19]。面对日益增多的数据与计算机技术迅速发展,广泛地尝试探索基于机器学习的隐喻识别研究十分必要。基本上,此方法把隐喻识别的问题转化成文本分类问题,最终达到识别目的。
3 总结与展望
3.1 语言学家与计算机研究者携手共进
语言学与计算机科学对于隐喻识别,有着共同的研究处理对象及共同的奋斗目标――揭示人类语言中隐喻的秘密,开发人类语言智能的功能。利用计算机对隐喻进行识别,基于规则和统计相结合的办法是有效办法之一,只利用任何一种方法都有它的局限性。计算机固然可以迅速地从大规模的语料中获取隐喻知识,解决系统的一些具体问题,但是却不能解释确切的运行机制和其中的规则到底是如何建立的。所以需要语言学家对语言进行描述与规则制定,实现计算语言的形式化,这些都是跟语言学的基础理论分不开的。同样,语言学也需要进一步现代化。而计算机隐喻识别所提出的一系列新的方向与需求,一方面启发语言学家从新的角度去思考和探索,这必将深化语言学的理论知识;另一方面,通过计算机改造语言学理论,可以促进语言描写的形式化、科学化和精密化。计算机科学的发展,不但为语言学提供了现代化的研究手段,而且扩展了语言学的研究视野。因此,语言学家与计算机研究者加强合作与支持,才能促进隐喻研究的重大突破。
3.2 隐喻知识库与英语教学
隐喻的各种计算模型往往需要一个或多个知识库的支撑,这是由隐喻的认知性所决定的。国外在隐喻知识库方面发展比较迅速,代表性的隐喻知识库有Sense-frame、Master Metaphor List、MetaBank和Metalude。在语言学教学实践中,隐喻知识库中所包含的词条、对隐喻的描述以及例句、规则、分析等给学生提供了实际语言运用中的真实语言材料。这类知识库所提供的语言学习材料,帮助学生理解和分析隐喻系统,提高英语语感、促进语言习得。“教材中非真实语料的例句往往对学生有误导作用,教学中应更多地使用地道的英语”[20]。例如,Master Metaphor List 知识库的词条 force下,隐喻类别示例如下:
Force is a substance contained in affecting causes
Put more force in to your punches.
Each sentence contained the force of an order.
Her death hit us with a lot of force.
Related metaphors: related to Causes are Forces.
Source domain: substance,contents,container,hitting.
Target domain: force.
知识库中除了三个例句,还给出了与force类别相关的隐喻类别(Related metaphors:related to Causes are Force)。指出了隐喻的源域(substance,contents,container,hitting)和目标域(force),另外还有简要分析的以帮助理解( note)。例句中都包含概念隐喻的影子。借助概念隐喻可以认识到隐喻表达形式的根源,将原本分散的形式内涵按根源进行归类。隐喻知识库所提供的概念隐喻系统使语言学习者了解到隐喻生成机制的原理,利用映射原理对知识系统分类整理。隐喻知识所提供的实例分析和分类帮助学生形成系统的理解和有序的逻辑思维,分清隐喻表述的各部分关系,代替死记硬背的学习方式,遵循有效的认知规律,从语言学习的根源和理论上整体把握,从而提高对语言深层次的理解,提高学习的效果,增强英语语感。
参考文献:
[1]Lakoff,G.,Johnson,M.Metaphors We Live By [M],Chicago: University of Chicago Press,1980.
[2]Turner,M.,Fauconnier,G.Conceptual Integration and Formal Expression[J].Metaphor & Symbolic Activity,1995,10(3):183-204.
[3]Derrida.Margins of Philosophy[M].Chicago:The University of Chicago Press,1982:31.
[4]Shen,Y.,&Gadir,O.How to interpret the music of caressing:Target and source assignment in synaesthetic genitive constructions[J].Journal of Pragmatics,2009,41(2):357-371.
[5]胡壮麟.认知隐喻学[M].北京:北京大学出版社,2004.
[6]束定芳.隐喻学研究[M].上海:上海外语教育出版社,2000.
[7]束定芳.认知语义学[M].上海:上海外语教育出版社,2008.
[8]Ortony,A.(ed).Metaphor and Thought[M].Cambridge University Press,1979.
[9]黄孝喜.隐喻机器理解的若干问题研究[D].浙江大学博士论文,2009l:51-52.
[10]Wallington,A.M.,et al.Metaphoricity Signals:A Corpus Based Investigation [D].Technical Report CSRP203205,University of Birmingham,2003.
[11]Barcelona,A.On the plausibility of claiming a metonymic motivation for conceptual metaphor[A],2000b.In A Barcelona,2000.
[12]Croft,W.The role of domain in the interpretation of metaphors and metonymies[J].Cognitive Linguistics,1993:4-4:335-371.
[13]Ferrari,S.Using Textual Clues to Improve Metaphor Processing[C].Proceedings of the 34th Annual Meeting on Association for Computational Linguistics Student Session.Santa Cruz,California,1996.
[14]Fass,D.Met 3:A Method for Discriminating Metonymy and Metaphor By Computer [J].Computational Linguistics,1991,17(1):49-90.
[15]Mason,Z.CorMet:A Computational,Corpus2basedConventional Metaphor Extraction System[J].Com2putational Linguistics,2004,30(1):23-44.
[16]Krishnakumaran,S.,Zhu,X.J.Hunting Elusive Metaphors Using Lexical Resources[C].Proceedings of the ACL 2007 Workshop on Computational Approaches to Figurative Language,2007:13-20.
[17]杨芸.汉语隐喻识别与解释计算模型研究[D].厦门大学博士学位论文,2008.
[18]Pasanek,B.Sculley,D.Mining Millions of Metaphors[J].Literary and Linguistic Computing,2006,23(3):345-360.
[19]戴帅湘.汉语隐喻分类识别的计算方法研究[D].厦门大学硕士学位论文,2005,6.
[20]Kittay.E. Metaphor:Its Cognitive Force and Linguistic Structure [M].Oxford: Clarendon Press,1987.
作者简介:张冬瑜(1977-),女,博士,讲师,主要研究方向:自然语言处理;樊宇(1966-),女,辽宁大连人,讲师,学士,主要研究方向:英语教学、教育管理;李映夏(1978-),女,辽宁大连人,讲师,硕士,主要研究方向:应用语言学。
论文摘要:介绍了八钢物流道路运输实现可视化的设想,将其分为公路运输和铁路运拾两个部分,分别介绍了实现可视化的方式、所需技术和主要功能.
冶金工业企业生产过程指从原材料的入厂开始,到半成品的流动、产成品的存储和交付、废弃物的处理等全过程,整个生产过程实际上就是系列化的物流活动。八钢是有50多年历史的老企业,通过艰苦奋斗,不断积累,形成了现在的发展格局。从目前的视角看,为使八钢整体生产物流顺畅,在物流布局及技术手段等方面都需要优化。以八钢物流道路运输为例,进行探讨。
在八钢的生产过程中,运输是生产的直接组成部分,八钢各生产单元通过运输使其空间状态联接在一起。在物流过程中很大一部分责任是由运输担任的,运输是物流的基础和主要组成部分.八钢本部的大宗原燃料的运输形式主要是道路运输和皮带运输,相对而言道路运输的不可控因素更多,主要探讨道路运输的两种方式:公路运输和铁路运输。
1公路运输可视化分析
可视化公路运输主要内容包括:车辆动态识别和定位技术应用、电子地图技术应用、车辆导航技术应用、交通管理、协作运输管理等。
1.1车辆识别
为了实时掌握公路运输的状况,对公路运输的基本单元的状态即车辆状态必须知道,这就涉及到车辆识别。基于空间信息技术的移动式车辆侦测自动识别技术在公路运输方面具有无可比拟的优势。
1.2电子地图
电子地图是公路运输实现可视化必需的人机界面(interface),它具备了地理信息系统(gis)的大多数功能。公路运输可视化的大部分信息都需要通过电子地图来表示。电子地图能够把数字信号(包括对数字地图、遥感数字图象及自行数字化采集的数据进行可视化处理后形成的数字信号)和模拟信号显示在计算机屏幕上。
电子地图主要有两方面作用:一是多维地图的静态显示和动态显示作用;二是动态环境下空间数据库与物流信息管理系统数据库的交流作用。总之电子地图要完成gis中空间数据视觉化的任务。
电子地图主要通过点状要素(出入口、道口、交通灯等)、线状要素(公路、铁路等)、面状要素(停车场、料场等)来反映交通详细信息,满通运输服务的要求。
1.3车辆导航
车辆导航是指为具体的在厂内道路上的运输车辆提供导航,它是车辆驾乘人员重要的辅助工具,使之能在正常情况先按照预定的线路行驶,异常情况下按照指定的线路移动。
为实现车辆导航,必须将gp导航系统与电子地图、无线电通信网络及交通管理信息系统结合起来,最终通过车载gp设备为驾乘人员传递相关的图像和声音信息。
1. 4交通管理
随着八钢产能的不断扩大,厂内运输的车流量将进一步增加,为使道路交通完全处于受控状态,制定相关规则并监督执行非常必要(尤其对大型运输车辆的控制)。交通管理具体内容包括:车辆行进线路规划、车辆监控(路线、速度等)、停车位管理、交通道口监控、车辆指挥、故障处理和紧急救援等。
首先对所有进出八钢的大型运输车辆的行进线路按物品(对应相应的物资编码)做好规划,线路规’划本着线路最简捷的原则进行,同时要考虑出入口、道口、回车场地、道路状况、车流量、其它公路运输等因素,尽可能避免迂回运输和重复运输。线路规划是动态的,可根据需要适时调整。线路规划在大型运输车辆进入门禁的时候,以声、光和图像的形式通过车载gps设备传递给驾乘人员,为其提供导航。
大型运输车辆进入八钢厂区的导航是强制的,为此需要实时跟踪和监控,确保其按照指定的线路、速度行驶,发现错误及时纠正。
随着车流量的增加,靠车辆自律管理厂内交通将不能满足要求,为此需要在重要道口建立交通信号控制系统和视频监控系统。交通信号系统主要用于管理道口现场交通;视频监控系统主要是将被监控点实时采集的交通视频图像传输给监控中心,以便监督和及时调整控制流量。
八钢有必要建立类似于城市交通指挥系统的交通管理系统,可以作为勺又钢物流信息管理系统”的一个独立的子系统。交通管理系统以电子地图和gps数据库为工作平台,运用计算机网络,集成交通信号控制系统、电视监控系统、交通诱导系统、电子警察系统、通信系统和车辆导航等系统,实现各种交通管理信息集成整合,深化处理和增值服务,便于驾乘人员了解相应信息和交通状况,使指挥人员能够迅速决断、快速反应、及时修正交通计划,保证交通的安全与畅通。
1.5协作运输管理
从实现物流可视化的角度来探讨协作运输管理。
将来八钢的大宗原燃料的公路运输主要通过社会协作的方式进行,为使公路运输能够按照八钢的要求和意愿进行管理,在商谈协作的时候,必须要求协作方按照八钢的要求做一些必要的工作。
由于公路运输处于买方市场,在商谈协作运输时掌握一定的主动权。
首先,要考虑软硬件配备,主要包括:必须配备承担运输所需的车辆,车辆应装备符合实现八钢可视化物流所必须的gps车载设备和车辆自动识别装置,具备车辆实时监控系统(主要监控八钢外部运输),具备与八钢联网的信息系统等。
其次是运输管理,主要包括:为了避免集中到达,要求公路运输商(可能是多家)按八钢的交通容量编制运输计划,尽可能减小每批次的车辆数量;为充分利用社会资源,要求公路运输商能实时控制在途车辆(必要时能提交八钢共享),按照预定的计划时间到达,同时要保证“运输的一致性”;在途车辆出现意外,有应急预案应对;对进入八钢厂区的车辆能够服从八钢交通管理的要求;按照八钢统一的电子结算方式进行运杂费结算等。
2铁路运输可视化分析
铁路运输占道路运输的比重在今后几年会逐步增加(大宗原燃料运输里程一般在200km以上),铁路运输需要高度关注。可视化铁路运输主要内容包括:车辆识别和定位技术应用、电子地图技术应用、铁路信号系统数据交换、车辆动态调度等。
2. 1车辆识别和定位技术应用
着重从机车跟踪的角度探讨车辆识别和定位。
为实现铁路运输可视化,需要知道机车行进方向、车辆数、车辆顺序、车厢数、车辆标签、所对应车辆的物品编码(含品名、规格、产地等信息)、计量信息、列检信息、装卸信息、运行时间和运行位置等信息。这些都需要依靠车辆识别和定位技术来实现。
铁路区域计算机连锁系统(rcis)、动态自动识别称量系统、全球定位系统(g ps )、电视监控系统是进行车辆识别和定位的技术基础,它们各有侧重。
gps在车辆定位方面有无可比拟的优势,是实现车辆定位的重要手段,在gps基础上结合rcis获取的各节点信息,可实现车辆全过程精确定位和车辆动态跟踪。
铁路区域计算机连锁系统和电视监控系统相结合,借助模拟运算工具,也可实现车辆定位和跟踪的功能。
用于车辆识别的技术手段包括图像自动识别技术、射频识别技术和移动式车辆侦测自动识别技术(cps技术),由于车厢经常倒换,采用图像自动识别技术、射频识别技术进行识别更经济适用,尤其是射频识别技术在我国铁路运输管理中已得到广泛使用,也有相应的技术规范支撑。采用gps用于机车识别无疑是最佳选择。将机车信息、车箱信息、编组信息等有效结合,即可得到完整的车列信息。
2.2电子地图技术应用
电子地图是铁路运输可视化重要的视觉平台,作用同公路运输,通过它可直接、快捷地了解到机车运行状况。
电子地图是实现可视化动态车辆调度十分重要的工具。电子地图有两类:一是基于地理信息系统(g is)的电子地图,与实际地形相符,真实感强,但受幅面限制,一些信息不能直接反映在地图上;二是模拟的示意性的电子地图,可能与实际相差很大,但它幅面利用率高,可清晰显示更多信息。以前更多的选择后者,“鹰眼”技术使得前者的应用领域和范围越来愈多。通过“鹰眼”技术可以详细了解到每个区域的细部信息,通过链接甚至可以获取包括某个信号灯的状态、某个道岔的位置、某个摄像机获取的车辆和行人图像等信息。
2.3远程监控系统
在调度中心实现对道口、车站、铁路沿线环境和现场的远程监控,一是可大大减轻日常人员巡视的工作量;二是便于及时发现危险隐患,保障安全生产。
远程监控系统的主要功能包括:实时视频监控、信息存储、报警联动、远程遥控和校验等。
远程监控系统由现场设备(可变焦红外线数字摄像机、活动云台)、传输通道(有线或无线)、主站设备(服务器、存储装置、软件)、监控终端等组成。
远程监控系统已成为铁路运输管理不可缺失的一个重要组成部分,随着信息技术的发展,运用多媒体技术、基于web服务器的远程监视系统,可以为有权限的局域网用户提供实时的信息服务。
2.4铁路信号系统数据交换
八钢内部的铁路运输系统与公共铁路运输系统关联度很高,随着八钢产能不断提高,与外部公共铁路运输系统建立实时数字信息交换制度对双方都有必要。可通过约定数据交换范围、方式和格式,在双方的数据服务器之间设置防火墙,实现信息共享并融入各自的管理系统。
内部可视化的相关信息需要集成在电子地图上,这样就需要在“八钢物流信息管理系统铁路运输子系统”和现有的区域计算机连锁系统(rcls)、拟建的车辆识别和定位系统、远程电视监控系统等之间实现信息无缝链接.由于现有的区域计算机连锁系统(rbi)建设时未考虑与其它系统信息交换,相应的软硬件不一定能满足要求,届时需要对服务器部分做相应的改动或升级。新建系统要充分考虑今后的拓展需求。
2.5车辆动态调度
车辆动态调度是“八钢物流信息管理系统铁路运输子系统”重要组成部分,结合物流管制中心的建设就可视化的铁路运输管理和车辆动态调度的功能和内容展开描述。
车辆识别和定位技术应用、电子地图技术应用、铁路信号系统数据交换等都是为可视化的铁路运输管理和车辆动态调度服务的。铁路运输管理系统主要功能包括铁路运输计划的管理、车辆运行信息显示、车辆追踪、物流信息显示、调车作业图表管理、列车运行图的管理、运行数据统计分析、系统自诊断等。
铁路车辆动态调度需要一个可视化的信息平台,其主界面就是集合各种相关信息的铁路运输电子地图(或称之为八钢铁路地理信息系统图)。铁路车辆动态调度是计划管理体系的一个重要组成部分,以计划为驱动,实现产供销运的紧密衔接,对采购、销售、生产物流实施跟踪管理。通过车辆调度模块生成、调整和发送车辆运行计划、维护和调整调度作业图表、发送调度指令;铁路运输过程中的物流管理作业过程(如列检、计量、装卸等)也需要依靠车辆调度模块来动态的实现控制;为使运输过程处于可控状态,车辆调度模块还要对车辆的动态跟踪;实时(或定时)对铁路运输计划的预测统计分析是车辆调度的重要工具和手段,通过它可获得与铁路运输相关的信息(如库存、消耗、待运、在途等信息),以便提前判断和制定相应的措施。
关键词:射频识别技术,推广应用
射频识别(Radio Frequency Identification, RFID)技术是一种非接触式的自动识别技术,俗称“电子标签”,通过射频信号自动识别目标对象并获取相关数据。论文参考网。RFID标签相当于条形码技术中的条形码符号,但它与条形码是2种不同的技术,有不同的适用范围。与条形码相比,它有着不可比拟的优势:防水、防磁、耐高温、体积小型化、形状多样化,使用寿命长、读取距离大、标签上数据可以加密、存储数据容量更大、存储信息更改自如,不需要光源、可以透过外部材料读取数据、能够同时处理多个标签、可以对所附着的物体进行追踪定位等。RFID已经被世界公认为本世纪十大重要技术之一,在生产、零售、物流、交通等各个行业有着广阔的应用前景。
1 应用发展目前RFID技术在美国、欧洲和日本等发达国家已经广泛应用于工业、物流和供应管理、生产制造和装配、航空行李处理、邮件/快运包裹处理、文档追踪/图书馆管理、动物身分标识、运动计时、门禁控制/电子门票、道路自动收费。在我国比较典型的应用主要有防伪、工业自动化、交通信息化管理、物流与供应链管理等方面。
据英国调查公司IDTechEx于2008年1月16日报告指出,2007年全球RFID市场增长势头强劲,市场总值约50亿美元,增长主动力是处于高峰期的我国二代身份证,卡片和基础设备总值达20亿美元,这使我国成为最大的RFID市场。但是,如果抛去二代身份证市场的份额,那么美国是全球最大的RFID市场。从全球范围来看,RFID业务很大程度上仍依赖于政府的推动。同时,医药业RFID项目的数量增长尤其快速。而金融、安全领域的RFID项目数量大约占总数量的48%,其次是客运、汽车领域,项目数量占19%。另外,IDTechEx公司还预测今年全球RFID市场将从2007年49.3亿美元上升到52.9亿美元,这个数字覆盖了RFID市场的各个方面,包括标签、阅读器、其它基础设施、软件服务等。这些价值主体主要归功于大量应用于交通和身份证的国际RFID计划。在未来十年,RFID的市场价值将迅速增长,到2018年,RFID市场价值将5倍于2008年RFID市场,而且标签生产量将达到300倍于2008年。
在过去的一年里,我国的RFID市场及技术开始步入一个稳步而快速发展的阶段。国家信息产业部曾做出预测,未来5到10年全球RFID市场规模将达到3000亿美元。由于我国是世界首屈一指的制造业枢纽,RFID产业也将有可观的增长。RFID如今在我国的很多行业都有应用,比如集装箱行业,邮政行业,离散制造业,公路铁路车辆管理,烟草行业等,这些应用相对来说还不成熟,但可以看出巨大的发展潜力。比如对于集装箱制造行业来说,中国占世界集装箱制造量的90%,所以在这一领域应用RFID将是有很大潜力的。从频段来看,大部分应用仍然是集中在低频市场,主要特征是短距离接触,比如身份证、交通卡等。中高频应用相当少,整体规模不大[1]。论文参考网。
虽然RFID的应用有着良好的发展状态和趋势,但仍然存在一系列急需去面对和解决的问题,如标准、成本、产业链建设等主要问题制约着我国RFID技术的推广应用。
2 RFID技术现状分析射频识别系统一般由电子标签和读写器两个主要部分组成。电子标签由天线和RFID芯片组成,每个芯片都含有唯一的识别码(UID)。此外,一个完整的RFID应用系统还包括:
(1)中间件,又称RFID管理软件,它屏蔽了RFID设备的多样性和复杂性,能够为后台业务系统提供强大的支撑,从而驱动更广泛,更丰富的RFID应用。
(2)应用系统软件,记录数据,实现企业管理功能等。
在RFID系统在实际应用中,电子标签附着在待识别物体的表面,电子标签中保存有约定格式的电子数据。读写器可无接触地读取并识别电子标签中所保存的电子数据,从而达到自动识别物体的目的。读写器通过天线发送出一定频率的射频信号,当标签进入磁场时产生感应电流从而获得能量,发送出自身编码等信息,被读写器读取并解码后送至电脑主机进行有关处理[2]。
RFID技术涉及信息、制造、材料等诸多高技术领域,涵盖无线通信、芯片设计与制造、天线设计与制造、标签封装、系统集成、信息安全等技术。一些国家和国际跨国公司都在加速推动RFID技术的研发和应用进程中。在过去十年间,共产生数千项关于RFID技术的专利,主要集中在美国、欧洲、日本等国家和地区。按照工作频率的不同,RFID标签分为低频(LF)、高频(HF)、超高频(UHF)和微波频段(MW)。经过多年的发展,13.56MHz以下的RFID技术已相对成熟,目前业界最关注的是位于中高频段的RFID技术。
近几年来,RFID芯片的制造,标准的制定以及测试技术在我国都取得了一定的成果。电子标签与芯片研发机构目前已经开发出国产UHF,HF电子标签,特别是HF已经比较成熟地实现了规模化的量产,获得广泛应用。读写器及终端方面已经实现了一定程度上的规模化生产,但在总体性能指标上与国外同类产品有一定的差距。在软件及系统集成方面,目前国内有200多家企业,研究机构,大学等从事中间件、RFID数据管理,RFID公共信息服务网络及其应用软件的开发。此外,国内有多家机构在开展具有独立自主知识产权的电子标签封装装备与技术的研发。
虽然,RFID技术在我国起步较晚,但经过几十年的努力,我国在RFID技术上已有一定的技术基础和市场基础,如果措施得当,是完全有机会赶上甚至领先国外竞争对手的。
3推广RFID技术应用建议作为一项技术的推广与普及,既与当时的社会需求与应用环境有关,又取决于它对采纳者所能带来的经济效益。在我国有较成熟RFID应用技术基础、有巨大的市场需求以及广阔的经济发展前景。但是,目前,我国RFID系统推广应用仍有赖于政府的推动。政府应在以下几个方面加大力度,为RFID的应用匹配相关基础设施。
(1)择准时机出台RFID体系标准
RFID标准主要涉及到空中接口协议标准、数据格式标准、公共服务标准、中间件标准、信息安全标准、相关产品标准、测试标准。目前,国际上主要有三大RFID标准体系,即ISO RFID标准体系、EPCglobal RFID标准体系、日本UID RFID标准体系。然而,国内RFID产业的迅速发展没有可以依赖的国家标准,RFID标准又与国家信息安全息息相关。
所以,我国必须根据国家实际情况,坚持及尽快制定一个自主知识产权的RFID国家标准,掌握国家在电子标签领域发展的主动权,并且与国际标准相互兼容,使我国的RFID产品能顺利地在世界范围中流通。对于自主知识产权标准的推出,除了政府的积极推动,同时鼓励我国大专院校、科研院所及企业积极参与国内、国际RFID技术标准和行业应用标准的制定,尽快形成能够支撑产业发展及应用的RFID标准体系,以标准化推动RFID技术更新及应用。RFID标准体系基本结构如图1所示[3]。
而且,我国RFID技术标准出台的时机也非常关键。标准过早出台,可能在后继的推行过程中,标准会与切实可行的技术方案存在冲突。如果推出过晚,在国内出现多个遵循其他技术标准的规模应用后,会对标准的推行形成很大阻力。
(2)降低技术研发和应用成本
RFID系统的制造成本可望随着信息技术的发展和应用领域的扩大而大幅降低。成本问题针对不同行业而言的,一般认为价格在5美元以上芯片,主要为应用于军事,生物科技和医疗方面的有源器件;10美分到1美元左右的常为用于运输、仓储、包装、文件等无源器件;消费应用如零售的标签在5~10美分;医药、各种票证、货币等应用的标签则在5美分以下。目前很多准备实施RFID系统的单位普遍认为居高不下的成本是阻碍他们导入RFID的关键因素之一。标签成本将直接影响RFID的市场规模,要实现大规模应用,就必须降低成本。
RFID在单件低价物品上的使用就会导致成本陡涨,甚至可能超过物品本向的价值。所以,在研究使用RFID电子标签系统时,要充分研究系统优势以抵消所提高的成本,对标签生产的设备及材料进行研究,以降低生产成本。其实,成本问题关键还要看投入产出比,在控制标签价格远低于商品价值的基础上,如能大规模应用,同时RFID系统的应用将会给企业的业务流程大大改善,减少人力成本,提高工作效率,这就使RFID应用的相对成本降低了[4]。
另外,逐步开发和推进RFID的应用,在技术比较成熟、价格不敏感的行业中先进行RFID的应用,以点带面的推动RFID的发展。在RFID产品的价格下降和应用成熟后,再在生产、物流、零售等广大领域推广。论文参考网。在这个方面,政府和行业组织可以共同努力建立公共的RFID实验室和若干典型的应用示范案例等公共的平台,让各企业能够共享资源,从而有效的降低技术研发和应用的成本。
(3)制定发展策略,建设完整的产业链
RFID产业链包括芯片的设计与制造、标签封装、天线的设计与制造、读写设备开发与生产、中间件、应用软件和系统集成集成等环节。在RFID系统中,会涉及到众多的行业和部门,图2为比较典型的行业结构[3]。
从整个产业的情况来看,我国在芯片、中间件和后台软件等方面与国外领先的技术还有很大的差距。要想在关键技术和领域突破,应该由国家和政府牵头,投入巨资兴建巨大的项目工程;而地方政府应选择在封装、读写器、系统集成等方面找准切入点,集中突破。
我国应该制定RFID的发展策略,可以通过制定符合我国实际的RFID产业规划及相关政策,将RFID产业纳入国家重点发展领域;营造良好的技术和产业发展环境,鼓励企业在RFID领域投资、生产,推动RFID产业基地的形成,支持行业应用RFID技术。通过政策、法规、经济、行政等多种手段,对RFID制造、基地建设和应用给予扶持。同时,鼓励我国大专院校、科研院所及企业进行具有自主知识产权的技术产品和标准的开发,建立开放式的技术研发基础平台、支撑RFID技术应用的公共服务平台以及RFID技术测试环境和认证管理机制及质量保障体系。从而形成一个完整的RFID产业链,推动RFID技术的应用。
RFID技术将在不远的将来引起生产和生活方式的全新革命,在国外积极发展和应用RFID技术的情势下,如果我国不发展自己的RFID产业就会受制于人,就会在新一轮技术革命中落伍。
参考文献
[1] 文浩。2007中国RFID发展分析报千。专家论坛,2008,(2):50~54。
[2] 王伟。射频识别(RFID)技术及其应用的研究。安徽师范大学学报(自然科学版)。2008,31(2):139~141。
[3] 陈鹏。RFID产业链浅析。解决方案,2008,(2):34~35。
[4] 郝良彬,李有科。RFID在发展过程中遇到的各种问题分析。金卡工程,2008,(1):49~51。
1.论文研究的背景和意义
到目前为止,随着现代信息的不断发展,智能化和信息化已经被广泛应用到各个领域。目前的自动识别技术主要包括两个种类:条码技术和无线射频(RFID)技术。随着这两种技术的不断发展,自动识别技术已经在全世界具有了一定的发展规模。由于信息量和人们需求的不断扩大,现代的物流行业涉及的种类是很烦琐的供应链结构也相应地变得很复杂,很多时候都是要求远距离的传输,在这种传输中传统的物流方式就存在很大的弊端。RFID技术,最早出现在第二次世界大战的战场上为飞机的一种敌我目标识别出现的。但是由于成本和技术限制等诸多原因,一直没有得到广泛的应用。
2.研究现状
(1)物流信息的研究现状。物流信息管理的发展已有很长一段时间,并且各个地区和国家的发展情况都不尽相同。我们可以在线地对车辆和货物进行信息的追踪和查找,但是这种方式对网站的信息和其他的链接都没有可靠的保障。这种系统可以利用全球卫星定位系统和智能的交通管理系统来对运输货物的车辆进行位置的追踪,从而掌握货物的运输情况,以这种动态的管理方式使得车辆的管理效率得到提高。(2)RFID技术的研究现状。条形码技术可以说最早是由沃尔玛公司开始应用的,从此成为了各个物流行业中的重要识别技术。而现在沃尔玛公司否定了条码技术开始使用电子标签,这充分地说明了RFID技术明显优于传统的条码技术。也预示着RFID技术在商业物流行业中的应用会得到普及,最终取代条码技术。RFID技术在中国作为一种新型的自动非接触式识别技术的发展历史还不是很久,所以是处于刚刚起步的阶段。但是作为一种新型的技术手段,RFID技术还是具有很大的发展前景和空间的。
3.论文研究的主要内容
本文主要是把RFID技术应用到物流信息管理系统中,从而实现对物流全过程的调度优化和控制的动态性。
二、物流信息系统概述
1.物流管理系统的概念及功能
(1)物流系统的定义。物流信息是一个非常广泛的概念,涉及到我们社会经济的任何一个方面,是一个错综复杂的社会系统。从大的材料供应商、批发商到零售商和消费者,几乎都有物流信息系统的身影。现在的物流信息管理系统的主要任务有以下三方面:商品的流动,也就是我们所说的商流;信息的流动,也就是我们所说的信息流;资金的流动,也就是我们所说的资金流。物流信息管理系统的英文名称是Logistics Information System,以下简称为LIS。LIS的主要组成:计算机软硬件、通信网络的主要设备和人组成的智能人际交互界面系统。(2)物流信息管理系统的主要功能概述。通过计算机技术对数据进行处理,可以向运营商和客户提供相应的共享数据,并且可以加强企业和企业之间的合作关系,形成一种更加优越和完善的供应链网络。
2.物流管理系统的主要结构及类型
一个完善的物流信息管理系完成的主要功能包括:首先对信息进行采集整理存储,然后对有用的信息进行相应的传输和利用。与此同时也涉及到了活动中的每个要素。
3.物流信息管理识别中主要的采集技术
物流信息管理系统主要是将各个环节的物流信息联合到一起,表现出了物流管理系统强大的整合能力。(1)条码技术简介。这种识别技术主要是被应用在计算机的数据的输入与输出。具有很多的优点:可靠性高、成本低并且采集和输入输出的速度非常快。由于这些优点的存在,条码技术目前被广泛应用在国内外的物流行业中。条形码识别技术由于具有非常优越的优点,准确可靠快速的传输,使得它的应用价值非常大。其中条形码的设备主要分为条形码的印刷设备和条形码的扫描设备。(2)RFID识别。射频识别技术,即RFID技术是一种非接触式的自动识别的技术。一个标准的射频识别系统是由三部分构成的:电子标签、读写器和天线。但是由于实际中存在的问题,这种RFID系统好使需要软硬件之间的良好配合才能完成它的功能。
三、RFID技术简介
由于射频的数据保密性非常好,所以目前被广泛地应用在防伪行业中。RFID的主要优点是:具有唯一的UID号码。
1.RFID系统的组成和特点
一个最基本的RFID系统如图1所示,一般包括:标签、阅读器、天线和数据的读写系统。
图1 RFID系统组成
标签的作用:RFID的电子标签是由耦合元件组成的。上述每个电子标签都具有唯一的UID编码。是标签唯一识别的标识。读写器:读写器是电子标签的读写设备。主要控制数据的读写。天线:主要完成读写器和标签之间射频信号的传递。
如图1所示,一个完整的RFID系统还包括一个中心处理的电脑和应用软件系统。这个系统主要是将读写器上的信息和数据传递到电脑上的数据处理中心进行处理和应用。这也是RFID技术的基本原理。
2.RFID组成部分简介
(1)电子标签。RFID系统中的电子标签是整个系统的数据的载体。通常情况下,一个完整的电子标签主要是由标签元件和天线组成。电子标签与条形码不同的是电子标签可以自动地把自身存储的信息发送出去,它是可编程的,可以适当地改写编程的程序来满足不同情况下的电子标签的需求。(2)读写器。在RFID系统中,负责数据的读写的设备主要是读写器设备。读写器的功能非常强大,通常在系统中它都是独立存在的,也就是说读写器可以单独地对数据进行读写、处理并且显示等。(3)数据的管理系统。完整的RFID系统除了包括最基本的标签、天线、阅读器外,还应该具有一整套完整的数据管理系统。数据管理系统的主要功能是完成数据信息的处理和存储共享。
3.RFID技术的优点
RFID技术的出现,使人们认为RFID技术是条形码的高级形式,但是这种说法是没有什么理论依据的。RFID作为一种新型的非接触式自动识别技术,它在很多方面都优于条形码技术。RFID技术的优点很明显,它不需要光源,并且更加安全。
4.RFID技术目前面临的问题
RFID技术是一种新型的识别技术,它与条形码识别技术相比,发展的历史比较短。所以技术还不是很成熟,目前还存在着许多发展的问题。
四、物流管理系统的需求分析
1.RFID技术的主要应用
随着信息技术的发展,RFID技术也有一定的发展,被应用在许多不同的领域,最主要的应用范围包括:零售、仓储、生产和运输行业。
2.目前物流公司的现状
经济需求的不断增长,市面上有越来越多的物流公司来满足人们对物流的需求。但是很多物流公司的规模都比较小,存在着一些缺点。
3.需求问题的解决
目前的物流企业的规模比较小,标准和网络化都不完善,存在着各种各样的问题。针对这些问题,我们对物流公司有了新的需求问题的解决方案。每个公司都可以发挥它的长处取长补短,互相帮助赢取共同的利益。这种集中管理和共享的方式不仅可以帮助物流公司来提高他们的运输速度,而且还大大地降低了物流中货物运输的成本,减少了不必要的浪费,有助于管理者的经营。
4.RFID系统结构的选择
本文主要用到的数据库是SQL。采用的主要构架是B/S模式。下面分别对这两种技术进行简单的介绍。(1)SQL简介。SQL(Structured Query Language),它的意思是结构化查询的语言。SQL这种语言最主要的功能是它可以很好地与各个数据库建立相应的联系并且可以进行很好的沟通。(2)浏览器/服务器(B/S)构架。目前来说管理信息系统主要的构架类型主要包括:主机/终端型、客户机/服务器即所谓的C/S模式、文件/服务型、三层的B/S和多层分布的形式。
这种技术是www技术和数据库技术相结合的结果,是未来数据库发展的主要方向。
B/S模式的主要结构如图2所示。
图2 B/S模式结构示意图
5.系统成本的分析
我们知道RFID系统主要是由标签、天线和阅读器构成的,所以它的主要硬件成本也是由这三部分构成,这主要是从RFID系统的市场需求来看的。对于物流管理行业来说,这三部分也是主要的硬件投资方式。虽然目前RFID系统的成本略高,但是它带给我们的优点远远胜过了糨的这个不足。
五、系统的总体设计研究
1.基于RFID的物流管理系统的总体目标
物流信息系统主要解决的问题是:(1)缩短从接受订货到发货的时间;(2)库存适量化(压缩库存并防止脱销);(3)提高搬运作业效率;(4)提高运输效率;(5)使接受订货和发出订货更为省力;(6)提高接受订货和发出订货精度;(7)防止发货配送出现差错;(8)调整需求和供给回答信息咨询等。一个好的完善的物流信息管理系统会很好地解决上述的问题。我们最终的目的都是为了提高服务水平并且降低物流运输的总成本。
2.系统硬件产品介绍
本系统设计的是一个基于RFID硬件产品已有的物流管理系统,所以首先对RFID不同用途的读写设备和它们的应用场合作了一下简单的介绍,例如,下面这款电子标签。
本系统选用的电子标签是T12048,这款电子标签是TI公司新出的一款粘贴式的电子标签。如图3所示。
媒体的核心价值体现在内容及其传播上。《大众日报》作为我国连续出版时间最长的党报,自1939年1月1日创刊以来,已经连续出版了70多年。在1996年实现电子报之前,有近60年的历史纸质报刊没有数字化,而且早期的珍贵版本也因为纸张老化严重,只能封存在档案室,无法公开检索,也妨碍了山东省相关历史专题资料的深入挖掘工作。而历史报刊数字化技术则可以在充分保护历史资料的前提下,将历史报刊原始风貌、文章和图片通过计算机和网络展现在屏幕上,为想了解新闻历史的读者带来便利;另外,通过数据挖掘,还可以整理出更有价值的新闻专题资料。
2011年,大众报业集团确立了“《大众日报》历史报数字化项目”,并成立了专门的项目组具体负责实施,围绕集团历史报刊数字化的相关问题进行了一系列调研。本文对历史报刊数字化的最新技术进行了研究和探讨,主要内容包括纸质报刊及胶片扫描、OCR识别和校对、元数据抽取与标引、PDF构建技术等方面。
历史报刊数字化流程概述
历史报刊数字化技术与最近十多年普通的报刊数字化技术不尽相同。自从报业实现数字化工作流程以来,报纸的采编发排都采用计算机技术,其信息已经实现了数字化,而历史报刊由于早期使用铅字印刷或者石印、油印等,没有对应的数字信息,因此需要通过相应的技术手段将纸质信息数字化提取到计算机当中。
历史报刊特别是早期报纸是历史文档的重要资料,虽然人们对报纸的格式十分熟悉和认可,但从数字化处理的角度来看,报纸的格式是相当复杂的:文章长短不一,早期报纸有竖排版面、繁体字等,字体也不是当代的标准化字库里的字体,有照片图表,长篇的文字分布在不同的版面或页面中。另外,早期报纸的印刷质量和纸张质量不是很好,随着时间推移,有的字体可能会模糊,纸质会变得非常脆、易碎,难于处理,还有一些报纸只能在缩微胶片上找到。所有这些因素都使历史报刊的数字化面临很多困难,需要进行一些特殊处理。
目前,历史报刊数字化有比较标准的制作流程和技术工艺,不同的厂商可能会有自己的特点,不过制作流程一般会包括以下几个步骤:
1.报刊的清点。按照日期、版面清点数量,确认其完整性、可识别性、可扫描性。由于报刊一般都有一定的发行量,不止一个复本,应尽可能寻找最佳的一份,如果现实中找不到可用的报刊实体,可以用缩微胶片替代。
2.扫描和修图。利用大幅面扫描仪扫描纸质报刊,用胶片扫描仪扫描缩微胶片。对扫描得到的TIF图片进行修正,去除污渍、裂纹等。
3.OCR文字识别与校对。OCR(光学字符识别)是一种通过计算机自动识别图片上文字的技术,标准印刷汉字的OCR识别正确率可达到99%以上。由于早期报刊印刷技术简单和保存环境的原因,识别率可能稍低一些,需要进行多次校对以保证最终的质量。校对包括人工校对和智能化自动校对。
4.版面分析和划分。将修正后的版面扫描图片按照主题文章进行区域划分和标识。
5.制作版式文件。根据步骤2、3、4得到的信息制作可检索的数字版式文件,比如PDF等。
6.数字数据验收。对上述步骤得到的文字、图片、版式文件等数字数据进行再检验,以确保完整性和正确性。
7.数据入库。文字入全文数据库,图片入图片数据库,版式文件入版面数据库,三种数据库是相关联的,可以联合检索。
8.建立双平台检索系统。一般采用B/S架构,用户通过浏览器即可检索上述三种数据库。
经过上述步骤的处理加工后,最终的产品是一个完整的系统,其中包括:包含全部报刊文字和元数据的全文数据库、包含报纸照片和版面扫描图片的图片、可检索的PDF版式文件、基于B/S架构的双平台检索系统等。此外,为了支持高质量的再印刷,也包括修正后的版面扫描TIF图片。
历史报刊数字化关键技术研究
历史报刊数字化的关键技术包括:
1.图像获取:主要通过扫描,包括纸质扫描和胶片扫描等。
2.OCR文字识别与校对、版面分析和划分等:将修正后的版面扫描图片按照主题文章进行区域划分,目前有自动识别主题文章区域的技术。
3.元数据抽取和分类标引:文章的元数据抽取包括对文章主题、副题、引题、作者、来源、关键词、摘要、引文、外部特征等信息的自动识别和自动抽取;分标引类是按照国家新闻标准分类法对文章进行分类标识。
4.全文数据库和图片数据库:全文数据库是实现全文检索的数据库系统,为按关键字检索整篇文章带来很大便利;图片数据库一般按照文件存储、按照标引检索。
5.数字版式文件的制作、检索技术:制作数字化版式文件是为了能够展现历史报刊的原始风貌,使读者能直观地感受到是在阅读一份早期的报刊,更具有视觉震撼力。目前报刊的数字版式文件一般采用Adobe的PDF格式,根据扫描图像制作成可检索PDF一般采用双层和重构技术。
下面进行更详细的阐述。
1.扫描技术
扫描是历史报刊数字化制作流程中的关键,因为后续工作完全基于扫描后得到的TIF图片,其扫描质量、分辨率的选择、所使用的设备和参数设定都对后期制作有重要影响。特别是分辨率的选择,需要考虑到当代印刷术和近代的印刷术,当代彩色报刊的印刷一般要求彩色图片在200~300dpi即可,既不宜过低也不宜过高,而近代的印刷主要是以铅印、油印等为主,历史报刊的扫描精度一般采用300~600dpi,其目的是为了保存更多的细节,更具参考和研究价值。扫描精度越高,所得到扫描图片的容量也越大,因此,在选择扫描精度的时候也需要考虑硬件方面的存储容量。
由于报刊在印刷时是靠细小点阵来显示图像,并不是连续的色彩,高精度扫描会扫描出网状条纹,这种情况可能会降低OCR软件的处理速度。现在许多扫描仪有去除网纹的功能,可以解决此类问题。对于没有去除网纹功能的扫描仪,如对图像要求不高的话,可用降低扫描分辨率的办法。因此,如果考虑到下一步的文字识别率, 5号以上字体使用300dpi扫描,6号、7号字体使用400~600dpi扫描。综合考虑上述因素,可以统一使用400dpi左右的扫描精度。
纸质报纸和缩微胶片扫描所使用的设备和参数设定也有所差别,纸质报纸一般使用大幅面的快速扫描设备,而缩微胶片扫描仪在扫描前需要进行预先光学处理,目的是为了达到和纸质扫描相同的分辨率。
OCR技术原理是对光学仪器产生的影像(比如扫描图片)进行处理,消除一些影响识别的可忽略因素(自动或者手工),将影像进行区域分割,使之成为可以独立识别的单元,然后从这些影响单元中提取形态特征,再与标准特征库中的数据进行对比,根据对比的结果决定该单元的识别结果。由于不确定因素较多,比如扫描设备的质量、扫描资料的质量、扫描精度、识别软件、学习和测试样本等都会影响到识别的准确率。
文字识别之前的影像预处理是该过程中需要处理问题最多的阶段,其中包括影像的正规化、除噪声、图像矫正、图文分析、文字行与字分离等步骤。举例说明,对于历史报刊而言,如果其扫描图片出现倾斜,超出计算机自动识别的误差范围,就需要就行图像旋转矫正;如果原始报刊本身由于存放时间过长,出现污点裂痕较多,影响到正常文字的识别,那么就需要将扫描图片上的这些污点裂痕去除、背景化;此外,早期报纸有竖排版,在行、字分离上需要进行特殊处理。
从识别技术的难度角度来看,印刷体识别相对要容易、正确率更高一些,因此对于历史报刊而言,只要预处理做得比较完善,其自动识别不会产生过多的错误。为了保证更高的文字正确率(比如差错率在万分之一以下),需要进行校对。校对包括软件自动校对和人工校对,自动校对是根据自然语言处理技术对识别出的文字语句的正确性进行判断和标注,然后进行纠错;人工校对是完全依赖校对员的判断。OCR的校对一般都是结合自动和人工两种方式进行反复多遍的排查纠错。
3.元数据抽取和标引技术
在建立全文数据库、图片数据库和版式文件数据库之前,需要对文章进行元数据抽取和标引,其目的是从多角度对文章、图片和版面文件进行标注说明,以完善检索系统。文章的元数据主要包括题名信息、作者信息、来源信息、关键词信息、摘要信息、引文信息、外部特征信息等。对于报刊而言,题名信息、作者信息、来源信息一般都在版面上明确标出,在OCR识别的版面区域划分过程中获得相应的信息;而对于其他元数据,比如关键词信息、摘要信息、引文信息等,因为没有明确标出,需要从报刊正文中提取,由于历史报刊数字化需要在短时间内处理海量的报刊文章,依靠人工无法完成,所以必须要进行元数据的自动抽取,需要结合自然语言处理、机器学习等技术。
在文本中抽取元数据标引,可分为全关键词标引和主关键词标引。自动标引过程与人工标引过程相似,其特点是标引速度快,标引的前后一致性好,在随机存储介质容量允许、软件检索功能具备的情况下,可以实现文摘、甚至全文的无人工标引自动检索。目前自动标引系统抽出的表述文献主题的主关键词准确性较差,还不能完全代替人工标引。
4.版式文件制作技术
版式文件是一种具有版权保护、加密、防止非法复制、防止屏幕拷贝、能够全面展示版面多媒体内容和样式、并且能够精确输出到打印设备的文件格式,目前比较流行的版式文件是Adobe公司的PDF,国内北大方正采用了CEB,另外还有epub等。报刊的版式文件一般采用PDF格式。
制作版式文件是历史报刊数字化的一项重要工作,其意义有以下几个方面:(1)首先通过版式文件能够直观地展示历史报刊的外观,包括版面布局、文字样式和图片等。(2)支持版面检索,在双平台检索平台通过关键字检索就能找到包含关键字的版面。(3)支持再印刷,矢量字体的版式文件能够进行更大幅面的印刷输出,不会有字体的变形。(4)标准化的文件格式便于存储和交换。
目前历史报刊数字化的PDF版式文件制作有两种技术:双层和重构。对于前期历史报刊而言,因为没有对应的电子版面文件,所以需要制作双层或者重构PDF。制作双层PDF的重点在于扫描图片处理成合适清晰度的压缩图片用于双层PDF的上层图片层,并将文本按照原始版面结构重排并与图片层对应,形成隐藏的下层文字层;重构PDF则是利用图片和文本数据按照原始版面结构进行整版的图文混合重排,是单层结构。这两种PDF的主要区别有以下几方面:
(1)在PDF文件结构方面:双层PDF,顾名思义,该PDF逻辑上具有两层(一层纯图片层、一层纯文本层),上层是用于浏览的可视图片层(为了避免文件体积过大,该图片层一般使用高清扫描图片的压缩格式),能够浏览版面扫描原貌;下层是用于文字检索的隐藏文本层(浏览时不可见),文本层中的文字就是版式图片经OCR识别校正后的文本,它与上层图片层版式图片中的文字是一一对应的,一个是图片化文字、一个是文本化的文字。这样形成的双层PDF既可以100%保留原始版面效果,又可以通过下层的文字信息支持选择、复制、文字检索等功能。重构PDF,是当代流行的单层图文混排结构。
(2)在PDF版式重排方面:对于历史报刊而言,双层和重构PDF都要进行相应的版面重排,但是双层PDF仅对其文字层的文字按照原始版面位置进行重排和对应;而重构PDF则要按照当今的图文混排方式重现原始版面的样貌,所以制作方面工作量要大一些。对于组版出版数字化之后的近期历史报刊而言,由于已经存在可印刷的数字PS版面文件和对应的数字矢量字库,而且这些PS版面文件可以精确地批量生成当今流行的图文混排的PDF版,不必再进行版面重排,就没有制作双层或者重构PDF之说了。
(3)在视觉浏览方面:双层PDF是100%保留扫描版面视觉效果,但受图片层的精度所限,其中的文字缩至较小时会产生字体变形,而放大到一定程度字体会产生马赛克模糊;重构PDF中的文字是矢量字体,可对字体进行任意缩放,保持字体边缘依然光滑,字体色素不会丢失,因此不会变形和模糊。但是,重构PDF中的文字字体可能与原始字体有所差别。特别是早期铅字或者油印的报刊,由于没有对应的数字矢量字库,所以无法100%保留原始效果。但数字化以后的历史版面,就不存在这个问题。
(4)在用于印刷方面:同视觉浏览方面相类似,双层PDF是100%保留扫描版面视觉效果(原汁原味),但受图片层的精度所限,不能进行大幅的放大印刷,字体会产生马赛克模糊。对此可以直接使用修正后的高清TIF扫描图片进行大幅面的印刷。重构PDF支持任意放大的印刷,字体边缘光滑清晰,不会产生变形和模糊,印刷质量好于双层PDF。
(5)在版式文字检索和定位方面:双层和重构PDF都支持版面文字检索和定位,在检索速度上,双层的速度慢于重构,因为双层PDF的文件较大。
(6)在存储容量方面:重构PDF文件的存储容量比双层PDF文件小得多,一般是其1/4至1/6左右。因此重构PDF文件的打开和网络传输都要比双层PDF快,更适合于网络浏览。
(7)在文字差错率方面:理论上,历史报刊数字化的文字差错率和PDF采用双层和重构并无关系,差错率只和OCR识别准确率和人工校正等有关。在这方面,双层和重构的差别在于:对于双层PDF来说,即使文字层有错字,由于其本身是隐藏的(上层是可视图片),也不会被看见,但会在文本检索和复制过程中体现出来;对于重构PDF来说,文字如果有错误,则直接能看到。出错率的产生,很大程度上取决于原始扫描图的修正、文字识别准确率、校改人员的责任心、新闻常识、历史经验和承接公司的项目管理经验等。
(8)在渠道方面:双层PDF适合在本地电脑和局域网上浏览,重构PDF除本地电脑和局域网上之外,也适合在互联网上、手机、平板电脑、户外大屏上浏览。
(9)在专辑出品方面:这两种技术都能够满足个性化专辑出品的需求。
(10)费用方面:由于重构PDF的制作工作量相对大一些,所以制作重构PDF的费用比双层PDF高15%~20%左右。
总的来说,实施历史报刊数字化项目,如果仅从保护、存档的角度考虑,那么扫描历史报版面建立图片数据库,进而进行文字识别、校正、标引、入库、建立全文数据库和检索网站即可;如果进一步从满足版式检索和PDF浏览功能考虑,可采用双层PDF技术;如果考虑未来媒体终端的应用(例如苹果的iPhone手机、iPad平板电脑)、开发更多的衍生产品,那么可采用重构PDF的技术方案。
总 结
国内从事这一领域的厂商采用不同的解决方案。在选择解决方案的时候,首先要以保证质量为最基础的条件,然后再考虑技术方案、价格、知识产权保护、再开发再利用等因素。历史报刊数字化是一项尊重历史、保护历史资料、挖掘资料价值的工程,让尘封的珍贵报刊通过现代信息技术以一种崭新的面貌呈现在读者面前,体现了社会责任和文化创新精神,保护与开发并存,让历史报刊重新面对公众,为了解和研究中国近现代新闻发展历史提供丰富的信息源泉。
参考文献:
关键词:烟叶数字图像;边缘处理;形态学变换;特征抽取;智能识别
1引言
烟叶是烟草工业的基础原料, 对烟草工业生产质量和烟草行业经营效益具有举足轻重的作用。对烟叶生产过程的各个环节包括烟叶品质的智能识别进行技术创新,提高品质和效率,是一个前沿研究方向[1][5]。
当前这一方面的研究,主要集中在数字图像处理方面,把烟叶品质的数字图像处理与神经网络技术相结合,实现烟叶品质的智能识别,是一个极有价值的工作。以下在此方面作出一个系统的、较为完备的、易于实际操作的研究。
2主要技术手段
2.1 MAⅡAB图像处理工具箱
在MATLAB平台上,借助图像处理工具箱,可以简易明快地实现对烟叶数字图像的图像处理。在烟叶生产一线,用数码照相机对各种烟叶样本进行拍照,输入计算机,用MAT_LAB将它转换为各(.bmp;.jpeg;.gif;.png;.t 图片以便进行图像处理。成本低,精确度高,宜于普及推广。获取各种类型的烟叶数字图像以后,经阈值使用权图像二值化,可以当即辨识出这一图像是否具有何种类型的病虫害或品质异变。利用烟叶数字图像的边缘检测、轮廓提取等分析命令,获得待测烟叶的图像参数和特征,再由神经网络技术,完成对烟叶品质的智能识别。
2.2神经网络技术
神经网络是一个新的智能识别工具。毕业论文 经过训练的神经网络能够存储与过程有关的信息,能直接从历史数据中学习,经过用各种烟叶样本训练和学习的神经网络,能自动地识别出待测烟叶样本的品质类型。而且,神经网络具有滤除噪声及在有噪声情况下得出正确结论的能力。这一点对于烟叶生产实际中大量存在各种噪声信息的情况而言,特别重要。它特别适合在线识别。
3应用MATLAB图像处理工具箱和神经网络技术对烟叶品质智能识别的操作过程
3.1烟叶图片样本库的建立
用数码相机或其它数字图像采集工具,采集各种类型的烟叶的标准图片,分类归档,借助MATLAB图像变换功能,将各种类型的烟叶的标准图片,转换成各种图片形式:.bmp;.jpeg;.sir;.png;.tif等,以便随时调用。这些烟叶图片,有不同品质的样本;还有各种病虫害标本和变异标本。
3.2用直方图均衡来实现图像增强
当从生产一线采集的烟叶待测样本的图像对比度较低,硕士论文 即灰度直方图分布区间较窄时,可用直方图均衡实现灰度分布区间展宽而达到图像增强的效果。
3.3烟叶图像的边缘检测和特征提取
烟叶图像的基本特征之一是图像边缘。图像边缘是图像周围像素灰度有阶跃性变化或屋顶变化的像素的集合。烟叶的边缘是由灰度的不连续性所致,因此考察图像每个像素在某个邻域内灰度的变化,利用边缘邻近一阶或二阶方向导数变化规律可以检测烟叶图像边缘。图像特征反映烟叶的几何结构,如面积、周长、分形分维数、孔洞数、欧拉数等等。图像特征的选择是图像识别的重要环节。运用二叉分类法在找出判别特征后,对不同的图像特征由分类阈值按二分的方法进行分类;运用相似距离分类方法把待判图像与一个标准图像相比,标准图像用样本图像特征向量的均值来表示。通过计算待判图像与标准图像之问的在相空间中的距离来判别图像和进行分类。这一过程还为用神经网络技术实现对烟叶品质进行智能识别作出必要的准备。
3.4数字图像矩阵数据的显示及其傅立叶
变换这一变换的目的是为提取特征、进行神经网络模式识别等作出必要的准备。
转贴于 3.5直方图均匀化
这是使烟叶图像性质更为优良而采取的一个技术操作,源代码如下:
I=imread ("yangshuo.tif');imshow (I);
figure,imhist(I);
[J,T]=histeq (I,64);
%图像灰度扩展到0-255,但是只有64个灰度级
figure,imshow (J);
figure,imhist(J);
figure,Dlot((0:255)/255,T);%转移函数的变换曲线
J=histeq (I,32);
figure,imshow 0);
%图像灰度扩展到0~255,但是只有32个灰度级
figure,imhist(J);
3.6采用二维中值滤波函数对受椒盐噪声干扰的图像滤波
MATLA图像处理工具箱具有强大的功能,能够对噪声干扰的烟叶图片进行消噪处理,模拟源代码如下:
I=imread ("eight.tif');
imshow (I);
J2=imnoise (I,"salt&pepper ,0.04);
%叠加密度为0.04 的椒盐噪声
figure,imshow 02);
I_Filterl=medfdt2 (J2,[3 ,3]);
%窗口大小为3x3
figure.imshow (I Fiher1);
I_Filter 2=medfdt2 (J2,[5, 5]);
%窗口大小为5x5
figure,imshow (I_Filter2);
I_Filter3=medf'dt2 (J2,[7, 7]);
%窗口大小为7x7
figure,imshow (I_Filter3);
3.7用神经网络技术对烟叶图像进行智能识别
神经网络作为一种自适应的模式识别技术,并不需要预选给定有关模式的经验知识和判别函数,它能通过自身的学习机制自动形成所要求的决策区域。网络的我由其拓朴结构、神经元特性、学习和训练规则所决定,它可以充分利用状态信息,对不同状态一一进行训练而获得某种映射关系,并且,网络可以连续学习,即使环境变异,这咱映射关系可以自适应调整。在上面各节获取烟叶图像特征基础之上,可以用神经网络技术进行图像模式识别。例如,基于概率神经网络PNN的烟叶品质智能识别,它的主要优点是:快速训练,训练时问仅略大于读取数据时间;无论分类多么复杂,只要有足够的训练数据(而这是烟叶生产一线可以做到的),就可以保证获得贝斯叶准则下的最优解,允许增加或减少训练数据而无需重新进行长时间训练。这一神经网络对于烟叶品质的图像识别,具有重要意义。 4结论
基于计算机视觉和神经网络技术的烟叶品质识别的数字图像处理方法,医学论文 是烟叶生产环节的一种技术创新,它可以在烟叶生产一线普及推广,简便易行,能够较大地提高烟叶品质检测的效率和质量,以及自动化程度和智能化水平。
参考文献
[1]于润伟.基于图像处理的稻米垩白自动检测研究[J].中国粮油学报,2007,1:122—124.
【关键词】新疆;民族;文字识别;发展进度
我国是多民族国家,尤其是在新疆维吾尔自治区共有13个少数民族在这富饶的土地上共同生存和繁荣发展。在我国少数民族语言文字政策的大力支持下,我区各民族都在使用各自的语言文字并通过在语言文字领域不断引进新兴技术,使各自的文字领域创造了数字化、自动化的新的局面。本文提出的少数民族文字识别系统指的是使用某种数字技术把现存的少数民族文字编写的纸质文献通过扫描形式先转化为计算机能识别的标准图像格式,再用类似于中文文字识别软件OCR等转换工具把以图像格式保存的文字转换成WINDOWS等系统的WORD或其他文本格式文件的过程。这些文本文件形成后根据使用者的需求会直接被使用或再进行二次加工用PDF文件或HTML网页文件等软载体传播并提供给读者阅读。文字识别系统为后者提供准备工作和硬条件,也就是为电子图书等数字文献的形成做中转的作用(如图1)。介绍新疆地区少数民族文字识别系统之前,我们必须先了解其文字背景和特点,首先简单介绍一下我区少数民族文字现状。
一、少数民族文字基本情况
在新疆地区,维吾尔族、哈萨克族、柯尔克孜族等属于突厥语系的民族现在都使用自己的语言和文字实现各种交流和沟通。这几个民族使用文字的历史原因,使用文字变化多样化、因时代不同而使用文字不同等特点已经导致文字的不统一性和不确定性。在解放前后都已经使用过新、旧文字两种文字表达方式。而他们现在用的文字是国家按有关语言文字的特征,在阿拉伯文字的基础上模仿性创造出的文字表达方式,是在阿拉伯文字的基础上更改并简化了部分环节后产生的新的字母,既有阿拉伯文字的有些特征并有自己的特点和不同。维吾尔文字使用32个字母,哈萨克文使用33个字母,柯尔克孜文使用30个字母(1983年版),这三种语言文字在各自中间也有些共同点和不同地方。
目前,虽然有关这些语言文字识别的研究有了些新的进展,其实幅度还是不能满足使用者对新技术的发展需求,可以说是出于发展的初级阶段。由于阿拉伯文和这些语言字符集上的相似性,可以借鉴阿拉伯文研究成果。但是阿拉伯文字识别的研究远远落后于拉丁文、中文等文字识别技术的研究,大部分的研究采用的是结构化的方法。
二、少数民族文字自动识别的特点
因为跟阿拉伯文字有不同点,这些语言文字的识别技术也会有自己的特点和不同之处,简单总结为以下几点:
(1)形成的少数民族文字电子书籍格式不统一或不完善,基本以图像格式使用,再有转化为文本格式的电子书籍也是很少一部分。因相关文字识别技术不成熟,好多电子图书都不是靠文字识别系统来转换为电子版的。在使用扫描形成的图像格式(*.BMP,*.JPG等文件)制作成包括PDF在内的各种格式的资料中,转换出的文本里不能正常显示的字母占的比例高或者各种符号的错误率较高、排版出现混乱等现象普遍存在,最后影响了整本电子文献的质量。这种现象的主要原因是某些字母在数字转换过程中没有能够达到识别的标准,部分原因来自于工作人员的疏忽和工作态度等。现在,已经以图像形式扫描成为电子文献的资源已经开始在社会各个领域使用并开始形成数据库。跟文本形式的电子书相比,这些图书在实际使用中确实不易利用,显然有很多不足之处。读者使用时这种图像个会的文件仅能通过输入文本格式的文件名来查询,而不能直接把文件内容使用各种文本编辑工具来编辑或通过 JAVA ,XML等脚本语言编程,对PDF或HTML等网页文件内容进行查询和编辑操作。
(2)因历史种种原因导致的文字使用背景,存在一种语言使用多种文字情况,识别过程比较复杂,处理一种语言文字需要两种解决途径,而且这两种解决方式是并且(U或者AND)关系的结构。拿维吾尔语和哈萨克语来讲的话,这两种语言到1965年前都使用阿拉伯文字形式的旧文字,从1965年开始使用拉丁文字形式的新文字,而又从1982年开始变更为以前的阿拉伯文字形式的旧文字。所以,处理这不同年代时的图书资料时,我们需要处理两种不同文字。虽然是一种语言,因使用的文字不同,而且这两种文字从结构上有根本性区别和不同的特点。这显然会要求我们准备和使用两种不同的处理技术和方案。
(3)文字识别系统准确率不高,识别质量低。虽然少数民族文字识别系统问世已有几年时间,软件技术基本不成熟,实际使用中遇到的需要攻关和还未能得到全面解决的技术性问题很多。不仅现有的少数民族文字识别软件的种类和数量都少,而它们的识别率等最关键的技术水平也未能得到提高,还处在初级研究和充实阶段,而且发展进度也比较慢。对现有的少数民族文字识别软件而言,它们的实际识别率仅仅达到10%—15%左右,根本无法满足文字系统应有的功能指标。如果按照这个比例进行扫描的话,整本书的大部分内容会出现错误而需要对其余部分进行手工输入,根本体现不出自动化处理的优越性,反而会浪费人力和财力并会提高建立数字资源的成本,最终影响数字资源库的建设步伐。其中也隐藏着使用者数量不多、市场发展前景不乐观、经济利润少等几个主要因素。不管再有多大的技术障碍或客观因素,如果有读者的需求和时代的要求,我们有必要组织更多的人力和财力发展文字自动识别并攻关这些技术难关。
从技术角度来看,少数民族文字自动识别工作中存在一下三种技术亮点和把关的环节:
三、文字识别中的技术亮点
(1)形成文本文件后的文字必须符合Unicode字符标准,不管使用什么字体,在编码中必须使用Windows 系统无条件认可的字符格式。这样才能保证文本在检索中的统一性,避免出现文字编码不同而影响检索结果。相反,在建立数字资源数据库时数据不管存放到SQL或Oracle 等大型数据库或自制数据库里,只能找出相关文件名,而查询全文时会出现字符乱码或显示不正常等情况。
(2)同时需要解决并提高混合文字的识别率。因现存的维哈文等用的是从右到左的读写方式,如果在文献全文中维哈文字符和拉丁文字和中文、符号和数字同时出现时就需要处理不同文字的不同拼写方向问题。这是识别某种文字的同时还需要保证其中混合的读写方向不同的其他文字和字符的准确率。虽然这种情况在文学作品中出现的概率不大,在其他学科(比如学术性文章和自科类文献)中出现的概率还是不能小看的。为了实现文献全文和电子版的融合,此项工作必须当重中之重来考虑并完成。
(3)因文字自身特征,维哈文等文字有30多个主体字母的90多种字符形式,在扫描识别过程中不能忽视这些字母的变位规律。比如一个字母根据在词语中的位置有四种写法时(不包括在行尾的简写方法)会要求文字识别软件必须按照该字母当时的字符形式来做出判断。比如:哈萨克文中字母T()来举例,该字母根据词语中的位置有(如图2)四种写法。这种因素无意中会给文字识别的速度与准确率带来一些技术上的障碍并会影响逻辑识别的连续性。
总之,因维哈文字书写方向为从左到右,且各字符是在基准线附近相互连接的,因此,维哈文字符的识别率要比中文、英文等符号之间的存在空隙字符的识别率要低。这些少数民族手写文字的识别主要的困难基本集中在于字符结构简单、笔划数少、可提取的特征较少、字符之间的相似程度极高、手写草体的区别较大等几个方面。对民族文献信息的深入、持续建设和开发利用仍然是摆在民族图书馆人面前的一项艰巨而紧迫的任务。我们必须在已有的基础上,进一步解放思想,与时俱进,求真务实,急读者所急。也相信在不久的将来会找出可靠、稳定的解决方案和技术创新。
参考文献:
[1] 硕士研究生论文.新疆大学;维文在线处理技术与实现:瓦热斯江·阿布都克力木[2002年6月10日]
[2]吴慰慈.图书馆学概论 ,北京:北京图书馆出版社
1.论文研究的背景和意义
到目前为止,随着现代信息的不断发展,智能化和信息化已经被广泛应用到各个领域。目前的自动识别技术主要包括两个种类:条码技术和无线射频(RFID)技术。随着这两种技术的不断发展,自动识别技术已经在全世界具有了一定的发展规模。由于信息量和人们需求的不断扩大,现代的物流行业涉及的种类是很烦琐的供应链结构也相应地变得很复杂,很多时候都是要求远距离的传输,在这种传输中传统的物流方式就存在很大的弊端。RFID技术,最早出现在第二次世界大战的战场上为飞机的一种敌我目标识别出现的。但是由于成本和技术限制等诸多原因,一直没有得到广泛的应用。
2.研究现状
(1)物流信息的研究现状。物流信息管理的发展已有很长一段时间,并且各个地区和国家的发展情况都不尽相同。我们可以在线地对车辆和货物进行信息的追踪和查找,但是这种方式对网站的信息和其他的链接都没有可靠的保障。这种系统可以利用全球卫星定位系统和智能的交通管理系统来对运输货物的车辆进行位置的追踪,从而掌握货物的运输情况,以这种动态的管理方式使得车辆的管理效率得到提高。(2)RFID技术的研究现状。条形码技术可以说最早是由沃尔玛公司开始应用的,从此成为了各个物流行业中的重要识别技术。而现在沃尔玛公司否定了条码技术开始使用电子标签,这充分地说明了RFID技术明显优于传统的条码技术。也预示着RFID技术在商业物流行业中的应用会得到普及,最终取代条码技术。RFID技术在中国作为一种新型的自动非接触式识别技术的发展历史还不是很久,所以是处于刚刚起步的阶段。但是作为一种新型的技术手段,RFID技术还是具有很大的发展前景和空间的。
3.论文研究的主要内容
本文主要是把RFID技术应用到物流信息管理系统中,从而实现对物流全过程的调度优化和控制的动态性。
二、物流信息系统概述
1.物流管理系统的概念及功能
(1)物流系统的定义。物流信息是一个非常广泛的概念,涉及到我们社会经济的任何一个方面,是一个错综复杂的社会系统。从大的材料供应商、批发商到零售商和消费者,几乎都有物流信息系统的身影。现在的物流信息管理系统的主要任务有以下三方面:商品的流动,也就是我们所说的商流;信息的流动,也就是我们所说的信息流;资金的流动,也就是我们所说的资金流。物流信息管理系统的英文名称是Logistics Information System,以下简称为LIS。LIS的主要组成:计算机软硬件、通信网络的主要设备和人组成的智能人际交互界面系统。(2)物流信息管理系统的主要功能概述。通过计算机技术对数据进行处理,可以向运营商和客户提供相应的共享数据,并且可以加强企业和企业之间的合作关系,形成一种更加优越和完善的供应链网络。
2.物流管理系统的主要结构及类型
一个完善的物流信息管理系完成的主要功能包括:首先对信息进行采集整理存储,然后对有用的信息进行相应的传输和利用。与此同时也涉及到了活动中的每个要素。
3.物流信息管理识别中主要的采集技术
物流信息管理系统主要是将各个环节的物流信息联合到一起,表现出了物流管理系统强大的整合能力。(1)条码技术简介。这种识别技术主要是被应用在计算机的数据的输入与输出。具有很多的优点:可靠性高、成本低并且采集和输入输出的速度非常快。由于这些优点的存在,条码技术目前被广泛应用在国内外的物流行业中。条形码识别技术由于具有非常优越的优点,准确可靠快速的传输,使得它的应用价值非常大。其中条形码的设备主要分为条形码的印刷设备和条形码的扫描设备。(2)RFID识别。射频识别技术,即RFID技术是一种非接触式的自动识别的技术。一个标准的射频识别系统是由三部分构成的:电子标签、读写器和天线。但是由于实际中存在的问题,这种RFID系统好使需要软硬件之间的良好配合才能完成它的功能。
三、RFID技术简介
由于射频的数据保密性非常好,所以目前被广泛地应用在防伪行业中。RFID的主要优点是:具有唯一的UID号码。
1.RFID系统的组成和特点
一个最基本的RFID系统如图1所示,一般包括:标签、阅读器、天线和数据的读写系统。
图1 RFID系统组成
标签的作用:RFID的电子标签是由耦合元件组成的。上述每个电子标签都具有唯一的UID编码。是标签唯一识别的标识。读写器:读写器是电子标签的读写设备。主要控制数据的读写。天线:主要完成读写器和标签之间射频信号的传递。
如图1所示,一个完整的RFID系统还包括一个中心处理的电脑和应用软件系统。这个系统主要是将读写器上的信息和数据传递到电脑上的数据处理中心进行处理和应用。这也是RFID技术的基本原理。
2.RFID组成部分简介
(1)电子标签。RFID系统中的电子标签是整个系统的数据的载体。通常情况下,一个完整的电子标签主要是由标签元件和天线组成。电子标签与条形码不同的是电子标签可以自动地把自身存储的信息发送出去,它是可编程的,可以适当地改写编程的程序来满足不同情况下的电子标签的需求。(2)读写器。在RFID系统中,负责数据的读写的设备主要是读写器设备。读写器的功能非常强大,通常在系统中它都是独立存在的,也就是说读写器可以单独地对数据进行读写、处理并且显示等。(3)数据的管理系统。完整的RFID系统除了包括最基本的标签、天线、阅读器外,还应该具有一整套完整的数据管理系统。数据管理系统的主要功能是完成数据信息的处理和存储共享。
3.RFID技术的优点
RFID技术的出现,使人们认为RFID技术是条形码的高级形式,但是这种说法是没有什么理论依据的。RFID作为一种新型的非接触式自动识别技术,它在很多方面都优于条形码技术。RFID技术的优点很明显,它不需要光源,并且更加安全。
4.RFID技术目前面临的问题
RFID技术是一种新型的识别技术,它与条形码识别技术相比,发展的历史比较短。所以技术还不是很成熟,目前还存在着许多发展的问题。
四、物流管理系统的需求分析
1.RFID技术的主要应用
随着信息技术的发展,RFID技术也有一定的发展,被应用在许多不同的领域,最主要的应用范围包括:零售、仓储、生产和运输行业。
2.目前物流公司的现状
经济需求的不断增长,市面上有越来越多的物流公司来满足人们对物流的需求。但是很多物流公司的规模都比较小,存在着一些缺点。
3.需求问题的解决
目前 的物流企业的规模比较小,标准和网络化都不完善,存在着各种各样的问题。针对这些问题,我们对物流公司有了新的需求问题的解决方案。每个公司都可以发挥它的长处取长补短,互相帮助赢取共同的利益。这种集中管理和共享的方式不仅可以帮助物流公司来提高他们的运输速度,而且还大大地降低了物流中货物运输的成本,减少了不必要的浪费,有助于管理者的经营。
4.RFID系统结构的选择
本文主要用到的数据库是SQL。采用的主要构架是B/S模式。下面分别对这两种技术进行简单的介绍。(1)SQL简介。SQL(Structured Query Language),它的意思是结构化查询的语言。SQL这种语言最主要的功能是它可以很好地与各个数据库建立相应的联系并且可以进行很好的沟通。(2)浏览器/服务器(B/S)构架。目前来说管理信息系统主要的构架类型主要包括:主机/终端型、客户机/服务器即所谓的C/S模式、文件/服务型、三层的B/S和多层分布的形式。
这种技术是www技术和数据库技术相结合的结果,是未来数据库发展的主要方向。
B/S模式的主要结构如图2所示。
图2 B/S模式结构示意图
5.系统成本的分析
我们知道RFID系统主要是由标签、天线和阅读器构成的,所以它的主要硬件成本也是由这三部分构成,这主要是从RFID系统的市场需求来看的。对于物流管理行业来说,这三部分也是主要的硬件投资方式。虽然目前RFID系统的成本略高,但是它带给我们的优点远远胜过了糨的这个不足。
五、系统的总体设计研究
1.基于RFID的物流管理系统的总体目标
物流信息系统主要解决的问题是:(1)缩短从接受订货到发货的时间;(2)库存适量化(压缩库存并防止脱销);(3)提高搬运作业效率;(4)提高运输效率;(5)使接受订货和发出订货更为省力;(6)提高接受订货和发出订货精度;(7)防止发货配送出现差错;(8)调整需求和供给回答信息咨询等。一个好的完善的物流信息管理系统会很好地解决上述的问题。我们最终的目的都是为了提高服务水平并且降低物流运输的总成本。
2.系统硬件产品介绍
本系统设计的是一个基于RFID硬件产品已有的物流管理系统,所以首先对RFID不同用途的读写设备和它们的应用场合作了一下简单的介绍,例如,下面这款电子标签。
本系统选用的电子标签是T12048,这款电子标签是TI公司新出的一款粘贴式的电子标签。如图3所示。
图3 电子标签
3.流程分析
(1)物流公司工作的流程分析。每个服务行业的宗旨都是客户至上。对于物流公司来说,也是这样。物流公司的终极目的就是让客户的邮件及时准确并且完整地到达目的地,而且要确保邮件在终点是有顾客签收的。图4所示的是一个顾客返送邮件到收件人的全过程。
图4 物流公司工作的流程图
(2)基于RFID技术的系统流程分析。从图4,我们可以明显发现,物流公司在收件装车运输这些过程中,是很容易发生邮件的错装和丢失的现象的。这样就会造成工作量的增加,会在很大程度上降低物流工作的效率,这样反而会增加物流运输中的成本。
RFID技术应用到物流管理行业中可以避免这些问题的发生,提高了物流运输的效率,从成本上得到节省,也就提高了整个物流公司的效益。如图5所示的是应用了RFID技术的物流公司的工作流程图。
图5 基于RFID的系统流程图
4.软件平台和功能设计
JavaEE开发平台目前被广泛应用在各种各样的信息化平台的开发中。在目前实际应用的JavaEE开发平台中,它主要由两部分构成:第一种是以Spring,Hibernate两个框架为基础核心来构建的,这种类型的应用一般都不要应用服务器的支持,一般在Jetty,Tomcat等Web服务器上就可以很好的运行,这类JavaEE应用被称为轻量级的JavaEE应用;另一种类型的JavaEE则以EJB3.0为核心来构建,这种类型的应用需要EJB容器支持,一般情况是需要在JBoss,WebLogic,WebSphere服务器中来运行,这类JavaEE应用是sun公司官方推荐的JavaEE平台,所以它一般情况下称为重量级的JavaEE应用。
5.RFID物流管理系统的设计原则
首先,要确保系统具有一定的先进性。这里所说的先进性主要指的是RFID技术所特有的优点。包括它硬件和软件上的优点。利用这些优点可以提高物流管理系统的运行质量。其次,是RFID系统的安全性和可靠性。这里指的是要确保寄件人寄出邮件信息的安全性。邮件属于寄件人、客户的财产,保证客户财产的安全,是物流公司的首要职责。所以安全性和可靠性是很重要的。如果公司没有对安全性和可靠性做出一定的保护,那么出现问题后不仅是客户的财产丢失,更大的损失是物流公司,公司失去了在客户心中的信誉。这种损失有时是无法弥补的。最后是系统通用性和扩展性的设计。通用性和扩展性是各个环节的枢纽,相当于是系统之间的接口。如果企业之间的系统不具通用性,合作起来就会有很多的问题。所以通用性的提高,可以加强企业和企业之间的合作和沟通关系。
6.系统模块设计
本设计中的管理系统软件主要由8个模块构成:系统的设置模块、运单的管理模块、专线管理模块、车辆的管理模块、办公环境管理模块、报价管理模块、客户资料管理模块、射频卡片管理模块。
六、总结与展望
1.总结。本文设计是基于RFID技术的物流信息管理系统。硬件设备包括电子标签和阅读器设备。软件部分主要是由web服务器和基于JavaEE和SQL Server软件平台来实现的管理系统。本系统的最大的创新点是:将RFID技术与物流管理系统相结合。这个创意的最大优点是增强了企业和企业之间的合作关系,确保货物运输过程中的准确性和安全性,降低了物流行业的运输和管理成本,不仅给客户提供了良好的服务,而且还在很大程度上提高了物流行业的经济效益。
2.展望。目前中国的RFID技术还处于刚刚起步的状态,RFID技术的应用还不够完善,RFID技术的物流管理系统的成本较高,造成了RFID技术物流管理系统普及的困难。条形码技术还会在很长一段时间内占据着识别技术的主要市场份额。但是RFID技术作为一项新技术,具有巨大的发展空间和非常广阔的前景。由于时间和实验的条件有限,本文的设计还存在着很多不足的地方,还有很多物流管理系统的方面没有涉及到,需要在今后对此系统进行不断的完善。主要包括:
一是可以将GPS模块应用导系统中。GPS目前已经在很多国家中被使用,但在中国还是很少使用的。利用GPS的定位系统,我们可以对丢失的邮件进行定位,然后搜查。 这样可以大大地减少不必要的损失,提高系统的安全性。
二是物流管理手机平台的应用。随着技术的发展,目前有很多系统都支持手机平台。时代的需求,人人都有手机,手机成了必备品,所以把物流管理系统应用在手机平台,这样方便客户对物流行业运输的需求。提高了管理和查询的效率。