美章网 资料文库 多模态京剧术语数据库设计创建范文

多模态京剧术语数据库设计创建范文

本站小编为你精心准备了多模态京剧术语数据库设计创建参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

多模态京剧术语数据库设计创建

京剧术语不仅是知识传播的工具,更是构建话语体系与彰显文化身份的有效路径。京剧术语库的创建研究目前尚属空白领域,本文探讨了京剧术语翻译及京剧术语库的相关研制动态、京剧术语数据库建设研究的科学意义和时代价值、京剧术语库的创建路径及研究方法。大数据模式下多模态京剧术语数据库的创建,不仅可以有效推动京剧艺术的传承与传播,激发京剧艺术焕发出无穷的活力,而且必将会为这一饱含厚重的思想含量、浓郁审美特色的京剧艺术在当代拓展其受众群体发挥着不可或缺的巨大作用。近年来,伴随着中国经济和文化的复兴、综合国力的日渐强盛,中国的国际影响力大幅度提升,全球范围内的“中国热”持续升温,中华优秀传统文化受到前所未有的关注。在一系列重要讲话中强调,中华优秀传统文化是中华民族的突出优势,是我们精神家园中最为深厚的文化软实力。积极向世界阐发中华优秀传统文化,传播中国话语体系,是构建“人类命运共同体”,有力体现中华民族的“软实力”的重要手段之一。以京剧为代表的中国传统戏曲艺术是中华优秀传统文化的重要组成部分,然而在中国声音、中国戏曲向世界传播的过程中,由于缺乏规范的解释和翻译法则,反映戏曲艺术精髓的传统文化特征及思维方式的京剧术语,存在解释不一、译法存在偏误的现象,极大影响了中国声音、中国戏曲传播的质量和效果。可以说,京剧术语是中国戏曲文化艺术长河中的坐标性支点,是一把开启外国人了解中国传统文化的智慧钥匙,京剧术语的理论研究及翻译方法、京剧术语库的创建及建设研究,这些之于京剧未来的国际传播、构建中国话语体系发挥着非同寻常的重要作用。

一、京剧术语翻译及京剧术语库的相关研制动态

京剧作为中华民族传统艺术的瑰宝,虽有着让人赞叹的魅力,仅以流行于梨园内外的一些术语而言,存在着不规范、不统一的现象。我们认为,京剧术语建设研究是一项复杂的系统工程,应包括京剧术语概念的阐释、体系框架的建立、京剧术语翻译的实践,上述概念的确立及其关系的阐释一定程度上制约着具有东方神韵的京剧艺术在艺术世界之林构建中国特有的艺术话语体系。然而与其重要性形成强烈对比,当前学界探讨京剧术语研究的成果比较零落。从专业术语翻译研究角度看,国内术语翻译研究成果主要集中于应用类学科,文学术语翻译研究因其复杂性与学科建制的艰难性,长期饱受冷落(陈智淦、王育烽,2013)①,有关京剧术语英译的研究成果更加零落。据统计1994年至今,国内有关京剧术语翻译研究的论文仅仅5篇,术语研究与翻译成果极其有限,长远来看不利于浸润着深厚的中国民族文化的京剧艺术发声于世界艺术舞台。在大数据时代下,在网络技术突飞猛进的大背景下,计算机科学技术的发展与广泛使用为术语库的建立提供了强大的技术支持,术语研究正转向多元化术语学理论与计算机化的网络术语管理模式(梁爱林,2006)②。乐娟(2011)通过定义语义代码的方式建立京剧专业术语之间的语义联系,并利用双数组算法实现Trie,扩展主流词库,开发了基于Trie树的京剧术语分词词典③。这项研究是借助计算机技术进行京剧术语语义关联的小型词库的建设尝试,虽然与京剧术语库的创建存有一定距离,然而却仿佛一束智慧之光,给孜孜以求的戏曲人提供了借助计算机及大数据模式开启京剧术语库创建研究及术语管理的思路。京剧术语库的创建是京剧术语研究和词典编纂发展的新高度、新阶段。伴随计算机及大数据模式在当今社会各行各业中的广泛应用,博大精深的戏曲艺术传播进入到全新的网络信息化时代,伴随着国际交流的日益频繁及术语学研究的不断进步,世界各国的术语数据库都在不断发展和完善。以宏观的角度来看,大数据是物理世界、信息世界和人类世界的纽带,物理世界通过网络将反应自身特性的数据反映到信息世界中,人类世界凭借界面的交互手段对自己的数据向信息世界进行输入和操作(李洁,2017),因此一个完善的京剧术语数据库不仅应包括海量的术语,还可以实现复杂的检索及查询功能。我们认为,基于大数据背景构建“多模态京剧术语数据库”,不仅可以规范京剧领域术语诸多核心及非核心术语概念,同时可以在一定范围内借助技术手段减少译者的术语翻译工作量,从而有效促进翻译质量的提高,最终实现借助互联网平台和多模态术语库资源面向世界传播中华优秀传统戏曲文化之目的,共同实现推进构建“人类命运共同体”的伟大进程。

二、京剧术语数据库建设研究的科学意义和时代价值

京剧术语库的创建研究一方面可以促使京剧核心术语及非核心术语的表述进一步标准化和规范化,另一方面便于完善对于京剧术语概念的认知,从长远来看有利于深化京剧艺术的持久、深入研究,在传承发展中华优秀民族文化,讴歌伟大时代,共同实现推进构建“人类命运共同体”的伟大进程中,发挥着独特的优势作用。现实意义上,京剧术语不仅是知识传播的工具,更是构建话语体系与彰显文化身份的有效路径。近年来,在党和国家的大力关怀和各项政策的有力扶持下,京剧艺术焕发出前所未有的繁荣兴盛景象。大数据模式下多模态京剧术语数据库的创建,不仅可以有效推动京剧艺术的传承与传播,激发京剧艺术焕发出无穷的活力,而且必将会为这一饱含厚重的思想含量、浓郁审美特色的京剧艺术在当代拓展其受众群体发挥着不可或缺的巨大作用。此外,京剧术语数据库的创建作为京剧艺术研究领域的重要资源建设,可以为京剧领域研究者及京剧爱好者提供大数据模式下海量的数据支撑,同时可以在一定范围内借助技术手段减少译者的术语翻译工作量,从而有效促进翻译质量的提高,最终实现借助互联网平台和多模态术语库资源面向世界传播中华优秀民族文化之目的。

三、京剧术语库的创建路径及研究方法

(一)京剧术语库的创建路径1.京剧术语本体研究。浸润着东方神韵的京剧艺术的形成、发展过程中,渐渐形成了一套适用于自身的语言系统,然而在艺术嬗变发展的过程中,由于缺乏相应的权威认定,大多靠约定俗成来完成,必然带有原始形成的痕迹,造成京剧术语一定程度上存在着概念不清、使用混乱的现象,这势必会影响具有中国国剧之称的京剧在国内甚至国外的传播和研究。做好京剧研究的基础工作,对于京剧的普及和发展具有重要的理论及现实意义。因此,京剧术语概念的阐释、科学分类和整理是基础性工作。京剧术语库的创建可以借助领域知识本体的方法研究京剧领域知识本体,并以此作为顶层设计,构建京剧术语间关系框架,为京剧术语库的动态更新提供基础。可以借助京剧领域专家知识,在已有的传统京剧领域研究的基础上,对所收集到的京剧术语进行质性分析,对术语概念进行科学、准确地阐释,包括京剧术语概念的阐释、京剧术语体系框架的建立以及京剧术语的翻译等。根据京剧术语承载的艺术功能,我们把现有的京剧术语分为行当术语、音乐术语、砌末术语、脸谱术语和服饰术语五大类别,每个类别又进行了进一步的层级划分。以京剧服饰术语为例,借助京剧领域专家知识,我们共计采集了300多条术语,在充分论证的基础上将其划分为大衣箱、二衣箱、三衣箱及盔箱四个类别或等级,每个类别或等级目录下又进行了细化和层级划分。例如,大衣箱下有两个层级,分别为文服和饰物配件;二衣箱也有两个层级:武服和饰物配件;三衣箱划分为衬衣和靴鞋两个层级;盔箱划分为软巾类、硬盔类及盔帽附件三个等级。上述科学构建京剧术语关系的框架工作,是必要的,也是我们展开京剧术语翻译的基础条件,这些京剧术语基础研究工作为砌末术语、音乐术语、行当术语等数据库工作的开展提供科学的研究范式。2.多模态京剧术语库研究。多模态京剧术语库包括术语关系库、术语库、术语资源库三大模块。关系库是京剧术语知识本体的海量数据实体,术语库将所有京剧术语的规范表达、科学释义以及标准译文内容以数据库的形式定义和存储,资源库的建设包括与术语库内京剧术语词条相关的图片、音频、视频等多模态数据。3.京剧术语库建设关键技术研究。京剧术语库的建设涉及机辅翻译、领域术语自动抽取等相关语言信息处理技术,可以借助这一技术方法,开发京剧术语自动识别、提取技术以及机器辅助术语自动翻译技术。未来可期在一定范围内借助语言信息处理技术方法减少译者的京剧术语翻译工作量,进而有效促进京剧领域翻译质量的提高。4.多模态语料加工。多模态语料加工是指把文字、音频和静、动态图像等多符号语料进行集成处理,或经过标注的不同交际渠道同步内容的集合等,用户可以通过多模态方式进行检索、统计等操作的语料库(Kress&VanLeeuwen1996)。京剧术语的音频语料和静、动态图像等多模态语料的加工,可以采用已有的(如ELAN)或自主开发新的加工工具进行处理和标注。对京剧术语进行质性分析,准确地阐释基础上,充分利用互联网技术和数据库技术,拟建设一个包括双语平行语料、音频、图片及视频的、致力于京剧艺术传播与推广的多模态京剧术语库,用以全面发扬深刻浸润着中华优秀民族艺术的京剧文化底蕴及艺术内涵。每一个京剧术语词条配有详尽的中文解释,与之平行的是高质量的京剧术语英语翻译。除开展中英双语语料的录入与校对以外,术语库建设完毕后需要对语料进行日常的管理、维护、升级和补充,用以实现术语库的先进性及动态性。5.京剧术语库的应用研究。近年来互联网技术飞速发展,各行各业都开始和互联网产生了密切联系,这对整个社会的经济发展起到了变革性作用。作为Web2.0背景下互联网应用的结果,“互联网+”的概念应运而生,这不仅仅是一种概念,也代表着一种新兴的经济模式。京剧术语数据库的建设可以和互联网融合为“互联网+京剧术语数据库”全新的研究模式,通过互联网web端、移动端,以及可视化技术成为未来可期的中华优秀民族文化传播的高效迅捷平台,打造成为京剧领域人机交互、人工智能的卓有成效的基础性资源。

(二)京剧术语库的研究方法1.领域知识本体建设方法。知识本体(Ontology)是概念及概念之间关系的规范化描述,这种描述是规范的、明确的、形式化的,可共享的。领域知识本体是针对特定的学科领域,描述某一学科中的概念、概念的属性、概念间的关系以及属性和关系的约束。通过领域知识本体可以将该领域的知识组织起来。构建领域知识本体的方法已经成为一个新的研究热点。本研究可以借助领域知识本体的方法研究京剧领域知识本体,并以此作为顶层设计,构建京剧术语间关系框架,为京剧术语库的动态更新提供基础。2.语言信息处理技术方法。京剧术语库的建设涉及多模态数据采集与分析、机辅翻译、领域术语自动抽取等相关语言信息处理技术。本课题将最新的语言信息处理技术方法应用到京剧术语选择、京剧术语概念阐释、京剧术语翻译、京剧术语库建设和京剧术语库应用等方面,实现京剧术语库建设研究的科学性、动态性、先进性。3.质性研究方法。京剧术语库的创建可以借助京剧领域专家知识,在已有的传统京剧领域研究的基础上,对已经收集到的京剧术语进行质性分析,对术语概念进行科学、准确地阐释,这也是展开京剧术语研究的坚实基础。

四、结束语

京剧术语不仅是知识传播的工具,更是构建话语体系与彰显文化身份的有效路径。大数据模式下多模态京剧术语数据库的创建,不仅可以有效推动京剧艺术的传承与传播,激发京剧艺术焕发出无穷的活力,而且必将会为这一饱含厚重的思想含量、浓郁审美特色的京剧艺术在当代拓展其受众群体发挥着不可或缺的巨大作用。条件允许情况下,我们也可以加强多语种京剧术语数据库技术攻关和软件开发,拓展研究空间,不应局限于单一的文本单模态和汉英两种语言,全方位深化京剧术语翻译研究,实现大数据与京剧艺术新时代的深度融合。

作者:董新颖 单位:中国戏曲学院