当前位置: 东星资源网 > 作文大全 > 节日周记 > 正文

基于语料库的汉英词典研编面临的挑战及对策研究 bcc汉英语料库

时间:2019-01-29 来源:东星资源网 本文已影响 手机版

  摘 要: 语料库作为一种新方法,在词典研编领域得到了普遍的认可。虽然这项技术手段的革新为词典学理论与实践研究提供了新的研究空间,但也提出了新的挑战。语料库词典研编的最大挑战是如何快速有效地梳理语料库提供的庞大的具有语境共现的多义词的义项及释义。系统功能语言学是以实际使用中的语言的功能为研究对象,是对语言的各个系统的研究,这些理论研究为应对这一新的挑战提供了内部条件。实践表明,系统功能语言学对及物系统的研究可以帮助我们快速梳理语料库中的多义词的义项,有助于编者完成具象―抽象―具象的释义过程。
  关键词: 汉英词典; 语料库词典研编; 系统功能语言学
   中图分类号: H06 文献标识码: A 文章编号: 1671-6604(2012)02-0062-05
   近年来,随着计算机应用技术的发展及语言分析工具的增加,语料库在词典编纂与研究领域受到了越来越多研究者的青睐,基于语料库的词典编纂也随之得到了人们的认同。一门新的交叉学科――语料库词典学也就应运而生了。我国词典学界对基于语料库的词典研编基本上持赞同的态度,认为它解决了制约传统词典发展的一些“瓶颈”问题;同时,人们也意识到了语料库词典研编的局限性。
   到目前为止,我国学者对语料库词典学的讨论主要集中在优势与局限的话题范围,讨论基本上停留在经验的层面,缺乏理性的思考。而且,讨论的对象大都是单语词典或外汉词典。随着“汉语热”的升温,汉外词典的质量直接影响着我国民族文化输出的质量。作为一门新兴的交叉学科,语料库词典学有其共性的一面,但不同类型的语料库词典学也存在个性的一面。不同类型的词典由于其读者群不同,编写的目的不同,其研编的思路及所依据的理论也应有所不同。如面对中国英语学习者的汉英词典的研编就不能完全照搬国外的单语或外汉词典研究成果。汉英语料库词典研编所面临的挑战是什么?我们如何应对这些挑战?这些问题还没有引起学者们深入系统的探讨,我们也没有看到这方面的专论。本文拟从语料库词典学的兴起与发展、基于语料库的汉英词典研编所面临的机遇与挑战、应对的策略三个方面来谈谈我们的粗浅认识。
   一、 语料库词典学的兴起与发展
   语料库词典学(Corpus Lexicography)[1]这一术语首次出现在Atkins的著作中。从该词的结构来看,语料库词典学是语料库与词典学的有机结合。语料库是指“用科学的抽样原则进行选材,具有一定的目的性,可以用计算机软件检索的语言电子文本库”[2] 247。由此可见,如今的语料库与传统的词典编纂中所使用的“卡片式”的语料库是存在差别的,那就是计算机应用技术的参与。王馥芳与罗敏莉以是否应用计算机技术为界限,把语料库词典学的发展分为前计算机时代和计算机化时代[3]。前者指计算机应用技术兴起之前的词典编纂所使用的卡片式资料收集时代。
   为了区别于传统词典编纂领域所使用的“卡片式”语料库方法,不同的学者使用了不同的术语。Ooi在其著作中使用的术语是“计算机语料库词典学”(Computer Corpus Lexicography)[4]1-2。Hartmann和James在《词典学词典》中使用的术语是“基于语料库的词典学”(corpus?oriented lexicography)[5]31。我国学者章宜华和雍和明根据词典涉及的媒介和词典语料来源把当代词典学分为计算词典学(computational lexicography)与语料库词典学(corpus lexicography)[6]411-413。前者研究如何利用计算机技术辅助词典学研究和词典编纂;后者是指基于语料库的词典学理论研究和词典编纂的学问。前者侧重于研究如何为辅助词典编纂而设计和开发各种计算工具和方法;后者综合并吸取了计算语言学、计算词典学和语料库语言学的观点和方法,主要致力于基于语料库的词典编纂原则和实践方面的研究。
   以上对语料库词典学概念的分析表明:现代语料库词典学的兴起与发展得益于计算机存储及提取技术的发展,是技术革命的结果,并不仅仅是作为流行语言研究工具的语料库语言学与词典学结合的结果。虽然语料库词典学这一术语首次出现在上个世纪90年代,但真正意义上的语料库词典学兴起于上个世纪80年代初,其标志性事件是Sinclair主持的Cobuild语料库的建立并利用它编写了系列词典。Cobuild系列词典的成功带动了语料库词典学的发展。此外,“牛津系列”词典、“朗文系列”词典和《剑桥国际英语词典》的编写都借助了语料库,取得了丰硕的成果。
  ①详见《外语研究》2006年第2期、《解放军外语学院学报》2006年第3期、《现代外语》2006年第4期的相关文章介绍。语料库与词典编纂结合所取得的成就及社会效益也引起了我国语言学界及词典学界学者的关注。与英语词典的研编相比,汉语词典及汉英词典的研编在理论研究和编纂的技术手段上都较为落后。直到本世纪,我国第一个基于平行语料库的汉英双语词典编纂系统CpsDict才诞生。它是南京国际关系学院李德俊教授在南京大学双语词典中心攻读博士学位时独立开发的①。CpsDict系统的研发标志着我国语料库词典学在技术上迈开了一大步,基本解决了基于语料库的汉英词典编纂的技术问题,填补了我国这方面实践研究的空白。
   二、 基于语料库研编汉英词典所面临的挑战
   顾名思义,语料库词典学是以语料库为手段,以词典学研究为目的的学问,是语料库语言学与词典学的自然联姻。语料库语言学是指以语料库为基础的语言研究与语言分析。由此可见,语料库语言学能为语料库词典学提供借鉴,但能借鉴的主要是语料库的方法、观点以及技术手段。就这一点而言,语料库语言学是语料库词典学的基础。
   语料库词典学有自己的特色。根据李德俊教授的观察,语料库词典学具有以下特色:(1) 语料库不是话语的全部,只是话语全域的缩影;(2) 语料库词典学摒弃了传统词典学给词义定位的本体论观念,取而代之的是根据不同语境获取的用法和意义;(3) 语料库词典学不排斥人工的合理干预[2]43-44。
   技术手段的革新为理论研究提供了新的空间。综观国内外有关语料库词典学的文献,我们发现语料库词典学的研究者们主要从事以下三类工作:(1) 有关语料库词典学的软件开发及语料库建设;(2) 利用语料库编写各类词典;(3) 系统描述基于语料库的词典编纂活动。前两项工作在国内外都有不少学者从事,而最后一项却鲜有学者涉足。
   语料库词典学的兴起使得词典学的研究视角得到了极大的拓展,研究者们把视角转向了实际使用中的语言,为词典学研究提供了新的机遇。语料库词典学虽然解决了制约传统词典发展的一些“瓶颈”问题,如出版及修订周期长、资料的收集与存贮、搭配定义的界定、词频的统计、义项的科学排列及新词的确定难度大、词目收录的滞后性、词义描述的片面性、例证选取上的人工痕迹太强等[7],但也提出了新的挑战,具体表现如下:(1) 既然语料库不是话语的全域,话语入库的条件是什么?入选条件的明晰化至关重要,因为话语的选择在很大程度上决定了词目的选择及其释义与配例的选择。(2) 语料库为我们提供了浩如烟海的文本,挑选什么样的例句才能算得上是科学的?如何才能发挥例证的辅助释义功能?(3) 语料库给我们提供的是实际使用中的语言,语义依附于特定的语境,而且话语的篇幅不一定完全符合词典出版的经济原则,我们如何才能做到既保持了话语的原语境又能使话语的篇幅符合商业要求?这就涉及了重新语境化问题。(4) 汉英语言间的差异给我们界定多义词的义项带来了很大的困难,我们如何利用语料库提供的丰富话语实践来探索汉语多义词义项划分的理论依据?(5) 在平行语料库中,汉英两种语言实现了零距离接触。词典编纂者应该具备怎样的基本素质才能保证汉语不受到英语的干扰,保持汉语言文化的独特性?
   以上这些挑战归根结底还是语言学问题,是技术发展所带来的新问题,单纯依赖技术的进步是无法解决的。语言学与词典学的渊源由来已久。根据Al-Kasimi、魏向清、王馥芳的研究,英语词典编纂史上的每一个创新都与英语语言学理论的发展密不可分,如社会语言学、转换生成语言学、认知语言学、语料库语言学的研究成果都不同程度地促进了词典学的发展与革新,更有甚者促使了新学科分支的诞生,如认知语言学与词典学的联姻诞生了认知词典学[8]1-11,[9],[10]3。以上每一个语言学流派都不同程度地促进了前计算机时代词典学的发展,但却不能完全满足语料库词典学的发展趋势,我们有必要转向新的语言学理论,尤其是以语义研究为目的的语言学理论。据我们考察,还没有学者把系统功能语言学理论系统地应用在词典学的研究中。随着计算机应用技术的发展,语料库作为词典编纂的工具已成必然趋势,语料库词典编纂的理论研究也迫在眉睫。语料库词典学的发展不能单纯依靠技术的进步,技术仅是辅助手段,因此,语料库词典学要得到长足的发展不得不实行技术开发与理论研究并行,否则一方发展的滞后必然影响另一方的发展。
   三、 应对的策略
   如上所述,基于语料库的词典研编有赖于现代语言学理论研究成果的合理应用。系统功能语言学是以汉、英语言结构为基础建立的普通语言学描写模式,既研究语言的使用,也不忽略语言的结构,是“自上而下”的研究模式。以下将从系统功能语言学理论研究视角来考察基于语料库的汉英词典研编的内部条件,并结合具体实例来论证其在汉英词典研编过程中的独特作用。
   (一) 系统功能语言学关照汉英词典研编的内部条件
   系统功能语言学是从欧洲功能主义派生出来的学派, 它吸收了欧洲功能主义理论,发展了一个从实体、形式到语义、情景;从潜在的系统到实际的结构(功能) 的语法理论。系统功能语言学要研究的是“作为社会符号的语言”[11]1-5,采用社会学研究方法从语言的各个层面来讨论语义及语义的体现。这些层面包括语境层和语言层,前者包括文化语境层和情景语境层,两者之间是“示例”关系;后者包括语义层、词汇语法层和音系/字系层,他们之间是“体现”关系。
   语义系统是体现更高层次的体现系统,即体现情景语境的系统。这样我们就可以从情景语境的特征推测出语篇特征。文化语境与语类(genre)有关,情景语境与语域(register)有关。语言的使用是在人类某一活动领域中单个而具体的话语形式(包括口头的和书面的话语)中实现的。每一个单个的表述,无疑是个人的,但使用语言的每一个领域却会形成相对稳定的话语类型,即我们所说的语类(genre)。语域是指语言的功能变体。所谓功能变体,就是因情景语境的变化而产生的语言变化形式。情景语境有三个变量:话语范围、话语基调和话语方式。话语范围指的是交谈的话题以及场地等情景因素。话语基调指的是交际双方的社会角色关系即个人基调和话语活动的目的。话语方式指的是语言活动所采取的媒介或渠道,它可能是口头的,也可能是书面的,或是介于两者之间的。这三个变量分别对应语义系统中的三大元功能系统:概念功能、人际功能、谋篇功能。它们共同作用,制约说话者对词语和语义结构的选择,即任何一个变量的变化都有可能导致语言变体。
   对语类、语域的深度研究为我们构建具有代表性的语料库奠定了基础。既然语料库不是话语的全部,只是话语全域的缩影,我们所建立的语料库理应具有代表性,以最大限度地保证不漏选词目、词义和析取典型例证,为人工的合理干预提供依据。此外,由于系统功能语言学包罗了语言学所涉及的各个领域, 形成了一个庞大的理论体系, 我们除了可以进行从文化语境的意识形态动因分析语篇特征外,还可以进行实体产生的全过程分析,如可以进行主位结构、语气结构、信息结构、及物性结构分析以及词素、词、词组、小句、句子、段落、章节等多结构、多层次、多级阶的分析。这些分析构成了语料库词典研编所需要的知识与技能。
   (二) 及物系统研究对释义的关照
   下面我们以“现已”一词为例,应用系统功能语言学理论中的及物系统来阐述系统功能语言学对语料库词典学研究的价值。及物系统是功能语言学中体现经验功能的一个语义系统,其作用是把人们在现实生活中的所见所闻、所作所为分成若干种“过程”,即将经验通过语法进行范畴化,并指明参与各种过程的“参与者”与“环境成分”。韩礼德认为,人们可以通过及物系统把人类的经验分成六种不同的过程:物质过程、心理过程、关系过程、行为过程、言语过程、存在过程[12]106-143。
   前面我们已提及汉英词典的释义主要是找到英语中的对等表达。问题是并不是所有的汉语词汇单位在英语中都是通过词汇手段实现的,有的是通过语法手段实现的,有的是通过语法与词汇手段共同实现的,如“现已”一词就属于这种情况。通过检索,我们发现了以下带有“现已”一词的话语:(1) 中国的电话普及率现已达到26%。(China?s telephone penetration rate has reached 26 percent.)(2) 温柔体贴的爱丽丝,现已白发苍苍,略微发福。(Gentle Alice has now become gray and heavy. )(3) 结果现已日见明朗。 (The results are becoming clear.)(4) 电脑屏幕上现已出现了第一个匹配的数据。(The screen was already showing the first of the hits now.)(5) 罗斯林教堂现已成为喜欢冒险的猎奇者们朝圣的圣地。(Rosslyn had now become a pilgrimage site for mystery seekers.)(6) 小溪现已变成了奔腾的江河。(The stream has now become a torrent.)
   以上含有“现已”的6个英语对等表达均属于“关系过程”中的归属类关系小句。关系过程指的是反映事物处于何种关系的过程,它又可进一步分为“归属”和“识别”两大类。归属类指某个实体具有哪些属性,或者归于哪种类型。归属类小句有三个共同之处:都含有一个表示“属性”的成分;都含有属性的“载体”;都含有表示关系过程的动词。从以上6个英语小句可以看出,“现已”一词在英语中没有对等的词汇表达,它是通过语法手段(第1、3、4句)或语法手段与词汇手段相结合的方式(第2、5、6句)来实现的。因此我们可以从功能的角度来给“现已”一词释义:表示事物(载体)的属性发生了或正在发生变化,主要通过进行时态或完成时态来实现,有时可以与“already”或者“now”结合共同实现,常与表示“变化”的动词组合,如become、reach、arrive、show等。这种从功能的角度对在英语中找不到对应词的汉语词汇单位的功能性释义有利于培养中国英语学习者的目标语再生成能力。这种释义也符合汉语特性:汉语形式特征自身独立性较弱, 而较多依赖于语言的意义和功能。
  
   针对当前基于语料库的汉英词典研编所面临的挑战,我们认为,理论上应当突破当前汉英词典学界的语言本体观,以语言系统研究为中心,从宏观与微观两个层面来考虑语料库的建立、词目、配例的选择、译义的方法及排序,丰富我国汉英词典研编相关的理论研究,解决语料库汉英词典研编过程中其他语言学流派所不能解决的难题,提高汉英词典编纂质量,推动我国汉英词典编纂实践的发展,使汉英词典满足我国社会政治、经济、文化发展的新要求。在方法上要突破当前词典学界所倚赖的文献法,把实证的研究方法引入词典学研究,以保障语料库汉英词典编纂理论研究的实用性。在汉英词典编纂的目的方面,要一改现存汉英词典重在解码的研究传统,以提高中国英语学习者的编码能力为己任,服务于本民族文化输出,为中国文化输出战略做出应有的贡献。最后,由于词典编纂中的主体因素无处不在[13],涉及词典编纂的各个环节,我们有必要把词典学界一度忽视的词典编纂者的多重身份建构纳入研究视野,这对基于语料库的汉英词典编纂者的培养具有现实意义。
   参考文献:
  [1] Atkins, B. Building a Lexicon: the contribution of lexicography [J]. International Journal of Lexicography,1991(3): 167-204.
  [2] 李德俊.平行语料库与积极型汉英词典的研编[M].上海:上海译文出版社,2008.
  [3] 王馥芳,罗敏莉.语料库词典学的兴起与发展[J].辞书研究,2004(5):45-53.
  [4] Ooi, V. B. Y. Computer Corpus Lexicography[M]. Edinburgh: Edinburgh University Press, 1998.
  [5] Hartmann, R. R. K., James, G. Dictionary of Lexicography[M]. Beijing: Foreign Language Teaching and Research Press, 2000.
  [6] 章宜华,雍和明.当代词典学[M].北京:商务印书馆,2007.
  [7] 王馥芳,马兰梅.语料库词典的局限性[J]. 辞书研究,2003(5):20-28.
  [8] Al?Kasimi, A. M. Linguistics and Bilingual Dictionaries[M]. Leiden: E.J. Brill, 1977.
  [9] 魏向清.英语语言学的发展与英语词典[J].解放军外国语学院学报,1998(1):13-18.
  [10] 王馥芳.当代语言学与词典创新[M].上海:上海辞书出版社,2004.
  [11] Halliday, M. A. K. Language As Social Semiotic[M]. London: Edward Arnold, 1978.
  [12] Halliday, M. A. K. An Introduction to Functional Grammar[M]. 北京:外语教学与研究出版社, 2000.
  [13] 王馥芳,陆谷孙.词典编纂中的“主体因素”[J].外语界,2006(3):74-79.
  (责任编辑 张向凤)
  Corpus?based Chinese?English Lexicography: Opportunity,
  Challenge and Counter?measures
  Zhong Lanfeng, Zhang Lin
  (School of Foreign Languages, Jiangsu University, Zhenjiang 212013, China)
  Abstract: The application of corpora as a new method to dictionary making is now generally approved. The technical innovation brings to dictionary making theory and practice challenges as well as new space. The chief challenge is how to comb through the senses and definitions of the contextualized polysemes quickly and efficiently. This challenge can be met with the help of systemic linguistics for it sets as its main task the function and linguistic system of language in use and studies all the systems within language. Our practice in dictionary making suggests that the study of transitivity system by systemic linguists can help dictionary makers handle sense discrimination and defining process: concretization abstraction concretization.
   Key words: Chinese?English dictionary; corpus?based lexicography; systemic linguistics
  
  收稿日期: 2012-01-15
   基金项目: 国家社会科学基金项目(07BYY038); 江苏大学人才引进项目(10JDG010)
   作者简介: 钟兰凤,副教授、硕士生导师,文学博士,从事系统功能语言学、话语分析、双语词典研编研究; 张 ?,副教授,硕士生导师,文学博士,从事翻译理论研究。

标签:语料库 汉英 词典 面临