您好,欢迎来到星星旅游。
搜索
您的当前位置:首页俄罗斯词汇语义知识库——《词典人》语言工程

俄罗斯词汇语义知识库——《词典人》语言工程

来源:星星旅游
2012年O8月 第31卷第3期 中国俄语教学 pyccK ̄H3bIK B KI,'ITAE ABrycr 2012r. T.31№3 俄罗斯词汇语义知识库—— 词典人 语言工程 首都师范大学蔡 晖 提要:词汇语义知识库是自然语言信息处理领域中的核心工程之一。本文主要解读和分析俄罗斯词汇语义知识 库《词典人》语言工程对词汇语义独到的处理方式,从研究背景、建构原则、语义理念、释义方法和词条区域等方面论述 了该项目在建立语言形式化模型过程中的研究思路和方法。 关键词:词汇语义知识库、《词典人》语言工程、词义表征、构建原则 [中图分类号]H35 [文献标识码]A [文章编号]1oo2—551C(2012)03—0055—07 Russnet,俄罗斯科学院的《词典人》等语言工程具有 0.问题的缘起 词汇语义知识库是语言知识库的一个重要组成 部分,一般是指面向自然语言处理的、以表达一种或 自己的研究传统和技术实现特色,在西方享有盛誉, 但国内还鲜有人知。本文重点考查俄罗斯《词典人》 语言工程对词汇语义独到的处理方式,以期为我国相 关领域的研究提供新的思路。 1.《词典人》语言工程的研究背景 多种语言词汇语义知识为目的的词汇资源项目。词 汇语义知识库的研发主要围绕着语义知识的获取、表 示和管理三方面展开的,三方面的成败得失离不开基 础理论中对语义的合理描写和处理。建立语言的形 2O世纪90年代,俄罗斯科学院下属的全俄科学 式化模型,即如何将语言学知识形式化,使计算机能 够理解和应用,是自然语言处理的核心问题。多年 来,国内外许多研究机构在这方面做了大量的研究, 在自然语言处理领域已开发多个大型语义知识库,比 较知名的有美国普林斯顿大学研制的WordNet,微 软公司研制的MindNet,美国加州大学研制的Fram— eNet,英国剑桥大学和爱丁堡大学研制的LLD,在国 内则有董振东等研制的How-Net,北京大学的中文 概念辞书(CCD)项目等,而俄罗斯圣彼得堡大学的图 佐夫语义词典、莫斯科大学的多语词汇语义知识库 技术信息研究院提交的在词汇语义知识库(JIeKCH ̄e- CK ̄Cl 6aaa ̄aHHbtX)基础上建立计算机语义词典的设 想通过了国家立项,项目名称为. ̄eKcnKorpa@,(译名 我们暂拟为“词典人”),作为项目主要负责人,E B. I-[a ̄yqeaa主张以词义知识库的形式来进行语义词典 的编撰,目的是把语言研究和计算机运用结合起来, 使其成为辅助语言研究和语言应用(尤其是词典学和 计算机语言处理)的有效:亡具。在项目的研发过程 中,得到了n皿.Anpecs:a和H.且.ApyT ̄OHOBa等 权威学者的指导。《词典人》语言工程以Anpec ̄H和 *本文系2010年教育部人文社会科学研究规划基金项目《俄罗斯词汇语料库之词义的动态模式及其借鉴价值》(项目号为 1OYJA74OO05)、北京市2o12年人才强教中青年骨干人才培养计划项目《俄语词汇语义的参数化研究》(项目号为 PHR201208061)阶段性研究成果。 55 2012生 中国俄语教学 第3期 H.A.Me ̄buyK“意思 文本”语言模式为基础,改变 了过去就词注词的传统套路,转而探讨词位题元结构 的转换同意义变化之间的联系,即词位的表层语法特 征决定于深层语义特征,它反映了包括俄罗斯在内的 世界词汇学和词典学的研究走向。 《词典人》语言工程浮出水面最初与C.A.KpbI— JIOB在1990年提出的建立词汇语义信息库的构想有 关,他倡议建立一个俄语词典工程,其中每个词语或 意义都对应于它们各自的编目,这一思想引起学界广 泛关注,并逐渐演变为建立一个可以成为词典编纂工 具的词汇语义知识库的设想。 参与《词典人》语言工程的学者有r.I,I.KycToma, E.B.Ⅱa皿yqe髓,E.B.PaxnaHna,P.H.Poa ̄na,C. IO.CeMeHOBa,M.B.(I):HJIHIIeHKO,H.M. ̄IKySOBa, T.E. ̄_HKO等俄罗斯当代语言学研究专家。 为了建立语言的形式化模型,必须建立合理而有 效的词汇处理方式,俄罗斯学者很快意识到词汇释义 的重要性,对词义表征形式化而言重要的是揭示词汇 的语言运作特征体现出的语义类别。这样,就必须深 入到语义内部,并最终定位在释义方式上。 与传统词典不同的是,《词典人》词汇语义知识库 的特点是采用统一的方法对不同词语进行释义,这是 迈向词义表征形式化、系统化的第一步。《词典人》语 言工程仍把动词作为研究的重点。尤为重要的是,俄 罗斯学者揭示了Vendle.Z(1967)的动词分类在词汇 释义方面所发挥的重要作用(Vendle划分出状态,活 动,行为,瞬间行为等类别)并对其进行完善。分类范 畴不仅能够决定动词体的特征(这点为学界所熟知), 而且它们还能够决定动词的释义方式。因此,《词典 人》工程不仅被视为理论语义研究的工具,同时也是 向词义形式化研究迈出的重要一步。 2.《词典人》语言工程的构建原则 《词典人》系统是一个以信息库形式呈现的语义 词典,主要用于对俄语动词的处理。传统词典给出的 是词语孤立的词义清单,而现代语义学基本上研究的 也是孤立的词义,忽视了词义的内在统一。《词典人》 语言工程将恢复词义的内在统一视为其基本诉求,其 构建原则是:1)词义的表征应该能够解释其相应的语 言运作特征;2)建立不同类别词语共同的词义等级, 甚至是词义聚合体,揭示词义之间的内在联系;3)为 实现词义的形式化表征,《词典人》工程不仅仅是一部 56 词典,更是一个信息库,而形式化的基本工具是参数 和语义要素。 词语的语言运作是指词语的搭配能力,具有某种 语法形式以及这些形式的意义、句子是否有句重音 等,这些特征很大程度上取决于词义。例如未完成体 动词TepeTb(擦拭)有当下持续意义,而Tep ̄Tb(丢失) 没有;TepeTb的命令式TpHTe!表示正常的使动意义, 而来自Tep ̄Tb的命令式Tep ̄fiTe!就不存在,原因在 于它们的分类范畴不同:TepeTb属行为范畴,noTep ̄a 属事变范畴,表示人发生了什么事情。 语言学界意识到词汇意义对词汇的语言运作特 征具有决定作用后,接下来遇到的问题是,通常词语 表示不止一个意义,而是若干个意义,不同意义间如 何获得内在的联系呢?俄罗斯学者逐步发现词义变 化与语义要素之间存在着某种具有参数性质的对应 关系,同一个词语的不同意义的区别往往是某一个参 数(或要素),例如3aCTHSIaTB cToJI CKaTepTb ̄O(给桌子 铺上桌布)表示行为,而cJIe3bI 3aCTHJlaIOT rJia3a(泪水 蒙住了眼睛)表示状态,范畴发生了变化;Spe6oBa ̄b (要求)一般做言说动词,但在MamHHa Tpe6yeT peMOH— Ta(汽车该修了)中转换为情态类动词,它的主题类别 发生了变化。 揭示出影响动词语义变化的四类语义参数(动词 的分类范畴,主题类别和角色配位,参项/题元的分类 类别)是《词典人》语言工程研发取得的重要成果之 一,这些参数一方面是词义的重要组成部分,另一方 面能够区分不同的词义,这种双重作用从共时层面反 映并揭示出意义转换的系统性,具有同一参数的词语 往往会发生相似的意义变化,词义之间的有机联系因 而得以建立。(蔡晖2009:82—86) 检验各种有关词语语义特征与其表层特征联系 的预测是否正确,这是从《词典人》语言工程建构原则 出发产生的另一个重要用途。例如,Wierzbicka A. (1967:2240)曾认为完成体动词包含语义要素“新状 态出现”,通过词汇语义知识库能够检验这一思想是 否正确,答案是否定的,试比较IIpoH30 ̄ITH(发生),I10一 CBeTHTB(照明),3alIIcHTHTB(遮蔽),这些动词表示旧状 态结束,但不表示新状态的开始。Ylaam 3alLI,HTttJI Me— HSt OT皿oⅨ且兄.(雨衣遮挡了雨。意思是:雨在没停时一 直在挡着) 3.《词典人》语言工程的语义理念 现代语义学取得相对共识的有下述思想:语义上 蔡晖俄罗斯词汇语义知识库——《词典人》语言工程 不单一的词语意义并不能像语义学先前认为的那样, 可以简单地划分为一些要素,但这些要素却可以构成 一个特定的结构,并表现出不同方面的特征:语义特 征本身(意义的语义类型及其与非语言现实之问的关 系),句法特征(配价,题元及其句法表现方式)和交际 特征。《词典人》语言工程将词位信息按照上述不同 的特征加以分解,其中每个特征都表示确定的一组意 义。因此,词典使用者可以根据该系统提供的信息实 现各种逻辑深度的查询。 语义特征方面,动词的意义直观地反映了情景 (事件)并与某个分类范畴相对应:行为、过程、状态和 事变。每一个分类范畴都有特定的一组要素和释义 结构,特定的一组参项(语义题元)及其分类类别。 句法特征方面,角色配位是词位的另一个基本特 征,它具有语义、句法和交际方面的特点。角色配位 一般指题元语义角色与其句法地位之间的关系。动 词的两个意义可以表示带有同一组参项的同一个情 景,区别仅在于角色配位(参项的句法表达方式)。试 比较,oqHCTHTb rpa3b C 6OTHHOK(把泥从皮鞋上擦净) O ̄HCTHTb 6OTHHKH OT rp93H(擦净皮鞋上的泥)。从 交际角度而言,角色配位又可以视为情景的边缘参项 向句子的核心句法位的迁移机制。 从交际的角度出发,《词典人》工程在释义中还区 分出预设,陈说和蕴涵区域,从另一个侧面反映了该 语言工程独到的词义处理方式,它把动词在具体使用 过程中有可能出现的语义要素纳入到词汇释义中,颠 覆了传统词典对词义的静态处理方式。 预设是意义中不受否定的部分,也就是无论是在 肯定句中,还是在带有同一谓词的否定句中,都是不 发生变化的意义要素。例如:OH BblZIH.r.I B0且v H3 CTa— KaHa(他把杯子里的水倒了出来)的预设是“杯子里曾 有水”;On He BblJIHJI BoⅡV H3 CTaKaHa(他没有倒出杯子 里的水)的预设还是“杯子里曾有水”。 陈说是意义中受到否定的基本要素,例如,X BBI一 .TIHJI Bo且y H3 CTaKaHa的陈说是“X以一定的方式作用 于水并使其位置发生了变化”;否定句的陈说是“X并 没有作用于水并使其位置发生变化”。 蕴涵区域包含推涵(cae ̄CTBHe)、背景(∞H)和含 义(i4Ml-iattKaTypa),这些语义要素位于“弱交际位阶”: 背景是“弱化的”预设,而含义是“弱化的”蕴涵。带有 这些标注的语义要素是非必备要素,与之相应的事态 并不直接包含在动词的情景组成中。然而,它们又与 情景联系密切,同样会对词义产生影响。 推涵是来自肯定句的意思要素(来自否定句就得 到相反的意思)。上例中OH BBIJIHJI Bo皿y H3 CTaKaHa 蕴涵“杯子里没水了”,而OH He BblJIHJI BO且y H3 CTaKa— Ha蕴涵“水还在杯子里”。 背景要素(如同预设要素)位于“初始状态呈现” 区域中。背景活动( H0BaH ̄eHTeabHOCTb)和背景使 役((IX)HOBaYI Kay3a ̄Ha)是背景语义要素的典型例子。 例如H髓H pa36Ha qamKy(伊万打碎了茶杯)规定 了主体在动词描述的事件发生的时刻实施了某种行 为,例如,他可能路过,不小心碰到了茶杯;他可能拿 着茶杯不小心掉了,结果是茶杯掉下来碎了,等等。 造成这种意外后果的主体活动的具体内容当然不可 能包含在动词pa36nwb(打碎《 无意问>)的释义中。然 而,语义要素本身“主体实施: 某种行为”应当包含在 释义当中,它也因此位于背景位阶。 背景要素的另一个例子是背景使役。任何状态 的变化都出于一定的原因,尽管并不是所有状态变化 动词都是使役性的。例如:JIy)K ̄6bICTpO BblCOXJIH (水洼很快就干涸了),TpaBa nomyxaa(草干枯了),这 里动词并不具有使役性质。但是,如果说话人知道发 生变化的原因并且该原因对他而言很重要,那么这些 原因会借助于动词的副题元得以显现,例如:J'Iyz ̄ 6bICTpO BbICOXJIH Ha COaHI ̄e(Zk洼很快被晒干了);Tpa— Ba nomyxaa OT)KapbI(草因为炎热干枯了)。从语义 上,动词与相应状语的搭配能力可以通过释义得到解 释并预测到。在该例中,这种搭配能力是以释义中包 含的背景使役为前提的。而其他变化类动词没有包 含这种语义要素,也就不具备该要素规定的搭配能 力。例如,表示自然规律的变化类动词不包含背景使 役要素,不能说:* J1oKH co ̄peaH OT OCeHtt/OT LKa— pbI,*CTeMHeJIO OT Be ̄epa,但可以说H3-3a HiapbIⅡ6一 .IIOKH co3pea ̄paHBme BpeMeHH(由于天气炎热,苹果提 早熟了),这是因为位于原因状语辖域的不是动词,而 是时间状语paHbme BpeMeHH. 含义也不是必备的语义要素,而只是主要情景中 可能的推涵。含义和一般推涵一样都位于“结果”区 域。例如,动词OTpe3aTb(切:FF)的含义是“主体(或者 其他人)掌控结果”;动词pa ̄6gTb(无意间打碎)的含义 是“给客体或者其他人带来损失”;pa36HTb的第二层 含义是“主体要为造成的损失负责”。当然,所有这些 语义要素对于动词OTpe3aTb和pa36 ̄Tb来说都不是必 备的。然而,《词典人》语言:[程认为把它们纳入动词 的释义中的低位阶却是完全正确的,因为完整的语义 57 2012丘 中国俄语教学 第3期 描写不仅能够预测动词的题元,而且还能够预测句子 的语义一句法结构中不太必需的要素,例如,neTⅡ pa36HJ]MOIl:) ̄IIO6HMyIO qamKy( ̄佳打碎了 的茶杯) 一程正在客体里进行);“o6五eKTⅡepeMeu工aeTC只”(客体变 动了位置)等等。释义格式化的实现方式是用意义参 数来表征它的每一个要素,这些意义参数包括:活动, 结果,使役,使役者,过程,界限,初始状态,新状态,呈 现等等。从动词语义角度来说,这些参数是动词语义 中的MOm(物主代词表明受损失主体),1-IeT ̄l oTpe3aJI ce6e KyCOK TOpTa(别佳给自己切了块蛋糕)中的ceSe (补语ceOe表明了受益主体)。在oTpeaaTb,HOCTe— 分解后的语义要素类型,相应的也是动词情景的某个 侧面。 JIHTb,HaJIHTb等动词中,正是“主体掌控结果”这一含 义要素决定补语ce6e与这些动词搭配的可能性,并能 够解释补语ce6e与其他动词搭配的不可能性,因为其 因此,《词典人》语言信息工程的释义呈现为有序 的语义要素集合,以意义参数的形式表征出来。释义 他动词释义中不包含这种含义。试比较:1-[eT ̄t OTpe一 3aJi ce6e TOpTa( ̄I]佳给自己切了块蛋糕);r[eT ̄i HOCTe— JIHJI ce6e rlocTenb( ̄r]佳给自己铺床);1-IeT ̄HaJIHJI ceSe aIo(别佳给自己倒了杯茶);但是在下面的句子中ce一 6e不能跟这些动词搭配:*1-[eT ̄I 3a6H, ̄coSe FBO3) ̄b;* YIeT ̄3a1]paBHJi ce6e HOCTeJIb;*1-[eT ̄i noca2 ̄Hn ceSeⅡBe— TOK. 如此一来,行为动词共同的释义结构表现为:(黑 体字为释义中使用的意义参数) On BBI3IH ̄Bo皿y H3 CT ̄tKaHa.(他倒出了杯子里的 水) 预设:在1一时刻杯子里曾经有水 陈说:在2一时刻施事者发出行为 同时作用于杯子和水 导致水的位置发生迁移的过程 结果水从杯子里转移出去了 蕴涵:在3一时刻杯子里没有水一杯子是空的 4.《词典人》语言工程的释义方法 《词典人》语言工程对词汇的释义是以统一的释 义格式(qbopMaT TOJIKOBaHHY1)进行的,动词的释义格式 由它所属的分类范畴预先决定。动词所有重要的语 义特征,包括部分体的意义聚合体,格框架以及其他 的一些特征都以某种方式与其范畴属性有关并最终 由它预先决定。每个范畴都有特定的释义格式,相应 地,具有相同释义格式的动词属于同一分类范畴(或 范畴亚类)。 将释义格式化的前提是把释义分解为单个的、句 法上相互的要素,它与Wierzbicka(1988:36)的 释义方式接近,又与以“意思一文本”模式为基础的句 法上紧密联系的释义格式相对立。这些要素具有独 立的述谓结构,例如以下语义要素:“Cy eKT ̄efiCT— ByeT (主体正在活动); ̄PIpeT npot ̄ecc B O(YbeKTe ̄(过 58 格式由释义所必需的意义参数给定。例如,行为范畴 必须包含“活动”参数,与主体目的相符的“结果”参 数;而事变范畴必须包含“初始状态”和“新状态”。 上述范畴参数(格式构成参数)对于动词分类范 畴的释义来说是必备参数,这些参数的意义不可能为 零位,例如,缺少活动和结果的情景不能称之为行为, 主体或者客体状态没有发生变化的情景不能称为事 变,等等。还有非必备参数参与释义构成,它们相对 于该范畴的某些词而言取零位意义,非必备参数可以 不包含在词汇释义中。例如,“使役”和“过程”参数对 于某些行为动词的亚类而言是非必备参数。 例如,未完成体意动动词的释义不包含“使役”和 “过程”参数。例如 ̄OBHTB(捕捉)表示“为达到某个目 的而付出努力”,也就是说,事先并不能确定行为是否 能达到结果,这一点使意动动词区别于一般行为动 词,如npnummTb nyroBm ̄y(缝扣子)或者BapnTb cyn (煮汤)。 “使役”参数不包含在去使役化动词等表事变范 畴的释义中,如BbI3, ̄OpoBeTb(康复),3aCHyTb(睡着), 3a6blTb(忘记)。对于许多动词的释义格式而言,“初始 状态呈现”(aKcⅡ03HuHⅡ)也是非必备的。 释义包含两类语义要素:元语言要素(MeTaKOMIIO— HeHTbI)和分类要素(KBaⅡM枷KaTopbI)。元语言要素包 含的谓词就是释义参数的名称,补充的只是相应的论 元,例如:((Cy6])eKT ̄eifCTByeT>)(主体在行动), ̄HXeT npo ̄ecc:B o KTe/B Cy62 ̄eKTe”(在主体/客体中的 过程正在进行),“o eKT/Cy6.beKT Hpe ̄blBaeT B COCTO— HHHH) ̄(主体/客体处于某种状态)等等。在词位的释 义中,元语言要素通常伴随着揭示活动,过程,状态等 具体内容的分类要素。例如,分类要素可以确定客体 经历的具体过程类型:“o eKT nepeMeⅡ工aeT ”(客体 移动位置),<(O6%eKT ̄e0popMHpyeTca,(客体变形), aO ̄%eKT HarpeBaeTcg ̄(客体变热),“co且ep)KaHHe keg— TeJIbHOCTH Cy6"beKTa”(主体的活动内容),“yqacTHe 蔡晖俄罗斯词汇语义知识库——《词典人》语言工程 I/IHcTpyMeHTa> ̄(工具的参与)等等。 《词典人》语言工程建立的这种词位释义方式并 不要求穷尽词语所有的意义:它的释义反映的应该是 具有复现性质的语义对立,也就是只包含把一个词与 另一个词联合起来的语义对立。而对于某些词位特 有的语义差别,也就是不决定“类别构成”的要素并不 反映在词位的释义中。例如,动词Han伽HHTb(装满) 和3aHO ̄HHTb(占满),npHKaeHTb(粘上)和HaKaeHwb( ̄ 上)基本意义的释义相同,一般来说,它们的词条差别 只体现在意义总和区域(cBo且3Ha ̄eHHfi)。动词CIIH一  ̄HTb(锯掉)和cpy6HTb(砍掉)也有相同的释义方式, 它们的区别仅在于行为方式上,但不显示在动词释义 中。 《词典人》工程用统一的意义结构有助于直观展 示同一个动词不同意义(词位)间的联系。下面是《词 典人》工程给3aropo2r ̄Tt,所做的释义: 3AXOPO ̄I,1.1 3ArOPO ̄,1.2 Pa6oaae 3aropoj ̄j4Jm nO ̄CTy— Menn ̄3ampoz ̄m npoxo ̄; rlbi K 3 ̄m4doMeuIKaM}t ciiec— Bopo ̄cpa3y aampo/maa Becb K0M(工人们用沙袋挡住了通 BxD且B now.(袋子挡住了过 往大楼的去路) 道;耙一下封死了洞口) 分类范畴:一般行为,带空间 分类范畴:使役性事变,带空 客体 间客体 主题类别:拦阻类 主题类别:拦阻类 参项: 参项: X(工人们)一主体一施 Z(袋子):主体=背景使 事一人 役的受事理事物 一集合物质/物 Y(通道)一客体一地点一 Y(通道)一客体一地点一 受事=通道 受事=通道 z(袋子):五格事物一工 具一受事一集合物质/物理事 (w)一话语外=有关人员 物 (w)话语外一有关人员 景使役者X一话语外一背景施事/背 一=情景/人 K0初始情景交待f在观察 K0初始状态f在观察时刻 时刻之前Z没有横在Y上 之前Z没有横在Y上*预 *预设 设 K1 Y曾经的作用是:通畅的 K1 Y曾经的作用是:通畅的 {一存在过} {一存在过) K4活动{在观察时刻x的 K4使役者J在观察时刻发 活动带有目的 生了什么 K5:对Z施加物理作用 Ks 3AFOPOBJITS 1.1 3AFOPO ̄HTb 1.2 K6使役I K4引起K7 * K6使役1 K4引起K8 * 陈说 陈说 K7 Z发生了同步的过程:z 转移至Y上,Z在Y上的数 量增多;导致Y也发生着有 】自 界限的过程,Y不通畅了。 K8.1结果=成果 K8.1效果一新状态 K8.2在观察时刻出现了新 K8.2在观察时刻出现了新 状态:一定数量的z拦截在 状态:Z转移至Y上,成为道 Y上 路障碍物或使其功能受阻。 K9 Y受到阻隔K9这样Y不起作用了:不 : 通畅了{一不存在了) KIO含义:有关人员不能使 K10含义:有关人员不能使 用Y了。 用Y了。 释义说明: 《词典人》语言工程的释义由三部分组成,1)先于 动词表征情景的信息,即初始情景展示(Ko—K3); 2)情景内容本身(K4一K8:,;3)情景完结后出现的结 果和状态(K-9一K_lO),释义的中心部分(K4一K8) 被标上颜色,以高亮度显示. K0行是“初始情景交待”,针对的是行为或事变、 过程的“初始状态”。因为所有这些情景都规定有变 化,K0行记录的是变化前的事态,例如,就行为o BH~ 3aTbⅡoⅢaⅡb而言,初始情景是*<Jloma ̄b 6blaa IIpHBa~ 3aHa ̄(马被拴着);就事变BeTep copBaa manKy C npo~ xo: ̄ero(风把行人的帽子吹掉了)而言,初始状态是  ̄,IiIaIIKa HaXO ̄l,HJIaCb Ha roaoBe Y IIpoxo)KePO>>(帽子戴 在行人的头上)。K-I行记录的是初始情景的补充和 加确信息。 动词释义包含的背景使役信息位于K1一K-3 行。K4行显示的是主体(主语)信息。这是范畴要 素,用于证同动词的分类范畴。 对于行为和活动类动词而言,范畴要素是“C6 且e蠡cTB0BaJI C nbK】”(主体的行为带有目的);对于使 役性事变而言,范畴要素Ji. ̄,(,(npoH3oln,no HeqToa(发生 了什么),即存在情景使役者;对于带有背景使役者的 事变范畴而言,范畴要素是“HOBOe COCTOHHHe>>(新状 态):在观察时刻出现新状态;对于过程范畴而言,范 畴要素是( ̄H,/I,eT npol ̄ecc>>(过程正持续);对于状态范 畴而言,范畴要素是 ̄ilpe6MBaeT B COCTO ̄HHH"(处于某 种状态)。 59 2012生 中国俄语教学 第3期 K5行的信息是对范畴要素的精确和具体化。例 如,对于行为和活动范畴而言,K5记录的是施事者为 达到目的而对客体施加作用的方式。 出。例如,状态类动词没有当下的持续意义(如 3HaTh),而稳定的性质/关系类动词不属于标准的对 应体偶类动词等等(如BeCHTb,CTOHTb)。这里当然也 有一些不是来自语义。例如,动词oqHyTbCJ:i(苏 K6行包含的是“使役”信息(相应地,去使役化动 词这行为空白)。 醒),BCTpeneHyTbC ̄l(抖动;惊醒)没有对应的未完成 体。 从动词的释义中可以确切推导出动词体的特征 是完成体(如HaKSIeHTb)。Wierzbicka A(1967:2240) K7行用于记录与物理作用同步的过程,并且该 过程也是作用的结果,行为动词的大部分亚类都有这 方面的标注,结果(即客体中的变化)不是累积出现, 而是一下出现的情况除外。大部分活动范畴亚类,某 第一次尝试用释义的方式来对体的语义进行描述时 些使役化事变和使役化过程的这方面也有标注。 K.8由两行组成。第一行K8—1标注的是要素 名称:目的一界限(对于未完成体行为范畴而言)或结 果一成果(对于完成体动词行为范畴而言),新状态 (对于事变范畴而言),效果一新状态(对于使役性事 变而言)。 K8—1中的双重名称是赋予那些既有使役性要 素(如活动范畴),又有与其同步的过程要素的动词。 活动范畴有“结果”要素(pe3ydlbTaT),它导致的过程有 “成果”要素(HTOF)。最终的状态就活动而言是结果, 就过程而言是成果,因此,它获得了双重名称“结果一 成果”。未完成体动词中,与活动对应的是“目的”,与 过程(如果它是有界限的)对应的是“界限”,所以 K8—1另一个双重名称是“目的一界限”。为了区别 于能动性作用的结果,对于非能动性使役者作用的结 果在词汇语义信息库中称为“效果”(劬 KT),这是事 变的结果,行为过程的成果对应于事变和完成体过程 的“新状态”。 K8—2记录的是K8中的信息。 K9和K1O行用于记录词汇的蕴涵要素一一推涵 和含义。 释义中还用*号标注了要素的交际位阶,预设和 陈说。 5.《词典人》语言工程的词条区域间的内在关系 《词典人》语言工程中,词条包括动词词位的基本 参数信息和简要释义,它包含的区域有:词位、说明、 补充、分类范畴、主题类别、体特征、对应体偶、参项、 释义。 原则上讲,词条所有区域中的信息都应该能够从 释义区域中的信息预测出。如上所述,分类范畴就可 以从释义格式中推导出来;是否具有对应体偶和可能 的一组体的意义,在许多情况下也可以从释义中得 6O 指出,体的释义就是该体动词的词汇释义,理由是它 们包含的结构要素复现在所有表示相同体意义的词 位中。 词汇意义与体意义不可分离的原则同样体现在 词汇语义知识库中,准确地说应该是词汇意义与时一 体意义不可分离,未完成体动词的释义是用现在时, 而完成体动词的释义是用过去时。 题元区域的信息只有一部分可以由释义预测出, 另一部分包含了的语义和交际信息。每个题元 都具备以下三个特征。1)句法地位,也就是表层格, 包括做主语的主体,做直接补语的客体和边缘题元 (间接补语格的形式和不确定的状语);2)语义角色, 也就是Fillmore所说的深层格,包括施事者,受事者, 空间等角色。3)分类类别,包括“人”,“物质实体”, “物质”,“数字参数”,“情景”等。 一般动词的受事者就是它的句法客体(也就是通 过第四格来表示),同时进人核心句法位(即前景)。 然而,还存在带有前景转换(c且BHHyTa兄IIepcIIeKTHBa) 的动词,例如覆盖类动词HS_HOJIH ̄ITb,3aBaJIHBaTb,这 类动词的受事者用边缘题元表示,而语义上的边缘题 元——空间一一则用直接补语来表达,也就是进人前 景,成为句法上的核心题元。试比较带有正常前景的 动词HanHBaTF(倒满,注满)和覆盖类动词HanoYll-LqTb (装满,倒满)的题元在语义角色与句法地位之间的关 系: HanHBaTb BOJ ̄y B 6accefin HaHOJIH.q,Tb 6accefiH BO- Ⅱ 主体——施事(人) 主体——施事(人) 客体——受事(水) 客体~空间(水池) 边缘一一空间(水池) 边缘——受事(水) 前景的转换会引起这类动词特有的语义增 生一一产生“全部覆盖”语义,试比较我们熟悉的搭配 侈U于: ̄arpy3HTb Kap ̄omxy B MaumHy与3arpy3HTb Ma— mnHy KapTOmKOfi,后者3arpyaHTb用于覆盖类动词,表 蔡晖俄罗斯词汇语义知识库——《词典人》语言工程 示汽车被装满了。(Anpecni ̄1974:279) 题元的三重性质还能够清晰呈现角色配位转换 时题元之问大量出现的有规律的语义关系,例如句法 客体改变自身的分类或角色特征:受事一空间:HO ̄OTb COpH ̄IKH(除草) HoJIoTb rpa ̄Krt(除菜畦),MeCTH cop (扫灰) MeCTH IIOJI(扫地板);受事一结果:Hp0 ̄HTb CTeHy(打穿墙)一ⅡpO6HTb ̄blpy B CTeHe(在墙上打洞); 受事一工具:npHBflaaTb Bep ̄BKy K CTO ̄6y(把绳子拴在 柱子上) ⅡpHB兄3a1 Ⅱ0Ⅲa且b Bep ̄BKOfi K CTOa6y(用绳 子把马拴在柱子上);部分一整体:3aIMHTb pyKaB(缝 补袖子)一3aIIIHTb py6amKy(缝补衬衫),3aKpblTb  ̄Bepb(关门) 3aKpblTb KBapTHpy(关上房间),3acTe— rHyTb MOJIHHIO(拉上拉锁)-'3acTerHyTb KypTKy(系上 夹克),HaCTpOHTb cTpysy(调琴弦)-- ̄HaCTpOHTb r ̄Tapy (调吉他)。 应当强调的是,释义区域的“预测能力”当然不能 表明词条其他区域的冗余性。首先,从释义中并不能 推导出该词位所有重要的词典信息。第二,推导规则 往往太过复杂。《词典人》工程认为,从实用的观点来 看,展示出词位在相应区域的“表层”特征(体特征,角 色特征等)显得更为经济。《词典人》工程所主张的从 一种信息推导出另一种信息的设想暂时还只具有理 论上的可能性。 6.小结 《词典人》语言工程是一项将语言研究与计算机 运用结合起来的尝试。它秉承词汇的表层语法特征 能够从其深层语义特征中得到解释的理念,采用统一 的、参数化的方法对不同词语进行释义,揭示出词义 之间的内在联系,从而将词义表征形式化、系统化的 研究推向了一个新的高度,同时也深化了语言学本体 (特别是多义词)的研究方法。这堪称是《词典人》工 程为计算机语言信息处理领域做出的独到贡献。 注 释 1.国内学者张家骅(2003:124—143)和彭玉海(2000)的研究都曾涉及 过该项目。 参考文献 L1J Anpecm ̄IO.皿JIeKcHqe2Kag ceMaHTHKa(CHHOHHMH'-Ie- CKHe cpe ̄],CTBa sabma)[M]. ,I-[ayKa,1974. [2]KyCTOBa r. ,Ha ̄yqeaa E B C ̄ompu KSK ̄eKCH— qecKayi 6a3a zammlXEJ]//B ̄t,1994,No4,C.96—106. [3]I-h,Ey,m- ̄E R皿lⅡ删Hl王ecKHe M0皿BⅡH B ceMaHTttKe zleKc ̄EM].M。。 ̄[:3bIKH cJIaB珏Hc:Ko矗Ky,nbTypbI,2004. [4]Vendler Z.Linguistics in Philosophy[M].Ithaca, New York:Cornell Univ.Press,1967. E5]Wierzbicka A On the,;emantics of verbal aspect in Polish[A]// To Honour Roman Jacobson[C].The Hague; Paris:Mouton,1967.P.2231—2249. [6]Wierzbicka八The semantics of grammar[M].Ams— terdam,Philadelphia:John Benjamins,1 988. E7]杜桂枝,莫斯科语义学派[J],《中国俄语教学》,2006 年第2期,1—6页。 [8]杜桂枝,莫斯科语义学 ̄tEJ],《中国俄语教学》,2006 年第3期,4—1O页。 [9]杜桂枝,莫斯科语义学派[J],《中国俄语教学》,2006 年第4期,13—18页。 [1O]蔡晖,词义的参数化研究口],《外语学刊》,2009年第 1期,82—86页。 El1]蔡晖,试论参项的分类类别,《中国俄语教学》,2010 年第2期,1—6页。 E12]华劭,《语言经纬》[M],:北京,商务印书馆,2003. [133彭玉海,俄语词汇信息g ̄EJ],《中国俄语教学》,2000 年第2期,16—21页。 [14]姚爱钢,《俄语词汇语义知识库研究》,外国语 学院,硕士学位论文,2006. [15]张家骅等,《俄罗斯当代语义学》[M],北京,商务印 书馆,2003. 收稿日期:2O12一O2—28; 本刊修订稿,2012一O6—28 通讯地址:100089北京西三环北路83号首都师范大学外国语 学院 (责任编辑杜桂枝) 61 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- stra.cn 版权所有 赣ICP备2024042791号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务