语言教学与研究

LANGUAGE TEACHING AND LINGUISTIC STUDIES

北京大学现代汉语实词句法语义功能信息词典

 

袁毓林主持

北京大学中文系/中国语言学研究中心/计算语言学教育部重点实验室

 

 

    由袁毓林教授主持研制的《北京大学现代汉语实词句法语义功能信息词典》,已经初步完成。下面简单介绍该词典内容功能和组织结构:

 

    《北京大学现代汉语实词句法语义功能信息词典》(简称《实词信息词典》)是一个电子化的语言知识资源,知识内容主要是现代汉语常用形容词、动词和名词的句法功能、语义角色及其组配方式、主要句型及其典型例句;并且,配备完善与方便的检索系统。《实词信息词典》主要是为汉语自动语义分析和文本生成、汉语国际教育与研究而研制的,可以为汉语的理论研究、教学应用和信息处理工程提供语言知识资源。

 

    《实词信息词典》主要根据袁毓林教授30多年来,在认知科学的背景上,对于现代汉语的下列研究成果:(1)汉语词类的模糊划分与隶属度计算,(2)汉语配价语法研究、汉语动词与形容词的论元结构研究,(3)汉语生成词库论研究、汉语名词的物性结构研究。该词典特别重视词语之间的搭配关系和选择限制,通过大量的例子来展示目标词的意义和用法,并且提供目标词的搭配习惯和基本句型。这样做的一个理由是,正如英国语言学家J. R. Firth(1890-1960)所说:You shall know a word by the company it keeps.(欲知其词,先观其伴)Each word when used in a new context is a new word.(每一个单词出现在不同的上下文中就是一个新的单词)。的确,要了解一个词的意义和用法,最好的办法莫过于观察它跟什么样的词语搭配。并且,同一个词在不同的语境中不同程度的意义变化,也只能通过它的搭配环境来显示。这直接为汉语的国际教学提供了汉语常用实词的情境意义和搭配组合的范例,也为基于词语共现(co-occurrence)的机器学习方法,提供了一种精炼的语料库和训练样本。

 

    《实词信息词典》分为下面三个既相对独立、又相互链接的子系统:

    1. 《汉语形容词句法语义功能信息词典暨检索系统》,收入常用形容词3千多个,4千多个义项条目;信息内容包括:词条、拼音、次类(形容词、状态词)、释义(包括:语体色彩、同义词和反义词及其链接关系等)、语义角色集合及其定义、由目标形容词和其论旨角色组配成的句法格式和相应例句、各种主要的语法功能及其词类隶属度,等等。

    2. 《汉语动词句法语义功能信息词典暨检索系统》,收入常用动词6千多个,8千来个义项条目;信息内容包括:词条、拼音、次类(8种动词小类)、释义(包括:语体色彩、同义词和反义词及其链接关系等)、语义角色集合及其定义、由目标动词和其论旨角色组配成的句法格式和相应例句、各种主要的语法功能及其词类隶属度,等等。另外5千多个次常用动词也即将加入。

    3. 《汉语名词句法语义功能信息词典暨检索系统》,收入常用名词1万多个,1.2万来个义项条目;信息内容包括:词条、拼音、释义(包括:语体色彩、同义词和反义词及其链接关系等)、物性角色集合及其词例(及其跟相关动词和形容词的链接关系等)、由目标名词和其物性角色组配成的句法格式和相应例句、各种主要的语法功能及其词类隶属度,等等。另外1万多个次常用名词也即将加入。

检索示例1

检索示例2

检索示例3

更多信息,欢迎垂询!

电子邮箱:yuanyl@pku.edu.cn