|
編輯推薦: |
目前我国计算语言学理论和方法的研究还不能为开发汉语信息处理应用系统提供足够的支持。“得”在现代汉语中是一个使用频率高、意义用法复杂的汉字,“得”的研究在语言学和汉语信息处理方面都是重要的课题。该书从汉语信息处理的角度对语言学的这个重要课题重新展开研究,既具有重要的学术价值,又具有充分的应用价值。
|
內容簡介: |
本书首次以为计算机识别服务为目的,立足于面向计算机的自然语言信息处理,使用大规模真实语料作为研究材料,对现代汉语的“得”字进行包括语体分布特征、左右邻接特征、语法结构及语义关系等在内的全方位的观察与研究,借助形式标记的发掘,实现对不同类型“得”字结构的鉴别,以适应计算机对不同“得”字“理解”的要求。
|
目錄:
|
目录
第一章绪论
第一节问题的提出
第二节相关研究概况
一、 “得”字本体研究概况
二、 汉语信息处理研究概况
第三节研究范围的确定
第四节研究材料的选取
一、 语料的选取
二、 语言知识库的选取
第二章语料的计算机处理和数据统计
第一节语料的计算机处理
一、 真实文本语料库的产生
二、 训练语料的标注及说明
第二节数据统计与分析
一、 Visual Basic.Net技术
二、 数据库的建设
三、 前后接续观察和统计系统
第三章“得”字结构的分布特征
第一节“得”字结构的语体分布
一、 “得”字结构在不同文本中的统计分析
二、 “得”字述补结构在不同语体中的统计分析
第二节“得”字左右邻接特征的分布统计
一、 “得”字左右邻接特征分布
二、 “得”字左右邻接限制特征考察
第三节“得”字的左熵和右熵
一、 “得”字左右熵的计算与分析
二、 “得”字不同接续关系左右熵的计算
第四章“得”字结构的组合特征
第一节“得”字邻接特征描述
一、 “得1”邻接特征描述
二、 “得2”邻接特征描述
三、 “得3”邻接特征描述
四、“得4”邻接特征描述
第二节“得”字左右邻接共现规则描述
一、 名词+得(得1、得2)
二、 代词+得(得1、得2)
三、 连词+得(得1、得2)
四、 时间词+得(得1、得2)
五、 标点+得(得1、得2)
六、 方位词+得(得1、得2)
七、 动词+得(得1、得2、得3、得4)
八、 副词+得(得1、得2、得4)
九、 形容词+得(得1、得3)
十、 助词+得(得1、得2)
十一、 人名+得(得1、得2)
十二、介词+得(得1)
十三、结构助词+得(得1、得2)
十四、 量词+得(得1、得2)
十五、 数词+得(得1、得2)
十六、 习用+得(得1、得2、得3)
十七、 专有名词+得(得1)
十八、语气词+得(得2)
十九、 成语+得(得2、得3)
第五章“得”字述补结构的语法及语义分析
第一节可能式述补结构
一、 可能式述补结构的句法模式
二、 可能式述补结构的语义选择
三、 可能式述补结构的使用禁则
第二节非可能式述补结构
一、 非可能式述补结构的句法模式
二、 非可能式述补结构的语义选择
结语
参考文献
后记
|
|