新書推薦:
《
一个人·谁也不是·十万人(诺贝尔文学奖得主反思自我的巅峰之作)
》
售價:NT$
250.0
《
重写晚明史(全5册 精装)
》
售價:NT$
3560.0
《
汉末晋初之际政治研究
》
售價:NT$
602.0
《
强者破局:资治通鉴成事之道
》
售價:NT$
367.0
《
鸣沙丛书·鼎革:南北议和与清帝退位
》
售價:NT$
551.0
《
从康德到黑格尔的发展:兼论宗教哲学(英国观念论名著译丛)
》
售價:NT$
275.0
《
突破不可能:用特工思维提升领导力
》
售價:NT$
352.0
《
王阳明大传:知行合一的心学智慧(精装典藏版)
》
售價:NT$
1010.0
|
內容簡介: |
《计算语言学研究系列:先秦文献信息处理》研究先秦文献的信息处理,包括先秦文献的词汇处理、历史知识处理以及词汇与历史知识的智能检索。对先秦文献做词汇处理,目的在于追本溯源,了解先秦汉语词汇的基本面貌。用计算语言学方法梳理这一时期的历史事件、人名、地名等知识,有助于更好地理解先秦文献。与现当代中文文献相比,先秦传世文献规模很小,但相关的注疏文献十分丰富。因此《计算语言学研究系列:先秦文献信息处理》采用了与一般中文信息处理不同的方法——基于注疏文献的方法。对比实验表明,这种方法在先秦文献信息处理中具有显著优势。
|
關於作者: |
陈小荷,江西丰城人。北京大学现代汉语专业文学博士。现任南京师范大学文学院语言科学及技术系教授、博士生导师,兼中国中文信息学会理事、《中文信息学报》编委。主要研究方向为中文信息处理、汉语语法学。代表作有《现代汉语自动分析-VisualC++实现》《汉语口语里表示“……再说”的语素“着”》等。主持国家社会科学基金项目1项,江苏省高校社科重点研究基地重大项目1项,参与国家社会科学基金重大项目1项。
|
目錄:
|
第一章 绪论
第一节 先秦文献
第二节 先秦文献信息处理
第三节 先秦文献信息处理的特点
第四节 基于注疏文献的处理方法
第二章 注疏文献处理
第一节 注疏文献的选取
第二节 注疏文献的内容分析
第三节 先秦文献与其注疏文献的句子对齐和注释对齐
第三章 词语切分
第一节 先秦汉语分词规范
第二节 基于统计模型的自动分词方法
第三节 利用注疏文献的自动分词方法
第四章 词性标注
第一节 词类体系
第二节 基于统计的分词标注一体化方法
第三节 基于注疏文献的词性校正
第五章 古今字、通假字资源建设
第一节 古今字、通假字研究现状
第二节 古今字、通假字数据库的构建
第三节 通假字标注实验
第四节 实验结果及其分析
第六章 词汇概貌
第一节 语料来源和说明
第二节 先秦文献的汉字统计
第三节 先秦文献的词汇统计
第四节 计算每种文献的特色词
第五节 成语来源统计
第七章 词义消歧
第一节 古代汉语词义特点和消歧难点
第二节 义项区分的颗粒度
第三节 基于CRF模型的消歧实验
第四节 分类器集成的消歧实验
第八章 专名标注
第一节 关于“专名”和“命名实体”的辨析
第二节 先秦时期的人名与地名
第三节 基于统计的专名识别
第四节 基于注疏文献的专名识别
第五节 人名所指歧义消解
第六节 基于专名标注的事件划分
第九章 版本异文发现
第一节 异文和版本异文
第二节 个案和研究方法
第三节 基于相似度计算的句珠配对
第四节 基于同文排除的异文配对
第五节 基于双序列比对的一体化处理
第六节 实验结果及其分析
第十章 《左传》中的春秋社会网络分析
第一节 社会网络分析的基本方法和软件
第二节 社会关系数据的获取和网络的定义
第三节 人物-事件网络分析
第四节 人物关系网络分析
第五节 人物关系网络的深入分析
后记
|
|