新書推薦:
《
帕纳索传来的消息(文艺复兴译丛)
》
售價:NT$
495.0
《
DK威士忌大百科
》
售價:NT$
1340.0
《
小白学编织
》
售價:NT$
299.0
《
Android游戏开发从入门到精通 第2版 王玉芹
》
售價:NT$
495.0
《
西班牙内战:秩序崩溃与激荡的世界格局:1936-1939
》
售價:NT$
990.0
《
非对称创新:中国企业赶超战略 魏江 刘洋
》
售價:NT$
495.0
《
潜能觉醒
》
售價:NT$
395.0
《
初平:汉末群雄混战(190—195)
》
售價:NT$
245.0
|
內容簡介: |
严灿勋著的《英汉军事语料句子对齐研究》系统阐述了基于双语词典的二分图顶点最大权重配对句子对齐方法,其中包括句子对齐所用的双语词典的自建方法、英语句子边界识别方法、英语单词形态还原方法及利用双语词典对汉语句子进行分词的方法,解决了普通长度的英汉平行军事文本的句子对齐问题,对实现其他领域英汉平行语料句子对齐具有借鉴意义。
本书可供自然语言处理领域研究人员、计算语言学研究人员、语料库建设和应用研究人员、双语词典编纂平台设计使用者、机辅翻译平台设计使用者阅读参考。
|
目錄:
|
第1章平行语料句子对齐方法研究概述
1.1句子对齐的重要性
1.2常见的句子对齐方法
1.2.1基于长度的句子对齐方法
1.2.2基于词汇互译信息的句子对齐方法
1.2.3长度和词汇互译信息混合的句子对齐方法
1.3二分图模型在双语句子对齐中的应用
1.4小结
第2章英汉军事语料句子对齐方法
2.1句子对齐英汉军事语料的重要性
2.2对英汉军事语料句子对齐方法的思考
2.3拟采用的句子对齐方法
2.4小结
第3章相关语言知识库的建设
3.1语言知识库的建设目的、原始资源及作用
3.1.1语言知识库建设目的
3.1.2语言知识库原始资源
3.1.3语言知识库作用
3.2相关语言知识库建设的总体设计
3.2.1根据句子对齐工作流程确定相关语言知识库
3.2.2根据相关语言知识库架构选择原始资源
3.3相关语言知识库的建设过程
3.3.1数据库的选择
3.3.2基本数据的准备及相关处理
3.3.3知识库的构建
3.4小结
第4章文本预处理
4.1英汉平行文本拆分及段落对齐
4.1.1英汉平行文本拆分
4.1.2计算机辅助段落对齐
4.2英语、汉语句子边界识别
4.2.1自主实现英语句子边界识别的必要性
4.2.2英语句子边界识别研究概况
4.2.3英语句子边界识别方法设计实现
4.2.4英语句子边界识别实验及结果分析
4.3英语形态还原
4.3.1形态还原目的
4.3.2基于单词表的形态还原方法
4.3.3形态变化还原规则
4.3.4其他词法现象的处理
4.4汉语分词
4.4.1汉语分词的目的及基本流程
4.4.2汉语分词方法的选择
4.4.3基于字符串匹配的分词方法的扫描方式的选择
4.4.4汉语分词词典的设计及逆向
最大匹配分词算法
4.5小结
第5章顶点最大权重配对句子对齐算法
5.1顶点最大权重配对句子对齐处理流程
5.2句对相关性分值的计算
5.3双语句子对齐数学模型
5.3.1二分图的定义
5.3.2二分图的顶点配对、权重
5.3.3临时锚点和二分图的顶点最大权重配对
5.3.4顶点最大权重配对与最大权重匹配
5.4句子对齐的求解要求
5.5二分图顶点最大权重配对模型下的句子对齐处理
5.5.1不需要修正的句子对齐实例
5.5.2需要修正的句子对齐实例
5.5.3句子对齐程序对二分图全局顶点最大权重配对结果的调整
5.6小结
第6章英汉句子对齐平台设计实现及实验
6.1英汉平行语料句子对齐处理平台的设计和实现
6.1.1调入英汉平行文本
6.1.2英汉平行文本段落对齐处理
6.1.3句子对齐处理
6.1.4英汉词汇互译信息库管理
6.2实验设计和实验结果分析
6.2.1实验设计
6.2.2句子对齐评价方法
6.2.3实验过程及主要数据
6.2.4错误分析及改进措施
6.2.5实验及错误分析总结
6.3小结
第7章总结和展望
7.1研究取得的主要成果
7.2展望
参考文献
|
|