新書推薦:
《
对话世界一流大学图书馆馆长
》
售價:NT$
995.0
《
揭秘立体翻翻书--我们的国宝
》
售價:NT$
490.0
《
清代贡院史
》
售價:NT$
800.0
《
光焰摇曳——变革与守望的梁启超
》
售價:NT$
440.0
《
发展与制约:明清江南生产力研究(壹卷李伯重文集:江南水乡,经济兴衰,一本书带你穿越历史的迷雾)
》
售價:NT$
480.0
《
走进史学(壹卷李伯重文集:李伯重先生的学术印记与时代见证)
》
售價:NT$
360.0
《
故宫书画集(精编盒装)版传统文化收藏鉴赏艺术书法人物花鸟扇面雕刻探秘故宫书画简体中文注释解析
》
售價:NT$
1490.0
《
《往事和近事(增订本)》(著名学者葛剑雄教授代表作,新增修订、全新推出。跨越三十多年的写作,多角度讲述中华文明)
》
售價:NT$
349.0
|
編輯推薦: |
一、整体亮点
1.稀缺性
图书市场中关于语料库建设与应用的书籍比较稀缺,可以充分利用稀缺性的特点切入市场。
2.专业性
本书作者为北京语言大学信息科学学院院长,对该领域了解深厚,从业研究经验丰富。
3.实用性
本书从需求分析出发,介绍BCC语料库的构建过程与使用方法,汇集了语料库应用在语言学各个场景的实际例子,使读者较为容易地举一反三,实现不同的检索需求,具有较高的参考价值。
4.原创性
本书是作者在实践工作中的思考与总结的结晶。
二、内容特色
1.知识性
本书涉及语料库建设的技术,涵盖了语料库的建设过程中的多项新技术。
2.系统性
本书涵盖了语料库的构建与应用两个方面,系统介绍语料库构建与使用的各环节。
3.广泛性
本书从如何构建与使用BCC语料库入手,涉及了语料库的建设与使用方法的目前认知的全部领域。
|
內容簡介: |
随着计算机技术的发展,语料库在语言本体与教学研究中发挥着越来越重要的作用,同时在大数据的背景下,最新的信息技术大大助力了语料库的建设和应用。汉语语料库的建设,近些年国内外都有较大的发展,BCC 汉语语料库是其中使用比较多的之一,对汉语本体研究和与语言教学也发挥了重要作用。本书对BCC 汉语语料库的特点、建设过程、检索功能、查询语言、编程语言以及对如何使用自定义BCC 语料库进行介绍,以期更好地让人理解,为语言本体与教学研究服务。
本书适合计算语言学与语言学本体研究的学者当作教材,也可作为高等院校人工智能相关的专业师生的教辅参考书。同时,也适合对语料库建设与使用感兴趣的相关人员阅读。
|
關於作者: |
荀恩东
北京语言大学信息科学学院院长,教授,博士生导师。汉语国际教育技术研发中心主任 ,新世纪优秀人才,中国计算机学会名词专委会副主任,中国标准化研究院特聘研究员。1999毕业于哈尔滨工业大学计算机应用与科学系,获得计算机应用专业博士学位。1999年~2001年微软亚洲研究院副研究员。2001年~2003年通过”香港引入优秀人才计划”,在香港科技大学工作。发表研究论文数十篇,主持多项国家863计划和国家自然科学基金项目,承担多项部委和公司合作的项目。目前研究领域包括:自然语言处理、计算机辅助语言学习技术研究和开发工作;非母语作文计算机水平自动评判;基于互联网多元信息作文辅助写作;汉字字形结构评判与辅助汉字书写练习研究;机器翻译。
|
目錄:
|
目录
第 一章 绪论 4
1.1 语料库简介 4
1.1.1 基本特征 4
1.1.2 发展历程 6
1.2 语料库类型 7
1.2.1 按语料模态分类 7
1.2.2 按语料语体分类 8
1.2.3 按语料状态分类 8
1.2.4 按语料时间分类 8
1.2.5 按语料加工程度分类 9
1.2.6 按语料组织形式分类 9
1.2.7 按语料库用途分类 10
1.3 语料库技术 10
1.4 语料库应用 12
1.4.1 服务对象 12
1.4.2 应用方式 14
1.5 BCC语料库 15
1.6 本书章节介绍 16
第二章 BCC语料库的建设 18
2.1 概述 18
2.2 BCC语料库数据 21
2.2.1 数据概况 21
2.2.2 数据加工 22
2.3 BCC语料库系统 34
2.3.1 构建索引 35
2.3.2 检索语言 36
2.4 BCC语料库服务 39
2.4.1 服务对象 39
2.4.2 服务方式 40
2.4.3 使用方式 43
第三章 BCC语料库交互式查询语言 46
3.1 概述 46
3.2 交互式查询语言设计 46
3.2.1 序列语料的检索式组成 47
3.2.2 结构语料的检索式组成 49
3.3 交互式查询语言功能 51
3.3.1 基本检索 51
3.3.2 高级检索 59
第四章 BCC语料库交互式查询语言应用 65
4.1 语素检索 65
4.2 词语检索 67
4.2.1 基础检索 67
4.2.2 合成词 71
4.2.3 离合词 78
4.3 短语检索 81
4.4 构式检索 85
4.4.1 无变项构式的检索 85
4.4.2 有变项构式的检索 86
4.5 句子检索 90
4.5.1 单句检索 90
4.5.2 复句检索 94
第五章 BCC语料库脚本式编程语言 96
5.1 概述 96
5.2 检索原理 96
5.2.1 检索框架 97
5.2.2 检索单元 100
5.3 BCC脚本式编程语言设计 110
5.3.1 基本查询 112
5.3.2 组合查询 115
5.3.3 条件约束 122
5.3.4 功能操作 131
5.3.5 输出操作 137
5.4 BCC脚本式编程语言功能 141
5.4.1 基本检索 142
5.4.2 组合检索 146
5.4.3 高级检索 151
第六章 BCC语料库脚本式编程语言应用 157
6.1 概述 157
6.2 定中结构的抽取 157
6.2.1 限定词性序列的检索 157
6.2.2 限定结构标记的检索 161
6.2.3 限定词语范围的检索 163
6.2.4 限定语料特征的检索 164
6.2.5 限定检索基点的检索 167
6.3 小结 168
第七章 个性化语料库的构建 170
7.1 数据准备 170
7.1.1 数据信息 170
7.1.2 数据预处理 171
7.2 索引构建 182
7.2.1 硬件基础 182
7.2.2 预备文件 185
7.2.3 构建索引 189
7.3 语料库使用 196
7.3.1 启动服务 196
7.3.2 网络使用 196
7.3.3 离线使用 204
第八章 BCC语料库在线网站 208
8.1 概述 208
8.2 基础检索 208
8.2.1 检索步骤 208
8.2.2 结果处理 210
8.3 历时检索 213
8.3.1 单检索式 213
8.3.2 双检索式 214
8.4 对比检索 215
8.4.1 单检索式 215
8.4.2 双检索式 216
8.5 自选范围检索 217
8.6 词典 218
8.6.1 简介 218
8.6.2 查询方式 221
8.6.3 查询结果 223
参考文献 228
|
|