新書推薦:
《
卡特里娜(“同一颗星球”丛书)
》
售價:NT$
398.0
《
伟大民族:从路易十五到拿破仑的法国史(方尖碑)
》
售價:NT$
857.0
《
古今“书画同源”论辨——中国书法与中国绘画的关系问题兼中国画笔墨研究
》
售價:NT$
602.0
《
《日本文学史序说》讲演录
》
售價:NT$
332.0
《
无尽的海洋:美国海事探险与大众文化(1815—1860)
》
售價:NT$
454.0
《
治盗之道:清代盗律的古今之辨
》
售價:NT$
556.0
《
甲骨文丛书·剑桥世界暴力史(第一卷):史前和古代世界(套装全2册)
》
售價:NT$
959.0
《
甲骨文丛书·中华早期帝国:秦汉史的重估
》
售價:NT$
1367.0
|
編輯推薦: |
本书是方法工具与日语教学研究丛书之一。主要介绍如何利用免费软件来制作日语语料库和如何使用语料库,让每位读者拥有自己的语料库,以便更好地进行日语学研究。详细介绍语料库的制作目的以及现在可供使用的主要语料库资源。
|
內容簡介: |
本书是方法工具与日语教学丛书之一。主要介绍如何利用免费软件来制作日语语料库和如何使用语料库。让每位读者拥有自己的语料库,以此进行各自的研究。内容主要包括语料的收集、PDF转换为文本文件的处理技巧、语料库的具体制作技术、语料库的使用、利用语料库研究日语的范例研究等。
|
關於作者: |
于康,笔名云丹加措。日本关西学院大学教授、博士生导师。主要致力于日语语言学、汉日语法对比、第二语言习得和日语学习中的误用等领域的研究。著书『日本語に於ける不定語の構文的機能に関する歴史的研究』(1999,渓水社)、《日语论文写作-方法与实践》2008,高等教育出版社、《现代日语语言学丛书语法学》2012,高等教育出版社等10部,论文“‘V下’的语义扩展与结果义”(2006,『中国語の補語』白帝社)、“从「入れる」和‘放’的对比看受事位移动词与致使义”(2008年,《北京大学日語学科成立60周年国際研討会論文集 日本語言文化研究》第8輯,学苑出版社)、「『目的語残存受身文』における目的語残存の条件について―中国語との対照という視点から―」(2012,『国文学攷』214)等82篇。
|
目錄:
|
卷首语
前言
第1章 语言资源的利用与语料库建设
1.1 制作语料库的目的
1.2 现在可供使用的主要语料库
1.3 制作自己的语料库
1.4 语料库的多元化用途
第2章 电脑配置、所需软件及软件的安装
2.1 电脑的配置
2.1 所需软件
2.2.1 Java
2.2.2 「秀丸」
2.2.3 「えだまめ」
2.2.4 「ひまわり」
2.3 软件的下载和安装
2.3.1 Java的下载和安装
2.3.2 「秀丸」的下载和安装
3.3.3 「えだまめ」的下载和安装
2.3.4 「ひまわり」的下载和安装
2.4 小结
第3章 收集与保存语料
3.1 收集语料时所需的设备和软件
3.1.1 扫描仪
3.1.1.1 单页扫描仪
3.1.1.2 连续扫描仪
3.1.2 AdobeAcrobat9
Standard(或X,或Pro,或以上的版本)
3.1.3 JUST PDF 2 [作成?高度編集?データ変換]
3.1.4 OCR软件
3.1.5 「秀丸」
3.2 建立保存语料用的文件夹
3.3 收集语料的具体操作方法
3.3.1 从网上直接下载和保存语料
3.3.1.1 如何下载电子版报纸的社论
3.3.1.2 如何下载「青空文庫」中的作品
3.3.1.3 如何下载「国会会議録」中的会议记录
3.3.2 从PDF文件中读取和保存语料
3.3.3 将纸版语料转换为电子语料的步骤
3.3.3.1 如何将纸版语料转换为PDF格式的文件
3.3.3.2 如何将PDF格式的文件转换为文本格式的文件
3.3.3.2.1 如何使用OCR将PDF格式的文件转换为文本格式的文件
3.3.3.2.2 如何使用PDF软件自带的OCR功能将文件转换为文本格式的文件
3.4 小结
第4章 清理语料
4.1 手动删除无需的信息
4.2 使用“规则命令句”删除注音假名 ルビ
4.3 使用“规则命令句”删除文中的各类不需要的符号
4.3.1 删除各种装饰性符号
4.3.2 删除多余的文字和符号信息
4.3.3 删除空格和空行
4.3.3.1 删除空格
4.3.3.2 删除空行
4.4 出错时的返工方法
4.5 小结
第5章 制作语料库
5.1 使用「えだまめ」转换文件的格式
5.2 使用全文检索软件「ひまわり」制作语料库
5.3 设定检索条件与检索例句
5.3.1 「検索文字列」
5.3.1.1 无条件检索
5.3.1.1.1 固定形式的无条件检索
5.3.1.1.2 可变形式的无条件检索
5.3.1.2 有条件检索
5.3.2 「フィルタ」
5.3.3 「コーパス」
5.3.4 「検索オプション」
5.3.4 例句栏上方的10个栏目标题
5.4 在全文中观察、保存和使用例句
5.4.1 在全文中观察例句
5.4.2 保存例句
5.4.2.1 保存其中的个别例句
5.4.2.2 保存检索的全部结果
5.4.3 展开和使用例句
5.4.3.1 使用「秀丸」展开例句
5.4.3.2 使用Word展开例句
5.4.3.3 使用Excel展开例句
5.5 小结
第6章 给例句加注标签与日语研究
6.1 制作标签的思路
6.2 标签的分类与所需软件
6.2.1 标签的分类
6.2.2 加注标签时所使用的软件
6.3 如何给日语例句加注标签
6.3.1 加注标签与日语「存在構文」的研究
6.3.2 加注标签
6.3.2.1 通过语料库收集「NPに(は)+NPが+V」的例句
6.3.2.2 清除垃圾例句
6.3.2.3 给例句加注标签
6.3.3 制作加注标签的语料库「日本語の存在構文コーパス」
6.3.4 检索和保存例句以及清除垃圾例句
6.3.5 对标签进行统计和分析
6.3.5.1 「非対格自動詞」存在句
6.3.5.2 「他動詞」存在句
6.3.5.3 「非能格自動詞」存在句
6.3.5.4 日语存在句成句规则的假设
6.4 小结
后记
参考文献
|
內容試閱:
|
语料库指的是储存各种类型文章的大型文字仓库。我们可以根据各种需要对语料库里储存的语言信息进行各种各样的检索,抽取所需要的信息。
专业语料库不仅可以抽取某个词汇实际使用的例句,而且还可以抽取各种句式与各类构句成分之间的搭配用法的例句,同时对出处、作者性别、作品的体裁、作品的发表时间等加以限定。业余语料库除了不能自由地抽取句式与各类构句成分之间的搭配用法的例句外,其他功能基本上与专业语料库相同。
学会制作语料库,可以不受时间和上网条件等限制,根据各种需要随时进行检索,快速获取大量的例句。学会给例句加注标签,制作带标签的语料库,可以从根本上解决面对大量例句而束手无策的问题,提高发现规则的速度和精度。
|
|