《自然语言处理中的贝叶斯分析（原书第2版）》 - 台灣·大書城 - [英] 谢伊·科恩[Shay，Cohen] - 机械工业出版社

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　聯絡我們　 \|　運費計算　 \|　幫助中心　\|　加入書簽
		會員登入新用戶註冊

HOME

新書上架

暢銷書架

好書推介

2024年度TOP

香港／國際用戶

最新/最熱/最齊全的簡體書網

品種：超過100萬種書，正品正价，放心網購，悭钱省心

送貨：速遞 / 物流，時效：出貨後2-4日

『簡體書』自然语言处理中的贝叶斯分析（原书第2版）

書城自編碼： 3581752
分類：簡體書→大陸圖書→計算機/網絡→人工智能
作者： [英] 谢伊·科恩[Shay，Cohen]
國際書號(ISBN)： 9787111669579
出版社：机械工业出版社
出版日期： 2020-12-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：NT$ 534

我要買件

** 我創建的書架 **
未登入.

編輯推薦：

自然语言处理Natural Language Processing ,NLP在20世纪80年代中期经历了深刻变革，其开始大量使用语料库和数据驱动技术对语言进行分析。自那时起，统计技术在自然语言处理中的应用在多个方面得到了发展。其中的一个例子发生在20世纪90年代末或21世纪初，自然语言处理引入了成熟的贝叶斯机制。这种针对自然语言处理的贝叶斯方法已经可以解决频率学派方法的各种缺点，特别是在没有目标预测示例的无监督情况下进行统计学习更能弥补频率学派方法的不足。

內容簡介：

本书涵盖了流利阅读NLP中贝叶斯学习方向的论文以及从事该领域的研究所需的方法和算法。这些方法和算法部分来自于机器学习和统计学，部分是针对NLP开发的。我们涵盖推理技术，如马尔科夫链、蒙特卡罗抽样和变分推理、贝叶斯估计和非参数建模。为了应对该领域的快速变化，本书新版增加了一个新的章节，关于贝叶斯背景下的表现学习和神经网络。我们还将介绍贝叶斯统计的基本概念，如先验分布、共轭性和生成式建模。*后，我们回顾了一些基本的NLP建模技术，如语法建模、神经网络和表示学习，以及它们在贝叶斯分析中的应用。

關於作者：

谢伊·；科恩（Shay Cohen）
爱丁堡大学信息学院语言、认知和计算研究所的讲师，他于2000年和2004年在特拉维夫大学分别取得数学和计算机科学学士学位与计算机科学硕士学位，并于2011年在卡内基-梅隆大学取得语言技术博士学位，在哥伦比亚大学(2011~2013)和爱丁堡大学(2013~2018）的博士后研究期间，分别获得计算创新奖学金和大学校长奖学金。他的研究方向是自然语言处理和机器学习，重点研究结构化预测中的问题，比如句法和语义解析。

译者序第2版前言第1版前言第1版致谢第1章　基础知识11.1　概率测度11.2　随机变量21.2.1　连续随机变量和离散随机变量21.2.2　多元随机变量的联合分布31.3　条件分布41.3.1　贝叶斯法则51.3.2　独立随机变量与条件独立随机变量61.3.3　可交换的随机变量61.4　随机变量的期望71.5　模型91.5.1　参数模型与非参数模型91.5.2　模型推断101.5.3　生成模型111.5.4　模型中的独立性假定131.5.5　有向图模型131.6　从数据场景中学习151.7　贝叶斯学派和频率学派的哲学（冰山一角）171.8　本章小结171.9　习题18第2章　绪论192.1　贝叶斯统计与自然语言处理的结合点概述192.2　第一个例子：隐狄利克雷分配模型222.2.1　狄利克雷分布262.2.2　推断282.2.3　总结292.3　第二个例子：贝叶斯文本回归302.4　本章小结312.5　习题31第3章　先验333.1　共轭先验333.1.1　共轭先验和归一化常数363.1.2　共轭先验在隐变量模型中的应用373.1.3　混合共轭先验383.1.4　重新归一化共轭分布393.1.5　是否共轭的讨论393.1.6　总结403.2　多项式分布和类别分布的先验403.2.1　再谈狄利克雷分布413.2.2　Logistic正态分布443.2.3　讨论483.2.4　总结493.3　非信息先验493.3.1　均匀不正常先验503.3.2　Jeffreys先验513.3.3　讨论513.4　共轭指数模型523.5　模型中的多参数抽取533.6　结构先验543.7　本章小结553.8　习题56第4章　贝叶斯估计574.1　隐变量学习：两种观点584.2　贝叶斯点估计584.2.1　最大后验估计594.2.2　基于最大后验解的后验近似644.2.3　决策-理论点估计654.2.4　总结664.3　经验贝叶斯664.4　后验的渐近行为684.5　本章小结694.6　习题69第5章　采样算法705.1　MCMC算法：概述715.2　MCMC推断的自然语言处理模型结构715.3　吉布斯采样735.3.1　坍塌吉布斯采样765.3.2　运算符视图795.3.3　并行化的吉布斯采样器805.3.4　总结815.4　Metropolis-Hastings算法825.5　切片采样845.5.1　辅助变量采样855.5.2　切片采样和辅助变量采样在自然语言处理中的应用855.6　模拟退火865.7　MCMC算法的收敛性865.8　马尔可夫链：基本理论885.9　MCMC领域外的采样算法895.10　蒙特卡罗积分915.11　讨论935.11.1　分布的可计算性与采样935.11.2　嵌套的MCMC采样935.11.3　MCMC方法的运行时间935.11.4　粒子滤波935.12　本章小结955.13　习题95第6章　变分推断976.1　边缘对数似然的变分界976.2　平均场近似996.3　平均场变分推断算法1006.3.1　狄利克雷-多项式变分推断1016.3.2　与期望最大化算法的联系1046.4　基于变分推断的经验贝叶斯1066.5　讨论1066.5.1　推断算法的初始化1076.5.2　收敛性诊断1076.5.3　变分推断在解码中的应用1076.5.4　变分推断最小化KL散度1086.5.5　在线的变分推断1096.6　本章小结1096.7　习题109第7章　非参数先验1117.1　狄利克雷过程：三种视角1127.1.1　折棍子过程1127.1.2　中餐馆过程1147.2　狄利克雷过程混合模型1157.2.1　基于狄利克雷过程混合模型的推断1167.2.2　狄利克雷过程混合是混合模型的极限1187.3　层次狄利克雷过程1197.4　Pitman?Yor过程1207.4.1　Pitman-Yor过程用于语言建模1217.4.2　Pitman-Yor过程的幂律行为1227.5　讨论1237.5.1　高斯过程1247.5.2　印度自助餐过程1247.5.3　嵌套的中餐馆过程1257.5.4　距离依赖的中餐馆过程1257.5.5　序列记忆器1267.6　本章小结1267.7　习题127第8章　贝叶斯语法模型1288.1　贝叶斯隐马尔可夫模型1298.2　概率上下文无关语法1318.2.1　作为多项式分布集的PCFG1338.2.2　PCFG的基本推断算法1338.2.3　作为隐马尔可夫模型的PCFG1368.3　贝叶斯概率上下文无关语法1378.3.1　PCFG的先验1378.3.2　贝叶斯PCFG的蒙特卡罗推断1388.3.3　贝叶斯PCFG的变分推断1398.4　适配器语法1408.4.1　Pitman-Yor适配器语法1418.4.2　PYAG的折棍子视角1428.4.3　基于PYAG的推断1438.5　层次狄利克雷过程PCFG1448.6　依

內容試閱：

第2版前言Bayesian Analysis in Natural Language Processing, Second Edition没想到本书会如此迅速地发行第2版。最近几年，自然语言处理领域的快速而令人兴奋的发展要求进行各种更新，本书第2版应运而生。第2版主要增加的内容是第9章，该章重点介绍自然语言处理（特别是在贝叶斯情景下）中的表征学习与神经网络。本章的撰写是基于这样的观察：在过去5年左右的时间里，自然语言处理中的大部分文献都使用神经网络。因此，本书需要解决一些基本问题。使更新内容适应本书的贝叶斯“使命”（结合自然语言处理背景）并不容易，我是否完成了这一使命将由读者来判断。第2版除了引入新的章节外，还修正了一些印刷错误，并将一些附加内容整合到各章中。一些人为本书第2版提供了帮助。非常感谢Trevor Cohn、Marco Damonte、Jacob Eisen-stein、Lea Frermann、Annie Louis、Chunchuan Lyu、Nikos Papasarantopoulos、Shashi Nara-yan、Mark Steedman、Rico Sennrich和Ivan Titov的帮助和评点。还要感谢我的学生和博士后，他们在本书新内容的某些方面教给我的知识比我教给他们的更多。谢伊·科恩爱丁堡2019年2月第1版前言Bayesian Analysis in Natural Language Processing, Second Edition当撰写涉及两个领域（贝叶斯统计和自然语言处理）交叉的主题时，需要考虑焦点和视角。本书旨在为在研究生求学期间和我具有相同处境的人编写，采取一种相当实用的视角。在研究生求学期间，我已经对自然语言处理中的问题和机器学习的基本原理有所了解，我想以纯抽象的方式来学习更多关于贝叶斯统计的知识，尤其是与自然语言处理最相关的部分。因此，本书就是从这种角度出发，提供有关计算语言学家将贝叶斯方法应用于工作时所需掌握的关键技术、术语和模型的抽象信息。因此，本书的大部分章节比较简洁，且与贝叶斯统计的其他应用相关。只有最后一章为语法模型提供一些具体的自然语言处理应用，这些模型主要（但不完全）用于自然语言处理。在理想情况下，本书面向的读者应该已经对自然语言处理中的统计建模有一定了解，并且希望对贝叶斯技术在自然语言处理中的具体应用有更深入的了解。做出更多关注贝叶斯自然语言处理数学层面的决策的动机很简单，因为大部分计算语言学家在他们的研究生生涯或其他阶段很早就接触到了自然语言处理的基本核心术语、自然语言处理所预测的语言结构及其背后的一些语言动机。特别是计算语言学家在研究中经常需要学习贝叶斯统计思想或掌握其他统计工具，因此他们有时会对贝叶斯统计产生误解，且缺失全局观。本书试图向读者提供一些缺失的细节。当前做统计研究工作的方法有多种，频率学派方法和贝叶斯学派方法是其中的两种。频率学派方法有时也称为“经典统计”。而促使我更多地了解贝叶斯统计的一个原因是它拥有辉煌的历史。时至今日，著名的“频率学派和贝叶斯学派分歧”依然存在。这种关于统计分析应遵循的哲学的分歧，甚至比语法理论中生成语义学家和生成语法学家之间著名的“语言战争”的争论更持久且更激烈。即使在贝叶斯阵营里，争论也没有结束。比如一部分人支持对概率的主观解释，而另一部分人支持客观解释。虽然我在第一次接触贝叶斯统计的核心思想（从理论上来讲，贝叶斯统计依赖于应用贝叶斯法则对数据和参数之间的关系进行转换）时，就被其优雅的数学理论所吸引，但我还是采用了很务实的做法，并没有试图将贝叶斯统计作为进行统计自然语言处理的终极理论。在本书中，我也没有提供支持贝叶斯统计的哲学观点。相反，我提供了贝叶斯统计背后的技术机制，建议读者确定该技术是否适合自己所处理的问题。此外，本书还描述了贝叶斯统计与频率学派方法之间的一些联系，以及其他的共通点。如果读者有兴趣更多地了解贝叶斯统计背后的哲学，建议阅读文献Jaynes（2003）并查看文献Barnett（1999）。为了更好地了解贝叶斯统计背后的历史和人物，建议阅读书籍McGrayne（2011）。本书共分八章，内容如下：第1章是关于概率和统计的复习，因为它们与贝叶斯自然语言处理相关。我们涵盖随机变量及其之间的独立性、条件独立性、随机变量期望等基本概念。本章还会简要讨论贝叶斯统计以及它与频率统计的区别。如果你具备计算机科学或统计学的一些基础知识，本章的大部分内容可以跳过。第2章通过两个示例（隐狄利克雷分配模型和贝叶斯文本回归）介绍自然语言处理中的贝叶斯分析，并提供该主题的高级概述。第3章介绍贝叶斯统计建模的一个重要组成部分—先验，并讨论贝叶斯自然语言处理中最常用的先验，如狄利克雷分布、非信息先验和正态分布等。第4章通过对后验分布的总结，阐述将频率统计和贝叶斯统计相结合的思路，并详细介绍在保持贝叶斯思维的同时为参数集合计算点估计的方法。第5章介绍贝叶斯统计中一种主要的推断方法—马尔可夫链蒙特卡罗。还将详细介绍贝叶斯自然语言处理中最常用的两种采样算法：吉布斯采样和Metropolis-Hastings采样。第6章介绍贝叶斯自然语言处理中另一种重要的推断方法—变分推断，并描述平均场变分推断和变分期望最大化算法。第7章涵盖贝叶斯自然语言处理中的一种重要建模技术—非参数建模。我们讨论非参数模型—狄利克雷过程和Pitman-Yor过程。第8章介绍自然语言处理中的基本语法模型（如概率上下文无关语法和同步语法），以及在贝叶斯上下文中构建它们的方法（使用诸如适配器语法、层次狄利克雷过程概率上下文无关语法等模型）。此外，书后还有两个附录，它们提供阅读本书所需的额外背景信息。每章都附有至少5个习题。本书（包括每章后面的练习题）可以用作教材。具体来讲，本书可作为讲授有关自然语言处理中的贝叶斯分析的多门课程的教材。如果有充足的时间在课堂上讲授贝叶斯自然语言处理（比如四次课），建议将一次课用于第3章，一次课用于第4章，一次课用于第5章和第6章，一次课用于第7章。至于第8章的主题（如适配器语法或贝叶斯概率上下文无关语法），可以用示例的形式注入每次课中。

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	台灣用户　\|　香港/海外用户

megBook.com.tw
Copyright (C) 2013 - 2025 （香港）大書城有限公司　All Rights Reserved.