|
編輯推薦: |
NLTK是自然语言处理领域中非常受欢迎和广泛使用的Python库。NLTK的优点在于其简单性,其中大多数复杂的自然语言处理任务使用几行代码即可实现。本书旨在讲述如何用Python和NLTK解决各种自然语言处理任务并开发机器学习方面的应用。本书首先介绍任何文本挖掘 NLP任务中所需的所有预处理步骤,如文本的整理、清洗、语法分析、分类等,然后讲述如何使用NLTK 3进行文本处理,如标记文本、替换和校正单词、创建自定义语料库等,讨论了如何使用Python完成自然语言处理任务,如语义分析、情感分析、信息检索等。 本书适合NLP和机器学习领域的爱好者、对文本处理感兴趣的读者、想要快速学习NLTK的Python程序员以及机器学习领域的专业人士阅读。 本书包括以下主要内容 ● 使用词性标注和分块的方法对文本进行整理与清洗。 ● 把文本标记为句子,把句子标记为单词。 ● 文本分类和情感分析。 ● 字符串匹配算法和归一化方法。 ● 信息检索和文本摘要的概念。 ● 使用Python解决各种NLP任务的方式。
|
內容簡介: |
NLTK是自然语言处理领域中非常受欢迎和广泛使用的Python库。NLTK的优点在于其简单性,其中大多数复杂的自然语言处理任务使用几行代码即可完成。本书旨在讲述如何用Python和NLTK解决各种自然语言处理任务并开发机器学习方面的应用。本书介绍了NLTK的基本模块,讲述了采用NLTK实现自然语言处理的大量技巧,讨论了一些文本处理方法和语言处理技术,展示了使用Python实现NLP项目的大量实践经验。本书主要内容包括文本挖掘NLP任务中所需的所有预处理步骤,如何使用Python 3的NLTK 3进行文本处理,如何通过Python开展NLP项目。 本书适合NLP和机器学习领域的爱好者、Python程序员以及机器学习领域的研究人员阅读。
|
關於作者: |
Nitin Hardeniya是一位数据科学家,精通Python、NLTK、机器学习,与多家知名公司都有长期的合作。他的业务范围比较广,擅长解决不同领域的各种业务问题。他发表过5篇专利。
|
|