新書推薦:
《
汉译名著·哲学经典十种
》
售價:NT$
3460.0
《
成吉思汗传:看历代帝王将相谋略 修炼安身成事之根本
》
售價:NT$
280.0
《
爱丁堡古罗马史-罗马城的起源和共和国的崛起
》
售價:NT$
349.0
《
人生解忧:佛学入门四十讲
》
售價:NT$
490.0
《
东野圭吾:分身(东野圭吾无法再现的双女主之作 奇绝瑰丽、残忍又温情)
》
售價:NT$
295.0
《
浪潮将至
》
售價:NT$
395.0
《
在虚无时代:与马克斯·韦伯共同思考
》
售價:NT$
260.0
《
日内交易与波段交易的资金风险管理
》
售價:NT$
390.0
|
內容簡介: |
随着计算机和网络技术的快速发展,互联网日渐成为各种信息的载体。人们在上面(包括新闻评论、产品评论、情感微博、网络社区等)主动的获取、发布、共享、传播各种观点性信息。这些观点性内容对于电子商务、舆情控制、信息检索等都具有重要的意义和实用价值,对网络文本的观点性内容进行自动情感分析成为Web信息处理的一个热点。
《中文微博文本的大数据挖掘:情感分析视角》针对中文微博文本,探索从语义和情感本体的角度构建比较完整的情感分析技术,旨在为中文领域的用户、企业、政府等相关方提供更为方便和科学的中文微博文本挖掘工具。
|
關於作者: |
史伟,湖州师范学院商学院电子商务系副系主任副教授,同济大学管理学博士,2012年美国加州州立大学访问学者。入选浙江省之江青年社科学者,湖州市1112人才工程培养后备人选,湖州师范学院中青年骨干教师,2015年获得湖州师范学院科研成果三等奖。主要从事电子商务、大数据、商务智能、情感分析等研究。主持浙江省自然科学基金项目,浙江省哲学社会科学规划项目,浙江省教育厅一般科研项目,浙江省社科联项目,湖州师范学院校级教学改革项目,湖州师范学院人文社科预研项目等多项课题,参与国家自然科学基金项目,上海市哲学社会科学规划课题多项。发表论文数十篇管理、信息、物流等领域的文章。其中10余篇论文被SCI、EI、一级期刊、CSSCI收录。
|
目錄:
|
第一章 引言
第一节 研究背景及意义
一 互联网大数据的产生
二 文本情感分析的应用
三 微博文本中的大数据
第二节 研究现状分析
一 文本情感分析
二 微博研究
三 本体建模理论
第三节 研究目的和内容
一 研究目的和价值
二 本书的主要研究工作
第二章 文献综述
第一节 基于语义的情感分析研究综述
一 主客观文本分类
二 基于语义文本情感极性分类研究
三 情感强度分类研究
第二节 情感本体构建研究综述
一 情感类划分研究
二 情感本体构建研究
第三节 微博研究综述
一 微博本身研究
二 以微博为平台的情感分析研究
本章小结
第三章 微博文本结构化数据量化分析
引言
第一节 微博定义与平台介绍
一 微博定义
二 微博平台
第二节 微博与微博文本的特点
一 微博的特点
二 微博文本的特点
三 微博文本中的特殊符号
第三节 微博用户结构和内容分析
一 微博用户结构
二 微博平台上的内容分析
第四节 微博文本获取与相关计算
一 微博文本获取方法
二 微博文本影响力计算
三 微博话题影响力和热度计算
本章小结
第四章 情感本体模型的构建方法
引言
第一节 本体结构及隶属度确定方法
一 相关研究工作
二 模糊描述逻辑的构造
三 基于FDL的本体结构及其推理
四 基于NGD的本体隶属度确定
第二节 基于知网的情感本体构建
一 情感本体构建基础问题
二 情感本体结构设计
三 基于模糊理论的评价词本体构建
四 基于语义相似度的情感词本体构建
第三节 数据统计
本章小结
第五章 基于情感本体的微博文本特征识别与语义分析
引言
第一节 情感空间模型
第二节 特征识别
一 产品特征评价
二 特征词提取方法
三 语料特征词提取
第三节 情感特征标注
一 基本词性标注
二 句子划分方法
三 产品特征标注
四 情感类标注
第四节 程度词与否定词语义分析
一 程度词语义分析
二 否定词语义分析
三 程度词与否定词不同组合语义分析
第五节 几种影响因子语义分析
一 标点符号语义分析
二 连接词语义分析
三 修辞句语义分析
第六节 不同粒度层情感语义分析
一 句子层情感语义计算
二 段落层和文档层情感语义计算
第七节 实验及数据分析
一 实验流程设计
二 程度词和否定词检测窗口分析
三 特征识别和情感语义准确性分析
四 情感类统计和关系分析
本章小结
第六章 基于情感本体的微博文本半结构化数据挖掘
引言
第一节 基于情感本体的微博产品评论分析
一 基于TFIDF产品特征提取
二 基于BMI评价词提取
三 微博文本影响力计算
四 产品特征观点与情感类型和强度
五 产品评论情感值计算
第二节 基于情感本体的微博公众情感分析
一 相关研究综述
二 公众情感分析方法构建
三 公众情感分析数据与文本清理
四 情感本体构建与文本影响力计算
五 微博文本情感类型和强度
第三节 实验及数据分析
一 微博产品评论实验分析
二 微博公众情感实证分析
本章小结
第七章 基于情感分析的微博文本非结构化数据开发
引言
第一节 微博情感分析
一 微博评论特征
二 微博文本情感因素提取与度量
第二节 博克斯-詹金斯预测模型
一 博克斯-詹金斯模型的基本形式
二 基本模型选择
第三节 自回归情感预测模型
一 自回归模型
二 融入情感因素
三 训练自回归情感预测模型
第四节 实证研究
一 实验设置
二 模型参数选择
三 与其他方法比较
本章小结
第八章 结论与展望
第一节 结论
一 提出了模糊本体结构及隶属度确定方法
二 建立了基于知网的模糊情感本体
三 提出了基于情感本体的微博文本特征识别和语义分析方法
四 建立了基于情感本体的微博情感类型和强度分析系统
五 微博情感分析应用研究产品销量预测系统
第二节 进一步研究的方向
附录 微博情感分析程序处理
参考文献
|
內容試閱:
|
近年来,随着社交网络、电子商务和移动互联网的迅猛发展,人类社会数据的快速增长给许多行业带来了共同面对的严峻挑战和宝贵机遇,因而信息社会已经进入了大数据(BigData)时代。其中,互联网大数据的涌现不仅改变了人们的生活与工作方式、企业的运作模式,甚至还引起科学研究模式的根本性改变。尤其是随着Web2。0时代的到来,越来越多的人愿意在线表达自己的心情(微博)、发表自己对于政策的看法(新闻评论)、发布自己对于产品的评价(产品评论),等等。区别于传统结构化的数据,互联网大数据的表现形式大多为非结构化或半结构化的评论文本形式,对这些数据的挖掘和分析工作显得更加棘手。情感分析技术的出现正好满足了人们对大规模数据进行观点分析的需要。
情感分析,又称倾向性分析和意见挖掘,是情感计算的重要分支,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。目前,情感分析技术,主要包括机器学习方法及语义方法两类。基于机器学习的情感分类方法需要用大量的训练样本对分类模型进行训练,且训练样本集的建立需要采用人工方法进行手工标志。因此,近年来研究者将情感分析研究集中在对训练样本的需求量较低的语义方法上。
|
|