登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

『簡體書』信念网络在话题识别与追踪中的应用研究

書城自編碼: 3011024
分類: 簡體書→大陸圖書→計算機/網絡網絡與數據通信
作者: 吴树芳
國際書號(ISBN): 9787030518859
出版社: 科学出版社
出版日期: 2017-03-01
版次: 1 印次: 1
頁數/字數: 144/200000
書度/開本: 16开 釘裝: 平装

售價:NT$ 418

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
给孩子的语文四书:语文原来可以这样学(全四册)
《 给孩子的语文四书:语文原来可以这样学(全四册) 》

售價:NT$ 770.0
人海之间:海洋亚洲中的中国与世界
《 人海之间:海洋亚洲中的中国与世界 》

售價:NT$ 325.0
这里是中国(3):华夏文明史诗
《 这里是中国(3):华夏文明史诗 》

售價:NT$ 1089.0
伟大的中国奇迹:给孩子的古建筑解剖书(全8册)
《 伟大的中国奇迹:给孩子的古建筑解剖书(全8册) 》

售價:NT$ 2013.0
Fundamental of Physics(7th Edition) 基础物理学(第7版)(改编版)
《 Fundamental of Physics(7th Edition) 基础物理学(第7版)(改编版) 》

售價:NT$ 473.0
全2册历史不忍细看一本书读懂中国史中华上下五千年历史知识现代史通史书中小学生青少年课外书中国史历史类书籍
《 全2册历史不忍细看一本书读懂中国史中华上下五千年历史知识现代史通史书中小学生青少年课外书中国史历史类书籍 》

售價:NT$ 437.0
再见杨德昌:台湾电影人访谈纪事
《 再见杨德昌:台湾电影人访谈纪事 》

售價:NT$ 510.0
彩色图解传习录:彩书馆(16开四色平装)
《 彩色图解传习录:彩书馆(16开四色平装) 》

售價:NT$ 286.0

編輯推薦:
《信念网络在话题识别与追踪中的应用研究》可以作为高等院校信息管理与信息系统、计算机科学与技术、管理科学与工程、情报学和图书馆学等专业研究生的教材,也可以作为相关领域研究人员的参考书。
內容簡介:
向量空间检索模型在话题识别与追踪领域的成功应用,从理论上证明用于信息检索的贝叶斯网络模型亦可用于该领域。信念网络模型属于基于贝叶斯网络的检索模型的一种,专著围绕该思想,将其用于话题识别与追踪模型的构建,为该领域提出新的研究方法。考虑到新闻报道的特殊性,在文本处理阶段,将在基本互信息的基础上,提出融合聚类思想和时间距离的新闻话题特征选择方法,用于计算新闻报道中术语的权重。为了获得每个话题的初始特征子集规模,给出基于类内距离*小、类间距离*的目标函数,并采用坐标下降法对其求解结合信念网络模型和新闻报道的特点,给出四个基于信念网络的话题模型BSTM-I、BSTM-II、BDTM-I和BDTM-II。BSTM-I、BSTM-II属于静态话题模型,其区别是节点层数、类型。BDTM-I属于动态话题模型,节点类型和弧的意义与静态模型相同,不同的是在话题追踪过程中,其术语层会随着话题的发展而不断更新,包括术语权重的更新和术语节点的插入、删除。以上三个话题模型沿用了传统建模思想,具备和以往模型相同的优缺点。BDTM-II打破传统建模的思想,运用信念网络模型提供了一个灵活框架的优势,将术语节点分为两类:初始核心术语节点和更新术语节点,并采用析取手段将它们作为两类证据进行归并。依据模型的拓扑结构、贝叶斯概率和条件独立性假设给出了上述四个话题模型的概率推导。*后,专著将在上述内容的基础上,进行基于信念网络的话题模型优化研究,以期进一步提高模型的综合性能。
目錄
前言
第1章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 话题识别与追踪研究现状
1.2.2 话题识别与追踪模型研究现状
1.2.3 信念网络及应用研究现状
1.3 研究内容与研究目标
1.4 本书主要创新点
1.5 组织结构
第2章 研究基础
2.1 测试集合及评测标准
2.1.1 测试集合
2.1.2 评测标准
2.2 话题识别与追踪相关研究
2.2.1 发展历程
2.2.2 相关概念
2.2.3 研究任务
2.2.4 实现方法
2.2.5 经典话题模型及扩展研究
2.3 贝叶斯网络理论
2.3.1 贝叶斯网络的概率基础
2.3.2 贝叶斯网络的结构
2.3.3 贝叶斯网络的推理
2.3.4 基于贝叶斯网络的信息检索模型
2.4 本章小结
第3章 话题特征选择
3.1 引言
3.2 特征选择理论
3.2.1 基于搜索策略的特征选择方法
3.2.2 基于评价准则的特征选择方法
3.3 基于ITF-IDF的话题特征选择
3.4 坐标下降法
3.5 基于聚类的互信息
3.6 基于DCMI的话题特征选择
3.6.1 动态互信息
3.6.2 特征子集规模的确定
3.7 实验与分析
3.7.1 目标函数求解
3.7.2 DCMI和BMI性能比较
3.7.3 DCMI和ITF-IDF的追踪性能
3.7.4 实验分析
3.8 本章小结
第4章 基于信念网络的静态话题模型
4.1 引言
4.2 静态话题模型理论
4.3 基于信念网络的静态话题模型Ⅰ
4.4 基于信念网络的静态话题模型Ⅱ
4.4.1 建模基础
4.4.2 模型拓扑结构及概率推导
4.5 实验与分析
4.5.1 实验过程
4.5.2 实验结果及分析
4.6 本章小结
第5章 基于信念网络的动态话题模型
5.1 引言
5.2 动态话题模型理论
5.2.1 自适应学习理论
5.2.2 增量式学习算法
5.2.3 结构化话题模型的动态变形
5.3 基于信念网络的动态话题模型Ⅰ
5.4 基于信念网络的动态话题模型Ⅱ
5.5 实验与分析
5.5.1 实验过程
5.5.2 实验结果
5.5.3 实验分析
5.6 本章小结
第6章 误报检测用于优化基于信念网络的动态话题模型Ⅱ
6.1 引言
6.2 主流静态分析技术
6.3 动态话题追踪误报成因分析
6.4 误报检测
6.5 实验与分析
6.5.1 实验步骤
6.5.2 实验结果及分析
6.6 本章小结
第7章 动态话题追踪中的时序权重
7.1 研究基础
7.2 时序权重及动态更新
7.3 实验及分析
7.3.1 时间距离阈值
7.3.2 权重阈值
7.3.3 时序权重有效性验证
7.4 本章小结
第8章 基于话题的事件相似度计算
8.1 基础知识
8.1.1 相关概念
8.1.2 模板设计
8.2 事件相似度计算
8.3 同一话题下的事件相似度计算方法
8.4 实验内容及分析
8.5 本章小结
第9章 总结与展望
9.1 本书的主要工作
9.2 对今后工作的展望
內容試閱
话题识别与追踪作为一项旨在帮助人们应对信息过载问题的研究,现阶段主要以网络新媒体中的信息流为处理对象,自动发现话题并把话题相关的内容联系在一起,其实现过程涉及5个子任务,分别是报道切分、首报道检测、关联检测、话题追踪和话题检测。话题识别与追踪技术可用来监控各种语言信息源,在新话题出现时发出警告。在早期研究中,考虑到话题识别与追踪和信息检索的共性,研究者们尝试将信息检索领域的相关技术应用于该领域。但二者之间亦存在不同,例如信息检索一般具备背景知识和先验需求,而话题识别与追踪是在对话题毫无了解的情况下进行识别与追踪,所以完全将信息检索技术移植到话题识别与追踪是不合理的,但是二者的本源性模型构建基本相通。
针对话题模型的前瞻性研究来自Allan等,他们借用信息检索领域广泛采纳的向量空间模型描述话题的特征空间。虽然向量空间模型是目前常用的话题模型之一,但该模型的缺点是不能很好地融合静态话题模型和动态话题模型的优点从而成功解决二者孰优孰劣的问题,且在解决话题漂移问题时能力有限。信息检索领域主要包括三个模型:布尔模型、向量空间模型和概率模型。向量空间模型在话题识别与追踪领域中的成功应用,从理论上验证了概率模型亦可应用于话题识别与追踪。贝叶斯网络模型是重要的概率模型之一,包括推理网络模型、信念网络模型和BNR模型。在过去几十年,贝叶斯网络模型已成功应用于信息检索领域,但目前尚未有人将其应用于话题识别与追踪,本书在这方面做了相关研究,试图为该领域提出新的研究方法。
本书结合信念网络模型和新闻报道的特点,给出四个基于信念网络的话题模型BSTM-I、BSTM-II、BDTM-I和BDTM-II。BSTM-I包括三类节点:新报道节点、术语节点和话题节点,弧体现节点间的隶属关系。BSTM-II在BSTM-I的基础上加入事件节点,弧的指向和意义不变,为体现核心报道、核心事件的重要性,BSTM-II对核心报道、核心事件中的术语权重进行了两次线性提高调整。BDTM-I属于动态话题模型,节点类型和弧的意义与上述模型相同,不同的是在话题追踪过程中,其术语层会随着话题的发展而不断更新,重复出现的术语权重采用求和平均的方法更新,新出现的术语作为新的节点插入术语层。以上三个话题模型沿用传统建模思想,具备和以往模型相同的优缺点。BDTM-II打破传统建模的思想,运用信念网络模型提供了一个灵活框架的优势,将术语节点分为两类:初始核心术语节点和更新术语节点,并采用析取手段将它们作为两类证据进行归并。依据模型的拓扑结构、贝叶斯概率及条件独立性假设,本书给出了上述四个模型计算新闻报道和话题相似度的概率推导过程,用于判断新的新闻报道是否和话题相关。
为进一步提高话题识别与追踪系统的综合性能,本书进行了系统的优化研究。特征选择是话题模型构建的基础,互信息是文本处理领域一种有效的特征选择方法。在基本互信息的基础上,将出现相同高频词的新闻报道进行聚类,计算聚类后术语的互信息,将追踪到的相关报道的发生时间和话题的发生时间量化为时间距离,使其反比影响互信息的动态更新,得到基于聚类的动态互信息计算方法,用于计算新闻报道中术语的权重。为了获得TDT4语料中每个话题的初始特征子集规模,给出基于类内距离最小、类间距离最大的目标函数,并采用坐标下降法对其求解,最终完成新闻语料的特征选择。
动态话题模型的典型缺点是误报率较高,优点是其可以体现话题的动态演化过程。如果能在保持动态话题模型优点的同时,降低其误报率,将是该领域的一个新的突破点。本书通过系统分析动态话题追踪的误报原因,提出动态话题追踪中的误报检测。该方法首先分析时间距离、相似度差值、相似话题分布及与核心内容相似度分别如何影响误报检测,然后通过将这四项内容线性调和得到误报检测因子的计算方法,用于判断追踪到的相关报道是否属于误报,若属于误报,则对部分特征权重进行衰减,并确定模型结构是否需要调整。实验采用TDT4语料,结合DET曲线验证以上研究内容的合理性和有效性。
专著的出版受到如下项目经费支持:河北大学双一流专项资金项目、河北大学中西部提升综合实力专项资金项目、河北省教育厅青年基金项目话题特征选择方法研究(QN2015099)、河北省自然科学基金项目基于贝叶斯网络的话题识别与追踪方法研究(F2015201142)、河北省社会科学基金项目京津冀协同发展网络热点话题发现及其应用研究(HB15SH064)。
感谢我的博士生导师徐建民先生,是他最初帮我选定了这个研究方向,并在研究工作中对我做出了悉心的指导;感谢本书第二作者中央司法警官学院朱杰博士;感谢我的领导及同事杨会良教授、宛玲教授、杨秀丹教授、郭子雪教授,他们给我提供了进行科研的条件及工作支持;感谢我的师弟王丹青、张猛、武晓波、粟武林、李腾飞,师妹刘畅、孙晓磊等,他们帮我搜集了部分材料并协助我完成了大量的实验。
由于本人水平所限,所做研究尚有不足,欢迎相关研究者批评指正。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.