新書推薦:
《
敢为天下先:三年建成港科大
》
售價:NT$
352.0
《
直观的经营:哲学视野下的动态管理
》
售價:NT$
407.0
《
长高食谱 让孩子长高个的饮食方案 0-15周岁儿童调理脾胃食谱书籍宝宝辅食书 让孩子爱吃饭 6-9-12岁儿童营养健康食谱书大全 助力孩子身体棒胃口好长得高
》
售價:NT$
214.0
《
身体自愈力:解决内在病因的身体智慧指南
》
售價:NT$
449.0
《
非言语沟通经典入门:影响人际交往的重要力量(第7版)
》
售價:NT$
560.0
《
山西寺观艺术壁画精编卷
》
售價:NT$
7650.0
《
中国摄影 中式摄影的独特魅力
》
售價:NT$
4998.0
《
山西寺观艺术彩塑精编卷
》
售價:NT$
7650.0
|
內容簡介: |
目前,人类面临着矛盾的局面,即信息量大幅增加导致信息掌握整体水平下降,使得不同领域的分析活动不断复杂化。
现如今,互联网已成为世界范围内自给自足的媒体环境,它正逐渐成为信息重要的来源之一。随着用户需求水平不断提升,现有网络分析技术越来越难以满足用户需要,不仅对专业分析人士,对于普通用户亦是如此。尽管实际上所有已知的搜索服务可以搜索各种形式的文档,访问新闻消息、全文文档、多媒体文档,但这种局面仍然存在。网络分析包括对现代计算机网络信息内容的分析、超大规模动态信息库(大数据)的覆盖和检索,不断出现在全球网络环境中的信息流,要求新的方法来确定信息流中消费者或目标群体需要的知识及服务。
为了提供各个领域的信息分析活动,有必要实施涵盖所有信息工作流程的理论基础信息技术,包括监测、信息流聚合、分析概括、可视化操作。
本书致力于研究信息分析活动的理论基础和信息技术问题,书中分析了涉及广泛信息空间的发展、信息流动态和内容、网络信息领域里的导航和搜索的可能性,现代信息检索系统技术、信息分析处理与归纳方法、监测技术基础、信息的自适应聚合和泛化等问题,后是构建适应信息和分析活动任务的适应性文献库这一实际应用。
尽管这本书主要面向自动化信息分析处理领域的专业人士、本科生和研究生,但相信,该书对于竞争情报领域的分析师和专家来说,也将十分受用,使用本书提出的方法与信息技术将能够提高其工作效率和质量。前 言
广泛领域的分析活动涉及信息处理、对信息处理的深度理解、对特定情况的分析决策、获取补充信息、分析与研究问题相关的所有可用信息,信息专题处理、分析报告的可视化处理、分析报告的验证、新知识获取方法及管理方法等。
目前,发展监测方法和手段,以自适应地聚合和推广来自全球计算机网络的信息流,支持各种应用领域的信息和分析活动,已成为迫切需要解决的问题。同时,为了及时获取有关计算机网络的多维和客观信息,进一步用于各种分析活动,需要采用现代技术解决方案。
用户分析师发展信息空间的演变涵盖3个主要阶段。
着手于互联网上的工作时,用户首先转向选定的信息来源——网站、档案馆或数据库(Database,DB),不断监测新材料出现时的变化和动态,即独立监测信息空间的这些环节。
使用网络空间资源的下一步通常是运用网络信息检索系统(Information Retrieval System,IRS),每个系统都有自己的特点,但当今处于垄断地位的毫无疑问是Google、百度和Yandex(Google面向全球,百度主要针对中国用户,Yandex面向俄罗斯和乌克兰用户)。
通常,有经验的用户还会使用集合常规网络 IRS功能的专用元素搜索系统(MRS)。其中一些系统拥有适应用户信息需求的功能。
信息空间具有信息多源、多领域的特点。来自于这些信息源的信息流集合构成了既保障应用又保障存储的信息环境,同时增强了信息的再现。因此,本书部分主要讨论信息空间和信息流的概念。描述了信息流的定性和正式定义,它被理解为连续动态中不断变化、相互关联的消息信息集合,即被创建、开发、修改和回收的文档集合。 考虑了信息流研究的各种方法——从简单的线性方程模型到现代协同系统。章还探讨了互联网中的信息源,以及形成内容相关文件集群的模型和机制,这些内容相关文件形成主题或基于事件的动态信息图。
第二章主要研究信息检索、全球信息网络导航的算法和方法。 这一章重点讨论了元搜索系统、分散搜索的模型与技术及对等系统(PeertoPeer System)。
第三章涉及与文本深入分析相关的信息流的内容分析。这一章讨论了信息的语义处理方法、分类和聚类分析算法、提取概念和自动生成报告的方法。第三章主要关注计算机语言学、文本信息的重复性、相似性和排序问题。同时,本章也反映了复杂网络 (Complex Network) 的现代概念与计算机语言学任务之间的相互联系。
第四章主要介绍了信息流自适应聚合的技术基础,也就是形成适应用户需求的信息空间片段。逻辑上,信息的聚合与其信息空间内对应集群特定请求的信息流的划分相关。另外,本章详细讨论了构建企业元搜索系统的原理。作为信息聚合概念实施的一个例子,第四章研究了Doc’s Bundle公司系统,主要处理以PDF格式呈现的文档流。Doc’s Bundle系统的元素之一是元搜索模块,它生成了文档流,即在Google、Yandex、Bing等的网络搜索引擎中搜索结果的聚合。 第四章还详细介绍了企业元搜索系统的典型用户界面。
|
|