登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』大规模元搜索引擎技术

書城自編碼: 3006127
分類: 簡體書→大陸圖書→計算機/網絡數據庫
作者: [美]孟卫一[Weiyi Meng]
國際書號(ISBN): 9787111556176
出版社: 机械工业出版社
出版日期: 2017-05-01
版次: 1 印次: 1
頁數/字數: 143/145000
書度/開本: 16开 釘裝: 平装

售價:NT$ 497

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
史铁生:听风八百遍,才知是人间(2)
《 史铁生:听风八百遍,才知是人间(2) 》

售價:NT$ 254.0
量子网络的构建与应用
《 量子网络的构建与应用 》

售價:NT$ 500.0
拍电影的热知识:126部影片里的创作技巧(全彩插图版)
《 拍电影的热知识:126部影片里的创作技巧(全彩插图版) 》

售價:NT$ 500.0
大唐名城:长安风华冠天下
《 大唐名城:长安风华冠天下 》

售價:NT$ 398.0
情绪传染(当代西方社会心理学名著译丛)
《 情绪传染(当代西方社会心理学名著译丛) 》

售價:NT$ 403.0
中国年画 1950-1990 THE NEW CHINA: NEW YEAR PICTURE 英文版
《 中国年画 1950-1990 THE NEW CHINA: NEW YEAR PICTURE 英文版 》

售價:NT$ 1100.0
革命与反革命:社会文化视野下的民国政治(近世中国丛书)
《 革命与反革命:社会文化视野下的民国政治(近世中国丛书) 》

售價:NT$ 435.0
画楼:《北洋画报》忆旧(年轮丛书)
《 画楼:《北洋画报》忆旧(年轮丛书) 》

售價:NT$ 1573.0

建議一齊購買:

+

NT$ 428
《 这就是搜索引擎:核心技术详解 》
內容簡介:
本书广泛而深入地介绍了大规模元搜索引擎技术,详细讨论了大规模元搜索引擎的主要部件——搜索引擎选择、搜索引擎加入和结果合并,重点关注部件的高度可扩展性和自动化解决方案。作为Web搜索的竞争技术,本书对大规模元搜索引擎技术的可行性进行了强有力的论证。本书可作为高等院校Web数据管理和信息检索等Web技术相关课程的教材,也可作为Web搜索领域的研究人员的参考书。
關於作者:
Weiyi Meng孟卫一 纽约州立大学宾汉姆顿分校计算机系教授,数据库实验室主席,IEEE ICTA国际会议程序委员会主席,美国元搜索引擎公司Webscalers创始人之一。孟卫一教授在互联网信息检索特别是元数据搜索引擎方面是国际公认的权威,取得多项研究成果并开发出可用的系统,现为人民大学客座教授。
Clement T. Yu 伊利诺伊大学芝加哥分校计算机科学教授。研究方向包括多媒体信息检索、元搜索引擎、数据管理等。
目錄
丛书前言
译者序
前 言
作者简介
第1章 绪言1
1.1 Web上查找信息3
1.1.1 浏览3
1.1.2 搜索4
1.2 文本检索概述7
1.2.1 系统体系结构7
1.2.2 文档表示8
1.2.3 文档-查询匹配9
1.2.4 查询处理11
1.2.5 检索有效性度量13
1.3 搜索引擎技术概述14
1.3.1 Web的专门特性14
1.3.2 Web爬虫15
1.3.3 利用标签信息17
1.3.4 利用链接信息18
1.3.5 结果组织23
1.4 本书概述25
第2章 元搜索引擎体系结构27
2.1 系统体系结构28
2.2 为什么使用元搜索引擎技术33
2.3 挑战环境39
2.3.1 异构及其影响40
2.3.2 规范化研究43
第3章 搜索引擎选择47
3.1 粗糙表记方法49
3.2 基于学习的方法50
3.3 基于样本文档的方法55
3.4 统计表记方法59
3.4.1 D-WISE 59
3.4.2 CORINet 61
3.4.3 gGlOSS 63
3.4.4 潜在有用文档数目65
3.4.5 最相似文档的相似度68
3.4.6 搜索引擎表记生成72
第4章 搜索引擎加入77
4.1 搜索引擎连接77
4.1.1 搜索引擎的HTML表单标签78
4.1.2 搜索引擎自动连接81
4.2 搜索结果抽取86
4.2.1 半自动包装器生成88
4.2.2 自动包装器生成93
第5章 结果合并108
5.1 基于完全文档内容的合并111
5.2 基于搜索结果记录的合并113
5.3 基于结果本地排序的合并119
5.3.1 基于轮转的方法120
5.3.2 基于相似度转换的方法121
5.3.3 基于投票的方法124
5.3.4 基于机器学习的方法130
第6章 总结与后续研究132
参考文献136
內容試閱
‖丛书前言陈寅恪先生说:“一时代之学术,必有其新材料与新问题。取用此材料,以研求问题,则为此时代学术之新潮流。治学之士,得预于此潮流者,谓之预流借用佛教初果之名。其未得预者,谓之未入流。”对今天的信息技术而言,“新材料”即为大数据,而“新问题”则是产生于“新材料”之上的新的应用需求。
当下大数据技术发展变化日新月异,大数据应用已经遍及工业和社会生活方方面面,原有的数据管理理论体系与大数据产业应用之前的差距日益加大,而工业界对于大数据人才的需求却极剧增加。大数据专业人才的培养是新一轮科技较量的基础,高等院校承担着大数据人才培养的重任。因此大数据相关课程将逐渐成为国内高校计算机相关专业的重要课程。近来越来越多的院校急切地开设大数据方面的人才培养计划,以求占得“先机”。但纵观大数据人才培养课程体系尚不尽如人意,多是已有课程的“冷拼盘”,顶多是加点“调料”,原材料没有新鲜感。现阶段无论多么新多么好的人才培养计划,都只能在六七十年代编写的计算机知识体系上施教,无法把当下的大数据带给我们的新思维方式和知识体系传导给学生。
为此我们意识到,缺少基础性工作和原始积累,就难以培养符合工业界需要的大数据复合型和交叉型人才。因此急需在思维和理念方面进行转变,为现有的课程和知识体系按大数据应用需求进行延展和补充,加入新的可以因材施教的知识模块。每一位学者都有责任和义务去为此“增砖添瓦”。
在此背景下,我们策划和组织了这套大数据管理丛书,希望能够培养数据思维的理念,对原有数据管理知识体系进行完善和补充,面向新的技术热点,提出新的知识体系知识点,拉近教材体系与大数据应用的距离,为受教者应对现代技术带来的大数据领域的新问题和挑战,扫除障碍。现时要求学者编写大部头著作费时费力,不太现实。这使我们想到上世纪八九十年代风靡一时的“五角丛书”,它短小精湛,题材丰富,选题新颖,恰到好处地迎合了那个时代人们对新知识的渴望,因此成为了那个时代的共同记忆。所以我们受此启发,选择了这种更容易实现的“五角丛书”的形式,促使学者们力所能及地把各自工作中的积累呈现给大家,为大数据人才培养的“大厦”增砖添瓦。我们相信,假以时日,这些小部头的著作汇溪成河,必将对未来大数据人才培养起到“基石”的作用。
丛书定位:面向新形式下的大数据技术发展对人才培养提出的挑战,旨在为学术研究和人才培养提供可供参考的“基石”。虽然是一些不起眼的“砖头瓦块”,但可以为大数据人才培养积累可用的新模块新素材,弥补原有知识体系与应用问题之前的鸿沟,力图为现有的数据管理知识查漏补缺,聚少成多,最终形成适应大数据技术发展和人才培养的知识体系和教材基础。
丛书特点:丛书借鉴Morgan&ClaypoolPublishers出版的SynthesisLecturesonDataManagement,特色在于选题新颖,短小精湛。选题新颖即面向技术热点,弥补现有知识体系的漏洞和不足或延伸或补充,内容涵盖大数据管理的理论、方法、技术等诸多方面。短小精湛则不求系统性和完备性,但每本书要自成知识体系,重在阐述基本问题和方法,并辅以例题说明,便于施教。
丛书组织:丛书采用国际学术出版通行的主编负责制,为此特邀中国人民大学孟小峰教授email:xfmeng@ruc.edu.cn担任丛书主编,负责丛书的整体规划和选题。责任编辑为机械工业出版社华章分社姚蕾编辑email:yaolei@hzbook.com。
在此期望有志于大数据人才培养并具有丰富理论和实践经验的学者和专业人员能够加入到这套书的编写工作中来,共同为中国大数据研究和人才培养贡献自己的智慧和力量,共筑属于我们自己的“时代记忆”。欢迎读者对我们的出版工作提出宝贵意见和建议。
丛书即将出版书目:大数据管理概论孟小峰主编2017年2月出版异构信息网络挖掘原理和方法[美]孙艺洲YizhouSun韩家炜JiaweiHan著;段磊朱敏唐常杰译2017年1月出版大规模元搜索引擎技术[美]孟卫一WeiyiMeng於德ClementT.Yu著;朱亮译2017年1月大数据集成[美]董欣XinLunaDong戴夫士·斯里瓦斯塔瓦DiveshSrivastava著王秋月杜治娟王硕译2017年2月短文本数据理解王仲远等编著2017年2月个人数据管理李玉坤孟小峰编著2017年3月位置大数据隐私保护潘晓霍峥孟小峰编著2017年3月移动大数据挖掘连德富张富峥王英子袁晶谢幸编著2017年3月云数据管理挑战与机遇[美]迪卫艾肯特·阿格拉沃尔DivyakantAgrawal苏迪皮托·达斯SudiptoDas阿姆鲁·埃尔·阿巴迪AmrElAbbadi著;马友忠等译2017年3月流数据管理[加]卢卡斯· 戈拉布LukaszGolab [德]M · 塔纳· 顾兹叙M.Tamer?zsu著;禹晓辉译2017年3月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.