登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』大数据技术原理与应用

書城自編碼: 3797685
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 程秀峰,严中华
國際書號(ISBN): 9787030729576
出版社: 科学出版社
出版日期: 2022-09-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 398

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
塔西佗(全二册)(二十世纪人文译丛)
《 塔西佗(全二册)(二十世纪人文译丛) 》

售價:NT$ 1800.0
(棱镜精装人文译丛)思想的假死
《 (棱镜精装人文译丛)思想的假死 》

售價:NT$ 290.0
当代精神分析新论
《 当代精神分析新论 》

售價:NT$ 430.0
宋初三先生集(中国思想史资料丛刊)
《 宋初三先生集(中国思想史资料丛刊) 》

售價:NT$ 990.0
棕榈油的全球史 : 从奴隶船到购物篮
《 棕榈油的全球史 : 从奴隶船到购物篮 》

售價:NT$ 440.0
简帛时代与早期中国思想世界(上下册)(王中江著作系列)
《 简帛时代与早期中国思想世界(上下册)(王中江著作系列) 》

售價:NT$ 1400.0
进化主义在中国的兴起(王中江著作系列)
《 进化主义在中国的兴起(王中江著作系列) 》

售價:NT$ 950.0
不废风雅 生活的意趣(汪曾祺风雅意趣妙文)
《 不废风雅 生活的意趣(汪曾祺风雅意趣妙文) 》

售價:NT$ 280.0

建議一齊購買:

+

NT$ 454
《 机器学习算法与实现 —— Python编程与应用实例 》
+

NT$ 383
《 现代心理与教育统计学(第5版) 》
+

NT$ 254
《 传播学教程 第二版(21世纪新闻传播学系列教材;“十一五”国家级规划教材) 》
+

NT$ 335
《 法理学(第五版) 》
+

NT$ 319
《 设施农业工程实践案例解析(李建明) 》
+

NT$ 281
《 会计学(第4版) 》
內容簡介:
《大数据技术原理与应用》从大数据基础原理、大数据分析方法和大数据行业应用三个部分介绍大数据技术。《大数据技术原理与应用》共12章,内容包含大数据的基本概念,分布式基础架构Hadoop,分布式文件系统HDFS,NoSQL数据库,分布式计算框架MapReduce,大数据基本分析方法(聚类、分类与预测),大数据在搜索引擎、推荐系统以及其他行业的应用。《大数据技术原理与应用》在前7章设置8个实验,帮助读者初步掌握大数据技术、大数据分析与大数据应用的相关知识与操作技能。
目錄
目录前言第1章 大数据概述 11.1 什么是大数据 11.1.1 关于大数据的预言 11.1.2 触发大数据产生的三种技术 21.1.3 大数据形成中遇到的问题及解决方案 31.1.4 各方对大数据的定义 41.2 大数据的类型与特征 41.2.1 按照数据结构分类 41.2.2 按照生产主体分类 61.2.3 按照作用方式分类 61.2.4 大数据的特征 71.3 大数据的思维方式 81.4 大数据的技术流程 91.4.1 总体处理流程 91.4.2 数据采集与数据预处理 101.4.3 数据存储 101.4.4 数据分析与数据挖掘 111.5 主流的大数据平台 111.5.1 Hadoop 121.5.2 Spark 121.5.3 Storm 131.5.4 Flink 131.5.5 主流的大数据平台比较 141.6 大数据集群的部署方式 141.6.1 分布式 141.6.2 云架构 151.7 实验1:熟悉虚拟环境、Linux、Java 171.7.1 安装VMware 171.7.2 Linux基本命令 211.7.3 在Linux中安装Java环境 221.8 习题与思考 23第2章 分布式基础架构Hadoop 242.1 什么是Hadoop 242.2 Hadoop的发展历史 252.3 Hadoop的基本特性 272.4 深入了解Hadoop 282.4.1 Hadoop的体系结构 282.4.2 Hadoop的并行开发 302.4.3 Hadoop的生态系统 312.5 Hadoop与其他技术和框架 332.5.1 Hadoop与关系型数据库 332.5.2 Hadoop与云计算 342.6 实验2:快速搭建Hadoop集群环境 342.6.1 准备工作 342.6.2 安装配置虚拟机 352.6.3 配置固定IP并测试 352.6.4 克隆虚拟机 362.6.5 配置SSH无密码登录 362.6.6 配置时间同步服务 372.6.7 安装JDK 382.6.8 上传、解压Hadoop安装包 382.6.9 配置Hadoop 382.6.10 启动集群 412.6.11 查看集群监控 412.7 习题与思考 42第3章 分布式文件系统HDFS 433.1 什么是HDFS 433.1.1 文件系统和计算机集群 433.1.2 分布式文件系统 433.1.3 HDFS 453.1.4 HDFS的优点和缺点 483.2 HDFS中的概念 483.2.1 块 493.2.2 三级寻址和元数据 493.2.3 命名空间 503.2.4 名称节点 513.2.5 第二名称节点 523.2.6 数据节点 533.2.7 客户端 543.2.8 心跳机制 543.2.9 块缓存 543.3 HDFS的存储原理 553.3.1 冗余存储机制 553.3.2 数据存取策略 553.3.3 数据的错误与恢复 563.4 HDFS的数据读写过程 573.4.1 RPC实现流程 573.4.2 文件的读流程 583.4.3 文件的写流程 593.5 HDFS的命令、界面及API 603.5.1 HDFS的主要命令 603.5.2 HDFS的Web界面 613.5.3 HDFS常用的Java API 613.6 实验3:HDFS编程实践 623.6.1 在Eclipse中创建项目 633.6.2 为项目添加需要用到的JAR包 633.6.3 编写Java应用程序 633.6.4 编译运行程序 653.6.5 应用程序的部署 653.7 习题与思考 67第4章 NoSQL数据库 684.1 关系型数据库 684.1.1 关系模型 694.1.2 设计数据库 714.1.3 使用数据库 724.1.4 数据库恢复和数据保护 734.2 非关系型数据库NoSQL 744.2.1 关系型数据库和NoSQL的比较 754.2.2 NoSQL的基础理论 764.3 NoSQL数据库的分类 794.3.1 列族数据库 804.3.2 键值数据库 824.3.3 文档数据库 834.3.4 图数据库 844.3.5 四种NoSQL数据库的比较 854.4 列族数据库—HBase 854.4.1 HBase概述 854.4.2 HBase的数据模型 864.4.3 HBase的实现原理 884.4.4 HBase的系统架构 914.5 实验4:HBase的基本操作 924.5.1 HBase的安装 924.5.2 HBase的配置 934.5.3 使用Shell命令操作HBase 954.5.4 用程序操作HBase 964.6 文档数据库MongoDB 1004.6.1 MongoDB概述 1004.6.2 MongoDB的体系结构 1014.6.3 MongoDB的数据类型 1044.7 实验5:MongoDB的基本操作 1074.7.1 MongoDB的安装 1074.7.2 MongoDB的基本操作 1084.7.3 MongoDB的索引操作 1144.7.4 MongoDB的聚合操作 1154.8 习题与思考 117第5章 MapReduce原理 1185.1 什么是MapReduce 1185.1.1 MapReduce模型 1185.1.2 MapReduce函数 1205.2 MapReduce的体系架构 1225.2.1 MapReduce的工作主体 1225.2.2 MapReduce的工作流程 1245.2.3 MapReduce的执行过程 1255.2.4 Map任务和Reduce任务 1275.3 Shuffle的具体过程 1275.3.1 Shuffle过程简介 1285.3.2 输入数据和执行Map任务 1295.3.3 Partition操作 1295.3.4 Sort操作 1305.3.5 Combine操作 1305.3.6 Merge操作 1315.4 MapReduce的数学应用 1325.4.1 在关系代数运算中的应用 1325.4.2 分组与聚合运算 1335.4.3 矩阵-向量乘法 1335.4.4 矩阵乘法 1345.5 习题与思考 135第6章 MapReduce实践案例 1366.1 实验6:WordCount 1366.1.1 实验需求 1366.1.2 实验设计 1366.1.3 执行过程 1376.1.4 实验分析 1386.1.5 WordCount编程实践 1396.2 实验7:MapReduce统计气象数据 1426.2.1 实验需求 1426.2.2 数据格式 1426.2.3 实验分析 1436.3 习题与思考 147第7章 基于大数据的聚类分析 1487.1 聚类分析概述 1487.1.1 聚类分析的定义 1487.1.2 聚类算法的分类 1497.1.3 相似性的测度 1507.2 基于划分的聚类算法k-means 1537.2.1 k-means聚类算法 1537.2.2 k-means聚类算法的拓展 1557.3 层次聚类算法 1577.3.1 AGNES算法 1587.3.2 DIANA算法 1607.4 实验8:k-means算法的MapReduce实现 1617.4.1 实验内容与实验要求 1617.4.2 实验数据与实验目标 1627.4.3 实现思路 1627.4.4 代码实现 1637.4.5 实验结果 1647.5 习题与思考 166第8章 基于大数据的分类分析 1678.1 分类问题概述 1678.1.1 学习阶段 1678.1.2 分类阶段 1688.2 k-最近邻算法 1698.2.1 KNN算法原理 1698.2.2 KNN算法的特点及改进 1728.3 决策树分类方法 1738.3.1 决策树概述 1738.3.2 信息论 1778.3.3 ID3算法 1798.3.4 算法改进:C4.5算法 1838.4 贝叶斯分类方法 1878.4.1 贝叶斯定理 1888.4.2 朴素贝叶斯分类器 1898.4.3 朴素贝叶斯分类方法的改进 1928.5 习题与思考 195第9章 基于大数据的预测分析 1969.1 大数据预测方法概述 1969.1.1 预测的定义 1969.1.2 预测方法的划分 1969.1.3 预测的基本步骤 1999.2 回归分析预测 2019.2.1 回归分析概述 2019.2.2 线性回归 2019.2.3 多项式回归 2049.2.4 逻辑斯谛回归 2059.3 时间序列预测 2089.3.1 时间序列概述 2089.3.2 时间序列平滑法 2109.4 习题与思考 215第10章 大数据在搜索引擎中的应用 21610.1 应用现状概述 21610.1.1 搜索引擎的概念 21610.1.2 国内外搜索引擎的应用现状 21610.1.3 大数据与搜索引擎优化 21710.2 基本实现原理 21710.3 搜索引擎的大数据时代 22110.3.1 谷歌的大数据应用 22110.3.2 百度的大数据应用 22210.3.3 雅虎的大数据应用 22410.4 习题与思考 224第11章 大数据在推荐系统中的应用 22611.1 应用现状概述 22611.1.1 推荐系统的概念 22611.1.2 推荐系统的应用 22711.2 基本实现原理 22711.2.1 推荐系统模型 22711.2.2 推荐系统的主要算法 22811.2.3 协同过滤实践 23311.3 应用案例 23611.3.1 智能推荐引擎 23711.3.2 智能推荐引擎系统架构 23711.3.3 用户画像 23811.4 习题与思考 238第12章 大数据在其他行业中的应用 23912.1 大数据行业应用

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.