新書推薦:
《
爱你,是我做过最好的事
》
售價:NT$
254.0
《
史铁生:听风八百遍,才知是人间(2)
》
售價:NT$
254.0
《
量子网络的构建与应用
》
售價:NT$
500.0
《
拍电影的热知识:126部影片里的创作技巧(全彩插图版)
》
售價:NT$
500.0
《
大唐名城:长安风华冠天下
》
售價:NT$
398.0
《
情绪传染(当代西方社会心理学名著译丛)
》
售價:NT$
403.0
《
中国年画 1950-1990 THE NEW CHINA: NEW YEAR PICTURE 英文版
》
售價:NT$
1100.0
《
革命与反革命:社会文化视野下的民国政治(近世中国丛书)
》
售價:NT$
435.0
|
編輯推薦: |
(1)畅销书《高性能Linux服务器构建实战:运维监控、性能调优与集群应用》姊妹篇,资深运维专家和架构师多年经验结晶
(2)以实际生产环境为背景,从系统安全、故障排查、自动化运维、集群架构4个维度讲解构建大规模和高性能Linux服务器集群所需技术、工具、方法和技巧
|
內容簡介: |
本书共14章,分为四个部分:安全运维篇(第1~3章)主要讲解服务器安全运维、网络安全运维和数据安全运维的关键技术和方法;运维故障排查篇(第4~5章)从服务器系统和应用软件两个维度讲解运维故障的排查思路,以及常见的和经典的运维故障的解决方案;自动化运维篇(第6~9章)主要讲解海量主机的自动化部署和配置、自动化监控、分布式监控等大规模集群运维所需的各种工具(pssh、pdsh、mussh、Ganglia、nagios、Centreon等)和方法;集群架构篇(第10~14章)讲解如何构建和优化基于Web和MySQL数据库的高性能集群和高可用的负载均衡集群。
|
關於作者: |
高俊峰(南非蚂蚁)
资深运维专家、系统架构师、DBA和技术顾问,从事LinuxUnix服务器系统的架构、运维和管理多年。擅长大规模服务器集群的运维和管理,在故障诊断与排除、自动化运维、安全运维、性能调优、虚拟化等方面积累了大量的实战经验。国内知名IT技术社区51CTO的博客专家和ChinaUnix论坛高可用集群版块的版主,同时还活跃于ITPUB等技术社区,在社区和论坛里发表了大量技术文章,深受欢迎。此外,他还著有畅销书《循序渐进Linux》和《高性能Linux服务器构建实战:运维监控、性能调优与集群应用》,后者是本书的姊妹篇,成为Linux运维领域公认的经典著作。
|
目錄:
|
目录Contents
前言
第一部分 安全运维篇
第1章 Linux服务器安全运维3
1.1 账户和登录安全3
1.1.1 删除特殊的用户和用户组3
1.1.2 关闭系统不需要的服务4
1.1.3 密码安全策略5
1.1.4 合理使用su、sudo命令9
1.1.5 删减系统登录欢迎信息11
1.1.6 禁止Control-Alt-Delete键盘关闭命令12
1.2 远程访问和认证安全12
1.2.1 远程登录取消telnet而采用SSH方式12
1.2.2 合理使用shell历史命令记录功能14
1.2.3 启用tcp_wrappers防火墙16
1.3 文件系统安全18
1.3.1 锁定系统重要文件18
1.3.2 文件权限检查和修改20
1.3.3 tmp、vartmp、devshm安全设定21
1.4 系统软件安全管理22
1.4.1 软件自动升级工具yum23
1.4.2 yum的安装与配置23
1.4.3 yum的特点与基本用法25
1.4.4 几个不错的yum源27
1.5 Linux后门入侵检测工具28
1.5.1 rootkit后门检测工具chkrootkit29
1.5.2 rootkit后门检测工具RKHunter31
1.6 服务器遭受攻击后的处理过程35
1.6.1 处理服务器遭受攻击的一般思路35
1.6.2 检查并锁定可疑用户36
1.6.3 查看系统日志37
1.6.4 检查并关闭系统可疑进程37
1.6.5 检查文件系统的完好性38
1.7 一次Linux被入侵后的分析39
1.7.1 受攻击现象39
1.7.2 初步分析40
1.7.3 断网分析系统40
1.7.4 寻找攻击源41
1.7.5 查找攻击原因42
1.7.6 揭开谜团43
1.7.7 如何恢复网站43
第2章 Linux网络安全运维45
2.1 网络实时流量监测工具iftop45
2.1.1 iftop能做什么45
2.1.2 iftop的安装45
2.1.3 使用iftop监控网卡实时流量46
2.2 网络流量监控与分析工具Ntop和Ntopng49
2.2.1 Ntop与MRTG的异同49
2.2.2 Ntop与Ntopng的功能介绍49
2.2.3 安装Ntop与Ntopng50
2.2.4 Ntop和Ntopng的使用技巧53
2.3 网络性能评估工具iperf60
2.3.1 iperf能做什么60
2.3.2 iperf的安装与使用61
2.3.3 iperf应用实例62
2.4 网络探测和安全审核工具nmap67
2.4.1 nmap和Zenmap简介67
2.4.2 nmap基本功能与结构67
2.4.3 nmap的安装与验证68
2.4.4 nmap的典型用法68
2.4.5 nmap主机发现扫描70
2.4.6 nmap端口扫描71
2.4.7 nmap版本侦测73
2.4.8 nmap操作系统侦测74
第3章 数据安全工具DRBD、extundelete77
3.1 数据镜像软件DRBD介绍77
3.1.1 DRBD的基本功能77
3.1.2 DRBD的构成78
3.1.3 DRBD与现在的集群的关系78
3.1.4 DRBD的主要特性79
3.2 DRDB的安装与配置80
3.2.1 安装环境说明80
3.2.2 DRBD的安装部署81
3.2.3 快速配置一个DRBD镜像系统82
3.3 DRBD的管理与维护83
3.3.1 启动DRDB83
3.3.2 测试DRBD数据镜像85
3.3.3 DRBD主备节点切换86
3.4 数据恢复软件extundelete介绍88
3.4.1 如何使用“rm -rf”命令88
3.4.2 extundelete与ext3grep的异同89
3.4.3 extundelete的恢复原理89
3.4.4 安装extundelete89
3.4.5 extundelete用法详解90
3.5 实战:extundelete恢复数据的过程91
3.5.1 通过extundelete恢复单个文件91
3.5.2 通过extundelete恢复单个目录93
3.5.3 通过extundelete恢复所有误删除数据93
3.5.4 通过extundelete恢复某个时间段的数据94
第二部分 运维故障排查篇
第4章 Linux系统运维故障排查思路97
4.1 Linux系统故障的处理思路97
4.2 Linux系统无法启动的解决方法98
4.2.1 文件系统破坏导致系统无法启动98
4.2.2 etcfstab文件丢失导致系统无法启动100
4.3 Linux系统无响应(死机)问题分析104
4.4 Linux下常见网络故障的处理思路105
4.4.1 检查网络硬件问题105
4.4.2 检查网卡是否正常工作105
4.4.3 检查DNS解析文件是否设置正确106
4.4.4 检查服务是否正常打开107
4.4.5 检查访问权限是否打开108
4.4.6 检查局域网主机之间联机是否正常109
第5章 Linux故障排查案例实战111
5.1 常见系统故障案例111
5.1.1 su切换用户带来的疑惑111
5.1.2 “Read-only file system”错误与解决方法114
5.1.3 “Argument list too long”错误与解决方法116
5.1.4 inode耗尽导致应用故障119
5.1.5 文件已删除但空间不释放的原因121
5.1.6 “Too many open files”错误与解决方法124
5.2 Apache常见错误故障案例127
5.2.1 “No space left on device”错误与解决方法127
5.2.2 apache20014故障与解决方法129
5.2.3 “could not bind to address 0.0.0.0:80”错误与解决方法131
5.3 因NAS存储故障引起的Linux系统恢复案例134
5.3.1 故障现象描述134
5.3.2 问题判断思路134
5.3.3 问题处理过程134
5.3.4 解决问题137
第三部分 自动化运维篇
第6章 轻量级运维利器pssh、pdsh和mussh141
6.1 并行SSH运维工具pssh141
6.1.1 pssh应用场景141
6.1.2 pssh的安装与用法142
6.1.3 pssh应用实例144
6.2 并行分布式运维工具pdsh147
6.2.1 pdsh应用场景147
6.2.2 pdsh的安装与语法148
6.2.3 pdsh应用实例149
6.3 多主机ssh封装器mussh153
6.3.1 mussh功能介绍153
6.3.2 mussh的安装与语法153
6.3.3 mussh应用实例154
第7章 分布式监控系统Ganglia157
7.1 Ganglia简介157
7.2 Ganglia的组成157
7.3 Ganglia的工作原理159
7.3.1 Ganglia数据流向分析159
7.3.2 Ganglia工作模式160
7.4 Ganglia的安装161
7.4.1 yum源安装方式161
7.4.2 源码方式162
7.5 配置一个Ganglia分布式监控系统164
7.5.1 Ganglia配置文件介绍164
7.5.2 Ganglia监控系统架构图164
7.5.3 Ganglia监控管理端配置164
7.5.4 Ganglia的客户端配置165
7.5.5 Ganglia的Web端配置166
7.6 Ganglia监控系统的管理和维护167
7.7 Ganglia监控扩展实现机制169
7.7.1 扩展Ganglia监控功能的方法169
7.7.2 通过gmetric接口扩展Ganglia监控169
7.7.3 通过Python插件扩展Ganglia监控170
7.7.4 实战:利用Python接口监控Nginx运行状态171
7.8 Ganglia在实际应用中要考虑的问题174
7.8.1 网络IO可能存在瓶颈174
7.8.2 CPU可能存在瓶颈175
7.8.3 gmetad写入rrd数据库可能存在瓶颈175
第8章 基于nagios的分布式监控报警平台Centreon177
8.1 Centreon概述177
8.2 Centreon的特点177
8.3 Centreon的结构178
8.4 安装Centreon+nagios监控系统179
8.4.1 安装支持Centreon的yum源180
8.4.2 安装系统基础依赖库180
8.4.3 安装nagios及nagios-plugins181
8.4.4 安装ndoutils181
8.4.5 安装nrpe182
8.4.6 安装Centreon182
8.4.7 安装配置Centreon Web191
8.4.8 启动Centreon相关服务195
8.4.9 安装问题总结196
8.5 配置Centreon监控系统197
8.5.1 添加主机和主机组197
8.5.2 批量添加主机202
8.5.3 监控引擎管理206
8.5.4 添加服务和服务组207
8.5.5 监控报警配置211
8.5.6 用户和用户权限管理217
8.6 配置分布式监控222
8.6.1 分布式监控架构与实现原理222
8.6.2 分布式监控搭建环境介绍223
8.6.3 监控软件的安装224
8.6.4 配置节点间SSH信任登录224
8.6.5 在Central server上添加分布式监控配置226
8.7 常见服务监控配置230
8.7.1 nagios插件编写规范231
8.7.2 监控Apache运行状态231
8.7.3 监控MySQL运行状态234
8.7.4 监控Hadoop HDFS运行状态237
8.8 桌面监控报警器Nagstamon239
第9章 通过Ganglia与Centreon构建智能化监控报警平台243
9.1 智能运维监控报警平台的组成243
9.2 Ganglia作为数据收集模块246
9.3 Centreon作为监控报警模块246
9.4 Ganglia与Centreon的无缝整合247
9.4.1 数据提取脚本247
9.4.2 实现Ganglia与Centreon完美整合256
9.5 在Centreon中实现批量数据收集与监控报警259
第四部分 集群架构篇
第10章 高性能Web服务器Nginx267
10.1 高性能Web服务器Nginx介绍267
10.1.1 Nginx的组成与工作原理267
10.1.2 Nginx的性能优势268
10.2 Nginx的安装269
10.2.1 安装Nginx依赖库269
10.2.2 快速安装Nginx270
10.3 配置与调试Nginx270
10.3.1 Nginx配置文件结构270
10.3.2 Nginx配置文件详解270
10.3.3 Nginx日常维护技巧276
10.4 Nginx常用功能介绍278
10.4.1 Nginx反向代理应用实例278
10.4.2 Nginx的URL重写应用实例282
10.5 案例:Nginx作为Web缓存服务器应用286
10.5.1 在Nginx下安装缓存服务器286
10.5.2 配置Nginx缓存服务器287
10.5.3 测试proxy_cache实现的缓存功能289
10.5.4 如何清除指定的URL缓存290
10.6 案例:Nginx作为负载均衡服务器应用290
10.6.1 Nginx的负载均衡算法291
10.6.2 Nginx的负载均衡配置实例291
10.7 Nginx性能优化技巧292
10.7.1 编译安装过程优化292
10.7.2 利用TCMalloc优化Nginx的性能293
10.7.3 Nginx内核参数优化295
第11章 高性能集群软件Keepalived297
11.1 Keepalived介绍297
11.1.1 Keepalived是什么297
11.1.2 VRRP协议与工作原理298
11.1.3 Keepalived工作原理298
11.1.4 Keepalived的体系结构299
11.2 Keepalived安装与配置301
11.2.1 Keepalived的安装过程301
11.2.2 Keepalived的全局配置303
11.2.3 Keepalived的VRRPD配置303
11.2.4 Keepalived的LVS配置307
11.3 Keepalived基础功能应用实例310
11.3.1 Keepalived基础HA功能演示310
11.3.2 通过vrrp_script实现对集群资源的监控316
11.3.3 Keepalived集群中MASTER和BACKUP角色选举策略319
第12章 千万级高并发负载均衡软件HAProxy323
12.1 高性能负载均衡软件HAProxy介绍323
12.1.1 HAProxy简介323
12.1.2 四层和七层负载均衡的区别324
12.1.3 HAProxy与LVS的异同325
12.2 HAProxy基础配置与应用实例326
12.2.1 快速安装HAProxy集群软件326
12.2.2 HAProxy基础配置文件详解326
12.2.3 HAProxy的日志配置策略333
12.2.4 通过HAProxy的ACL规则实现智能负载均衡334
12.3 基于虚拟主机的HAProxy负载均衡系统配置实例335
12.3.1 通过HAProxy的ACL规则配置虚拟主机335
12.3.2 测试HAProxy实现虚拟主机和负载均衡功能343
12.3.3 测试HAProxy的故障转移功能343
12.3.4 使用HAProxy的Web监控平台343
第13章 构建高性能的MySQL集群系统345
13.1 常见的高可用MySQL解决方案345
13.1.1 主从复制解决方案345
13.1.2 MMM高可用解决方案346
13.1.3 HeartbeatSAN高可用解决方案346
13.1.4 HeartbeatDRBD高可用解决方案346
13.1.5 MySQL Cluster高可用解决方案347
13.2 通过Keepalived搭建MySQL双主模式的高可用集群系统347
13.2.1 MySQLReplication介绍347
13.2.2 MySQL Replication实现原理348
13.2.3 MySQL Replication常用架构349
13.2.4 MySQL主主互备模式架构349
13.2.5 MySQL主主互备模式配置350
13.2.6 配置Keepalived实现MySQL双主高可用353
13.2.7 测试MySQL主从同步功能356
13.2.8 测试Keepalived实现MySQL故障转移358
13.3 通过MMM构建MySQL高可用集群系统360
13.3.1 MMM高可用MySQL方案简介360
13.3.2 MMM典型应用方案361
13.3.3 MMM高可用MySQL方案架构363
13.3.4 MMM的安装与配置364
13.3.5 MMM的管理368
13.3.6 测试MMM实现MySQL高可用功能371
13.4 MySQL读写分离解决方案374
13.4.1 通过Amoeba实现MySQL读写分离374
13.4.2 通过Keepalived构建高可用的Amoeba服务382
第14章 高性能负载均衡集群软件HAProxy383
14.1 高性能负载均衡架构设计原则383
14.1.1 HAProxy常见方案与拓扑384
14.1.2 高可用集群软件的选择386
14.2 搭建HAProxy+Keepalived高可用负载均衡系统386
14.2.1 搭建环境描述386
14.2.2 配置HAProxy负载均衡服务器387
14.2.3 配置主、备Keepalived服务器389
14.3 测试HAProxy+Keepalived高可用负载均衡集群392
14.3.1 测试Keepalived的高可用功能392
14.3.2 测试负载均衡功能394
14.4 构建双主高可用的HAProxy负载均衡系统394
14.4.1 系统架构图与实现原理394
14.4.2 安装并配置HAProxy集群系统395
14.4.3 安装并配置双主的Keepalived高可用系统397
14.4.4 测试双主高可用的HAProxy负载均衡集群系统399
|
|