新書推薦:
《
逃不开的科技创新战争
》
售價:NT$
467.0
《
漫画三国一百年
》
售價:NT$
250.0
《
希腊文明3000年(古希腊的科学精神,成就了现代科学之源)
》
售價:NT$
374.0
《
粤行丛录(岭南史料笔记丛刊)
》
售價:NT$
374.0
《
岁月待人归:徐悲鸿自述人生艺术
》
售價:NT$
286.0
《
女人的中国医疗史:汉唐之间的健康照顾与性别
》
售價:NT$
484.0
《
资治通鉴熊逸版:第四辑
》
售價:NT$
2195.0
《
中国近现代名家精品——项维仁:工笔侍女作品精选
》
售價:NT$
308.0
|
內容簡介: |
本书系统阐述了生物测序数据的分析方法, 主要内容包括基因与基因组的概念、测序相关的数据库和数据格式、测序数据的常用平台和原理、染色质免疫共沉淀测序数据分析、转录组测序数据分析、小RNA测序数据分析、单细胞测序数据分析和蛋白组学数据分析等各种生物测序数据分析方法。
|
關於作者: |
孙晓明,女,本科毕业于北京大学。本科毕业后取得美国马萨诸塞大学直博资格并获得该校全额奖学金。于美国马萨诸塞大学取得博士学位后,一直从事生物统计和生物信息研究工作。至2019年,已在相关国际会议及国际核心期刊上发表英文论文10余篇。现为西安财经大学统计学院系教师。
|
目錄:
|
目 录
第1章 基因与基因组1
1.1 基因简述1
1.2 基因的基本概念3
1.3 DNA的结构特征4
1.4 RNA的结构特征5
1.5 蛋白质与DNA之间的相互作用6
1.6 蛋白质识别RNA的不同策略6
1.7 基因组结构、染色体、染色质和核小体7
1.7.1 真核细胞染色体DNA的结构7
1.7.2 核小体8
1.7.3 染色质的高级结构8
1.8 遗传密码8
1.9 原核细胞的基因调控9
1.10 真核细胞的基因调控11
1.11 RNA分子的调控作用14
参考资料14
第2章 生物信息常用数据库16
2.1 GenBank数据库简介16
2.1.1 GenBank的数据来源16
2.1.2 GenBank的数据内容与类型16
2.1.3 GenBank的数据检索26
2.2 UniProt数据库简介27
2.2.1 UniProt的数据来源28
2.2.2 UniProt的数据内容与类型28
2.3 Ensembl数据库简介30
2.3.1 Ensembl的数据特征31
2.3.2 Ensembl的注释31
2.3.3 Ensembl的注释文件32
2.4 UCSC Genome Browser数据库简介32
参考资料33
第3章 高通量测序技术35
3.1 高通量测序技术中的常用术语35
3.2 高通量测序技术简介35
3.2.1 代测序技术36
3.2.2 第二代测序技术36
3.2.3 第三代测序技术41
3.2.4 其他测序技术43
3.3 深度测序的应用43
3.4 深度测序数据处理面临的挑战44
参考资料45
第4章 深度测序的数据格式48
4.1 序列的相关格式48
4.1.1 FASTA格式48
4.1.2 FASTQ格式50
4.1.3 FASTQ质量值的计算方法50
4.1.4 fastqC程序51
4.2 序列比对的相关格式52
4.2.1 SAM格式53
4.2.2 BAM格式53
4.3 突变信息的相关格式54
4.4 序列注释及可视化的相关格式55
4.4.1 BED格式55
4.4.2 GFF格式55
4.4.3 GTF格式55
4.5 Samtools简介56
4.6 Bedtools简介58
4.7 Vcftools简介58
参考资料59
第5章 测序数据拼接算法61
5.1 测序数据的常用术语61
5.2 拼接的基本原理62
5.2.1 基于贪婪策略的拼接算法63
5.2.2 基于OLC策略的拼接算法66
5.2.3 基于de Bruijn图策略的拼接算法68
5.3 基因组拼接面临的挑战70
5.4 基因组拼接软件的选择70
参考资料73
第6章 序列比对算法76
6.1 序列比对的常用术语76
6.2 比对算法简介77
6.3 三种常用的比对软件79
6.3.1 Bowtie2简介79
6.3.2 BWA简介80
6.3.3 SOAP2简介80
6.4 多序列比对80
参考资料81
第7章 转录组测序(RNA-seq)数据分析83
7.1 RNA-seq简介83
7.2 RNA-seq技术的主要应用领域84
7.3 RNA-seq技术的基本实验流程86
7.4 RNA-seq技术中的测序手段87
7.4.1 短读长cDNA测序88
7.4.2 长读长cDNA测序89
7.4.3 直接RNA测序90
7.5 RNA-seq的数据处理与相关的软件90
7.6 RNA-seq中的统计学问题94
参考资料95
第8章 染色质免疫共沉淀测序(ChIP-seq)数据分析98
8.1 ChIP-seq简介98
8.2 ChIP-seq的基本实验流程99
8.3 ChIP-seq的数据分析流程99
8.4 富集区域鉴定算法100
8.4.1 ChIP-seq的信号类型100
8.4.2 常见的富集区域鉴定流程101
8.5 用于富集区域鉴定的MACS2软件101
8.6 ChIP-seq数据中的峰注释102
8.7 比较两组ChIP-seq的测序结果102
8.8 DNA功能域(motif)103
参考资料104
第9章 ATAC-seq数据分析105
9.1 ATAC-seq简介105
9.2 ATAC-seq的数据处理106
参考资料107
第10章 microRNA-seq数据分析108
10.1 microRNA简介108
10.2 microRNA-seq的数据处理109
10.3 microRNA的匹配原理110
10.4 microRNA的常用数据库111
10.4.1 mirDIP数据库111
10.4.2 miRBase数据库111
10.4.3 TargetScan数据库111
10.4.4 PITA数据库112
10.4.5 starBase V2.0数据库112
参考资料112
第11章 单细胞测序数据分析114
11.1 单细胞测序简介114
11.2 单细胞测序的分类115
11.3 单细胞测序的技术实现116
11.4 单细胞测序数据分析的相关算法119
参考资料122
第12章 基因组关联分析(GWAS)126
12.1 GWAS简介126
12.2 GWAS的数据格式128
12.3 GWAS的研究对象及研究方法129
12.4 GWAS中的统计学问题129
参考资料130
第13章 常见生物测序数据的下游分析132
13.1 基因富集分析132
13.2 比较基因富集分析的方法132
13.2.1 过表达分析(ORA)132
13.2.2 功能集打分(FCS)133
13.2.3 通路拓扑结构(PT)133
13.2.4 网络拓扑结构(NT)133
13.3 信号查看134
13.4 热点图134
参考资料134
第14章 Hi-C seq数据分析136
14.1 Hi-C seq简介136
14.2 染色质构象捕获(3C)技术及其衍生技术136
14.3 Hi-C seq数据分析的常用工具139
14.4 Hi-C seq数据的存储139
14.4.1 Hi-C seq数据分析中的文件格式139
14.4.2 读长配对数据的存储140
14.4.3 互作矩阵的存储140
14.5 Hi-C seq数据的特点141
14.6 Hi-C seq数据的分析方法141
参考资料143
|
|