新書推薦:
《
美国小史(揭秘“美国何以成为美国”,理解美国的经典入门读物)
》
售價:NT$
352.0
《
中国古代北方民族史丛书——东胡史
》
售價:NT$
576.0
《
巨人传(插图珍藏本)
》
售價:NT$
3289.0
《
地下(村上春树沙林毒气事件的长篇纪实)
》
售價:NT$
332.0
《
偿还:债务与财富的阴暗面
》
售價:NT$
347.0
《
清华大学藏战国竹简校释(壹):《命训》诸篇
》
售價:NT$
408.0
《
封建社会农民战争问题导论(光启文库)
》
售價:NT$
296.0
《
虚弱的反攻:开禧北伐
》
售價:NT$
429.0
|
編輯推薦: |
#从易到难讲解各种工具和技术。
#紧贴科研实践、图文并茂。
#内容深浅合适、可操作性强、实用性高。
|
內容簡介: |
生物信息学是运用生物学、数学、计算机科学等多学科技术与手段进行生物信息的获取、贮存、分析、利用的一门交叉学科,是目前生物学研究热门领域之一。本书内容包括两个篇章:一是Windows系统下进行文献检索、数据库使用、引物设计、核酸蛋白质序列分析、进化分析、蛋白质结构分析、miRNA分析等理论与方法及相关软件使用介绍;二是linux系统下面对于基因组测序、RNAseq、miRNAseq等二代测序数据组装、基因预测、注释、表达分析等操作流程及相关软件介绍。
|
關於作者: |
冯世鹏,中科院广州生物医药与健康研究院生物化学与分子生物学专业博士毕业,海南大学农学院讲师,担任海南大学本科及研究生的《生物信息学》、《分子生物学》等课程教学任务,承担过多项重点科研或教研项目。
|
目錄:
|
目录
第0章绪论1
0.1生物信息学的发展历史1
0.1.1Bioinfomatics的来源1
0.1.2生物信息学的定义1
0.1.3人类基因组计划1
0.1.4生物信息学发展重要人物及
大事2
0.2生物信息学的研究内容4
0.2.1生物分子数据的收集与管理4
0.2.2数据库搜索及序列比较5
0.2.3基因组序列分析5
0.2.4基因表达数据的分析与处理5
0.2.5蛋白质结构预测6
0.2.6非编码RNA研究6
0.2.7表观遗传学研究7
0.3生物信息学的生物学基础知识7
0.3.1遗传定律7
0.3.2DNA分子结构8
0.3.3基因结构8
0.3.4中心法则9
0.3.5密码子表9
0.3.6蛋白质结构与功能9
0.3.7PCR技术9
参考文献10
Windows篇
第1章文献信息检索12
1.1文献资源的分类12
1.1.1根据出版形式进行分类12
1.1.2综合分类法13
1.1.3标识码及编号14
1.2文献的格式15
1.3文献检索17
1.3.1文献检索词的来源17
1.3.2搜索数据库选择18
1.3.3检索式构建19
1.3.4检索结果的处理21
1.3.5CNKI数据库查询举例21
1.3.6Elsevier数据库检索举例25
1.4文献信息的价值判断及阅读27
1.4.1文献的价值判断27
1.4.2文献有效阅读29
1.5科技查新29
习题31
参考文献31
第2章生物信息数据资源32
2.1核酸序列数据库32
2.1.1GenBank数据库及其分类33
2.1.2Entrz Nucleotide数据库及
其分类34
2.1.3NCBI其他数据库34
2.1.4GenBank数据格式35
2.1.5GenBank数据访问方式35
2.1.6基因数据库记录格式及搜索38
2.2蛋白质序列数据库39
2.2.1UniProt数据库介绍39
2.2.2Uniprot数据获得方式41
2.2.3UniProt数据库记录格式42
2.3蛋白质结构数据库43
2.3.1PDB数据库发展历史43
2.3.2RCSB PDB数据库介绍44
2.3.3RCSB PDB数据库搜索45
2.3.4RCSB PDB数据记录46
2.4物种基因组数据库47
2.4.1小鼠基因组数据库47
2.4.2拟南芥基因组数据库49
2.5代谢通路数据库52
2.5.1在KEGG数据库搜索53
2.5.2主页快速链接54
2.5.3KEGG通路图及其元素意义55
2.6基因组浏览器57
2.6.1基因组数据展示内容58
2.6.2BLAT搜索61
2.7非编码RNA数据库62
2.7.1miRNA数据库62
2.7.2NONCODE数据库63
习题66
参考文献66
第3章序列比对68
3.1比对程序介绍68
3.2比对序列相似性的统计特性69
3.3在线BLAST序列比对72
3.4本地运行BLAST75
3.4.1BLAST程序的下载和安装75
3.4.2搜索数据库的索引格式化75
3.4.3运行BLAST程序,搜索本地
序列数据库76
3.5多序列比对77
3.5.1ClustalX的使用77
习题80
参考文献80
第4章核酸序列分析81
4.1基因阅读框的识别81
4.2基因其他结构区预测82
4.2.1CpG岛的预测82
4.2.2转录终止信号预测84
4.2.3启动子区域的预测84
4.2.4密码子偏好性计算86
4.3引物设计88
4.3.1引物设计的基本原则88
4.3.2Primer 5引物设计88
4.3.3利用Primer 5进行酶切位点
分析91
4.4核酸序列的其他转换92
习题93
参考文献93
第5章蛋白质序列分析94
5.1蛋白质理化性质和一级结构
分析94
5.1.1蛋白质理化性质分析94
5.1.2蛋白质理化性质分布图95
5.1.3蛋白质信号肽预测97
5.2蛋白质二级结构分析99
5.2.1蛋白质跨膜结构区分析99
5.2.2蛋白质卷曲螺旋分析101
5.2.3蛋白质二级结构预测分析103
5.3蛋白质三维结构预测分析104
习题105
参考文献105
第6章基因表达分析106
6.1qPCR数据分析106
6.1.1绝对定量分析方法107
6.1.2相对定量方法分析108
6.2基因芯片数据分析111
6.2.1从GEO上下载基因芯片表达
谱数据111
6.2.2将表达谱数据导入MATLAB
软件112
6.2.3对soft格式文件的标准化113
6.2.4差异表达基因筛选114
习题114
参考文献115
第7章进化分析116
7.1进化理论介绍116
7.1.1种群是生物进化的基本单位116
7.1.2可遗传的变异是生物进化的
原始材料116
7.1.3分子进化中性学说117
7.2进化分析以MEGA为例117
7.2.1序列准备118
7.2.2序列比对119
7.2.3建树计算119
7.2.4进化树的调整121
习题121
参考文献122
第8章非编码miRNA分析123
8.1miRNA简介123
8.1.1miRNA的生物合成123
8.1.2miRNA调控基因表达的机理124
8.1.3miRNA的生理调节作用125
8.2miRNA靶基因预测125
8.2.1miRNA靶基因的预测原理125
8.2.2miRNA靶基因的预测软件126
8.2.3miRNA靶基因的预测步骤127
8.3调控靶基因的miRNA预测130
8.4miRBase数据库的使用131
8.4.1miRBase数据库的搜索131
8.4.2miRBase数据库批量下载132
8.4.3miRNA记录信息133
习题134
参考文献134
Linux篇
第9章Linux系统138
9.1Linux简介138
9.1.1什么是Linux系统138
9.1.2为什么要学习Linux系统139
9.1.3如何学习Linux系统140
9.2Linux系统安装140
9.2.1Linux系统下载140
9.2.2系统安装盘制作142
9.2.3CentOS 6.5操作系统安装144
9.2.4更新yum源154
9.3Linux命令行模式终端155
9.4Linux系统开关机156
9.5Linux系统文件157
9.5.1Linux文件夹及其主要作用
以CentOS 6.5为例157
9.5.2Linux的文件信息的意义158
9.5.3Linux命令帮助文件159
9.6几个重要的快捷键161
9.7Linux系统的命令161
9.7.1Linux系统命令的输入格式161
9.7.2常用命令及其常用选项介绍161
9.7.3数据流重定向167
9.7.4管道命令168
9.7.5vim编辑器工具168
9.7.6其他命令170
习题177
参考文献177
第10章Perl语言178
10.1Perl版本178
10.2Perl标量数据179
10.2.1Perl运算符180
10.2.2标量变量180
10.2.3数字及字符串的比较
运算符181
10.3列表与数组182
10.3.1数组及其赋值操作182
10.3.2数组元素的引用182
10.3.3数组相关的几个命令183
10.4哈希183
10.4.1哈希赋值184
10.4.2哈希的相关函数184
10.5判断式及循环控制结构185
10.5.1if条件判断式185
10.5.2while循环结构185
10.5.3until循环结构186
10.5.4foreach循环结构186
10.5.5each控制结构186
10.6正则表达式187
10.6.1正则表达式相关符号187
10.6.2捕获变量188
10.6.3正则表达式中特殊字符
的意义188
10.7Perl的排序189
10.7.1sort命令189
10.7.2sort与比较运算符及默认
函数的连用189
10.8Perl默认的函数的总结189
10.9程序精解190
10.9.1实例一:从fasta文件中
寻找特定的序列190
10.9.2实例二:文本内容分类
统计功能193
10.9.3实例三:统计文件内容
是否有重复195
10.9.4实例四:Scaffolds序列
的排序196
习题196
参考文献197
第11章测序方法及数据处理198
11.1测序技术的发展198
11.1.1第一代测序方法198
11.1.2二代测序方法201
11.1.3测序文库插入片段大小
选择205
11.1.4测序类型205
11.1.5测序方法的搭配206
11.1.6测序质量值206
11.2测序数据处理207
11.3测序数据质量分析208
11.3.1用FastQC软件对测序数据
进行评估208
11.3.2NGSQCToolKit对测序
Reads的处理213
11.3.3FASTX_Toolkit对测序
Reads的处理216
11.4深度测序数据上传SRA
数据库218
11.4.1材料准备220
11.4.2注册项目信息221
11.4.3提供技术信息224
11.4.4上传数据227
11.4.5数据传输完毕状态230
习题231
参考文献231
第12章基因组组装232
12.1Velvet拼装软件233
12.1.1Velvet软件安装234
12.1.2Velvet参数介绍234
12.1.3Velvet命令运行237
12.1.4Velvet运行结果解读237
12.2SOAPdenovo软件拼装238
12.2.1软件的安装239
12.2.2参数介绍239
12.2.3SOAPdenovo命令运行241
12.2.4SOAPdenovo运行结果
解读242
12.3ABySS软件拼装242
12.3.1ABySS的安装242
12.3.2ABySS主要参数介绍243
12.3.3ABySS命令运行245
12.3.4ABySS运行命令结果解读245
12.4ALLPATH-LG软件拼装245
12.4.1ALLPATH-LG的安装246
12.4.2ALLPATH-LG的主要参数246
12.4.3ALLPATH-LG测试数据
运行过程解读249
12.4.4运行结果解读252
12.5Gaps修补252
12.5.1GapFiller软件安装252
12.5.2相关参数介绍253
12.5.3程序运行命令254
12.5.4运行结果解读254
12.6基因组组装效果评估254
习题254
参考文献255
第13章小RNA测序数据分析256
13.1小RNA测序简介256
13.2小RNA测序数据质控257
13.3miRNA的识别259
习题263
参考文献263
第14章RNA-seq数据分析264
14.1
|
內容試閱:
|
前 言
关于本书的成因:希望通过本书让读者了解生物信息学,并能利用生物信息学工具进行常规的分析;对于学有余力或者对生物信息学有浓厚兴趣的读者,则读完本书后可进行二代测序数据的初步深度分析。本书主要针对生物科学相关专业本科生、研究生或者其他有志于学习生物信息学的初学者,希望这本书能起到抛砖引玉的作用,带领他们进入生物信息学领域。
关于本书的内容:全书分为两篇,Windows篇属于生物信息学基础,相关生物信息学软件在装有Windows系统的计算机上即可运行,这部分内容要求每个生物科学专业的本科生或读者必须了解掌握,主要包括生物信息相关数据库、序列比对、引物设计、序列分析、进化分析等;Linux篇属于生物信息学的深度应用,主要软件及其应用需要在安装Linux系统的计算机上才能最有效地运行,这部分的内容供学有余力或者有志于进行生物信息学研究应用的学生或工作人员学习,主要包括基因组、转录组的测序、组装、注释等分析内容。
关于学习生物信息学的态度:不贪多、不畏多、自学为主、教学为辅。所谓不贪多,就是生物信息学涉及多个学科门类,一个人几乎不可能精通所有相关门类,因此最好根据个人兴趣选择其中一个方向刻苦钻研,勤以练习,融会贯通,同时兼顾其他方面。所谓不畏多,就是不要被生物信息学所需要学习的知识吓到,有的知识够用即可,遇到需要进一步学习的时候再去学习新的知识,循序渐进,学得也快。所谓自学为主、教学为辅,就是强调学习的主动性,带着强烈的兴趣学习,学习效果要远好于被迫学习。自学过程中不可避免地会遇到一些问题,此时力求通过查阅资料自行解决问题,因此会自然而然地产生自豪感;如果自己查阅资料无法解决的时候最好能有人给以辅助,否则会卡在那里、无法进行后续的学习,这就是要有教学为辅的作用。生物信息学注重实际分析,由于软硬件的差异,对于同样的数据,不同的人处理得到的结果可能不一致,这就要勤加练习,积累经验,分析导致不同结果产生的原因,并能对结果进行取舍,或者改变条件重新分析。
生物信息学,你可以爱它,因为它帮你解决了很多生物学的问题;你也可以恨它,因为有时候你的问题它无法解决。但不管你是爱还是恨,它就在那里,如果你的工作或者学习跟生物有关,你就必须要了解它!
冯世鹏
2017年6月12日于海大
|
|