新書推薦:
《
恶的哲学研究(社会思想丛书)
》
售價:NT$
500.0
《
不止江湖
》
售價:NT$
449.0
《
天才留步!——从文艺复兴到新艺术运动(一本关于艺术天才的鲜活故事集,聚焦艺术史的高光时刻!)
》
售價:NT$
704.0
《
双城史
》
售價:NT$
505.0
《
冯友兰和青年谈心系列:不是问题的问题(哲学大师冯友兰和年轻人谈心,命运解读)
》
售價:NT$
254.0
《
月与蟹(青鲤文库)荣获第144届直木奖,天才推理作家经典作品全新译本。一部青春狂想曲,带你登上心理悬疑之巅。
》
售價:NT$
230.0
《
索恩丛书·盛清统治下的太监与皇帝
》
售價:NT$
403.0
《
透过器物看历史(全6册)
》
售價:NT$
2234.0
內容簡介:
蛋白质组学是当前生命科学的新前沿,通过研究蛋白质的功能、结构、相互作用来系统地分析蛋白质,进而分析生命活动,成为热点的研究问题之一。尤其是,从蛋白质网络中进行多物种的关键蛋白识别、蛋白质复合物挖掘、以及蛋白质功能预测,对揭示蛋白质网络的组成结构、预测蛋白质功能、解释特定的生物进程具有重要的研究意义。本书一方面讲述利用蛋白质活性的动态性、蛋白质的亚细胞定位信息,构建精准的蛋白质相互作用网络的方法。另一方面,以此为基础,讲述从新的角度研究生物信息学中与蛋白质相关的几个重要问题,其中包括适用于多物种的关键蛋白识别、蛋白质复合物挖掘、以及蛋白质功能预测。
關於作者:
彭小清,女,博士,副教授,中国计算机学会生物信息专委会委员。近年来在国际重要学术期刊Briefings in Bioinformatics,Proteomics, BMC Bioinformatics,BMC System Biology, Plos One, Journal of Theoretical Biology, Tsinghua Science and Technology和本领域主要国际会议IEEE International Conference in Bioinformatics and Biomedicine BIBM 上发表文章十余篇。
目錄 :
第一部分 基础篇
第1章 绪论 (2)
1.1 蛋白质相互作用 (3)
1.2 蛋白质网络 (7)
1.3 关键蛋白质 (8)
1.4 蛋白质复合物 (9)
1.5 蛋白质功能 (10)
1.6 本书的主要内容和组织结构 (11)
第二部分 蛋白质网络篇
第2章 蛋白质网络研究现状 (15)
2.1 基于蛋白质表达动态性的动态蛋白质网络 (16)
2.2 基于多状态下表达及相关性变化的动态蛋白质网络 (20)
第3章 动态蛋白质网络的构建方法 (23)
3.1 动态蛋白质网络的构建方法 (24)
3.1.1 3-sigma准则 (24)
3.1.2 活性蛋白质的识别 (24)
3.1.3 动态蛋白质网络的构建 (26)
3.2 实验结果及分析 (28)
3.2.1 实验数据 (28)
3.2.2 网络构建 (28)
3.2.3 与已知蛋白质复合物比较 (29)
3.2.4 算法的特异性、敏感性和综合指标 (30)
3.2.5 功能富集性分析与算法精度分析 (32)
3.2.6 蛋白质复合物完美匹配分析 (35)
3.3 本章小结 (36)
第4章 亚细胞区间蛋白质网络的构建 (37)
4.1 亚细胞区间蛋白质网络 (39)
4.2 加权蛋白质网络 (40)
4.2.1 亚细胞区间重要性的评估 (40)
4.2.2 蛋白质相互作用重要性的计算 (41)
4.3 本章小结 (41)
第三部分 蛋白质复合物识别篇
第5章 蛋白质复合物识别的相关研究 (44)
5.1 基于密度和局部搜索的算法 (45)
5.2 基于层次聚类的算法 (47)
5.3 交叠复合物挖掘的算法 (49)
5.4 融合多元数据的蛋白质复合物识别 (51)
5.5 动态蛋白质网络中的蛋白质复合物识别 (52)
第6章 基于蛋白质复合物形成机制与蛋白质活性的蛋白质
复合物提炼方法 (54)
6.1 蛋白质复合物的形成机制以及内部活性特征 (54)
6.2 蛋白质复合物提炼方法 (55)
6.2.1 方法框架 (55)
6.2.2 蛋白质复合物的分割 (56)
6.2.3 蛋白质复合物的组装 (58)
6.3 实验与分析 (60)
6.3.1 与已知蛋白质复合物的比较 (61)
6.3.2 算法的特异性、敏感性和综合指标 (64)
6.3.3 真阳性的提高 (66)
6.3.4 参数分析 (68)
6.4 本章小结 (69)
第7章 融合蛋白质亚细胞定位信息的蛋白质复合物识别 (71)
7.1 密度-扩散中心性 (71)
7.2 中心性得分的幂律分布检验 (72)
7.3 基于幂律分布的双层聚类算法 (74)
7.4 实验与分析 (78)
7.4.1 实验数据 (79)
7.4.2 与已知蛋白质复合物的比较 (80)
7.4.3 算法的特异性、敏感性和综合指标 (82)
7.4.4 完美匹配分布 (84)
7.5 讨论 (85)
7.5.1 参数分析 (85)
7.5.2 不同中心性方法对PLCluster算法预测效果的影响 (86)
7.5.3 基于亚细胞定位信息的蛋白质复合物过滤及比较 (88)
7.6 本章小结 (90)
第8章 基于k层网络的蛋白质复合物识别研究 (91)
8.1 概述 (91)
8.2 基于k层网络的蛋白质复合物识别算法 (92)
8.2.1 基于k-means聚类的网络分层算法 (93)
8.2.2 识别每层子网中的蛋白质复合物 (94)
8.2.3 识别跨越两个子网的蛋白质复合物 (94)
8.2.4 基于亚细胞定位信息的蛋白质复合物过滤 (95)
8.3 实验结果及分析 (95)
8.3.1 实验数据 (96)
8.3.2 参数影响分析 (97)
8.3.3 与已知蛋白质复合物的比较 (100)
8.3.4 完美匹配分布 (102)
8.4 讨论 (103)
8.5 本章小结 (104)
第四部分 关键蛋白质识别篇
第9章 关键蛋白质研究现状 (107)
9.1 基于拓扑特性的关键蛋白质识别方法 (107)
9.2 融合其他生物信息的关键蛋白质识别方法 (108)
第10章 基于亚细胞区间蛋白质网络的关键蛋白质识别 (110)
10.1 基于亚细胞区间蛋白质网络的关键蛋白质识别方法 (110)
10.1.1 方法框架 (110)
10.1.2 亚细胞区间特异性中心性得分 (112)
10.2 评价指标 (113)
10.2.1 比较排序后的前c%的蛋白质 (114)
10.2.2 比较多物种的平均准确度 (115)
10.3 实验结果 (115)
10.3.1 实验数据 (115)
10.3.2 酵母数据 (116)
10.3.3 人类数据 (118)
10.3.4 小鼠数据 (120)
10.3.5 果蝇数据 (122)
10.3.6 平均准确度(AKAcc) (124)
10.4 讨论 (125)
10.4.1 全局蛋白质网络和PSLIN的不同预测 (126)
10.4.2 中心性方法在PSLIN上的局限性 (127)
10.4.3 不同PSLIN上计算的中心性得分具有不同的可靠性 (128)
10.5 本章小结 (130)
第11章 基于亚细胞区间重要性的关键蛋白质识别方法 (131)
11.1 基于亚细胞区间重要性的中心性方法 (131)
11.1.1 亚细胞区间重要性的评估和蛋白质相互作用
重要性的计算 (132)
11.1.2 基于亚细胞区间重要性的中心性方法 (133)
11.2 实验结果 (134)
11.2.1 实验数据 (134)
11.2.2 比较排序后的前c%的蛋白质 (135)
11.2.3 折刀曲线 (140)
11.2.4 ROC曲线 (141)
11.3 本章小结 (143)
第五部分 蛋白质功能预测篇
第12章 蛋白质功能预测研究现状 (145)
12.1 蛋白质功能预测的重要性 (145)
12.2 预测蛋白质功能的难点 (146)
12.3 蛋白质功能预测问题 (147)
12.4 蛋白质功能预测研究现状 (149)
12.5 蛋白质功能预测的评价方法 (150)
第13章 融合蛋白质亚细胞定位信息的蛋白质功能预测 (153)
13.1 引言 (153)
13.2 蛋白质功能预测方法LSDC (154)
13.2.1 蛋白质协同功能推断 (155)
13.2.2 序列相似性功能推断 (157)
13.2.3 结构域相似性功能推断 (158)
13.2.4 综合功能集合及各项功能的可靠性得分 (159)
13.3 实验结果 (161)
13.3.1 实验数据 (161)
13.3.2 实验过程 (164)
13.4 本章小结 (168)
第六部分 展望篇
第14章 蛋白质网络研究的挑战与机遇 (170)
14.1 识别可靠的PPI面临的挑战 (170)
14.2 特定上下文的动态蛋白质网络的构建 (173)
14.3 整合组学中的蛋白质相互作用 (174)
参考文献 (176)
內容試閱 :
前言
这是一本专业性较强的书,不适合作为入睡前的床头读物。内容看上去很高深且枯燥无味,实际上主要介绍了我硕士及博士研究生期间针对生物信息学方面的几个经典问题,引入不同的多元信息或生物假设,提出的解决方案,例如,构建更贴近真实状态的蛋白质相互作用网络、基于蛋白质网络的生物知识发现。本书反映了我们这一代研究生在科研过程中的思潮涌动、别出心裁、柳暗花明以及自娱自乐。
本书的内容可能并不那么实用,我不知道谁会用本书介绍的方法。目前,据我所知,美国物理学会院士、匈牙利科学院院士Albert-Laszlo Barabasi教授等,利用本书介绍的基于3-sigma准则的动态蛋白质网络构建方法构建的动态蛋白质网络,作为研究时序网络的来源,成果发表在国际顶级期刊Science上。在论文致谢部分,Albert-Laszlo Barabasi教授等特别感谢了我们用该方法为他们提供的动态蛋白质网络数据。中国医学科学院、北京协和医学院、国家食品药品监督管理总局药品安全评价中心、北京市药品非临床安全性评价重点实验室、国家食品药品监督管理局的Xing-chao Geng和Bo Li等,从本书介绍的基于3-sigma准则计算基因表达阈值的方法得到启发,提出了基于3-sigma准则的体外药物性肝损伤毒性阈值的计算方法,从而为区分体外细胞毒性的存在提供了一种清晰的量化方法。
在神奇的生命科学领域,本来就充满各种有趣的生物算法。发现生物算法中的生物特征,才能寻找到贴近真实的生物算法。本书介绍的计算方法并不高深,既没有创造计算机算法,也没有引入很复杂的模型。有一个思想始终贯穿我所有的研究工作:在生命科学领域,如果你想探索生物分子的工作机制,那么就要像它们一样思考。因此,我所有的研究工作主要围绕如何发现生物特征,然后再将它们加入已有算法中对生物问题进行求解。例如,在构建动态蛋白质网络时,我们认为蛋白质表达的动态性不能充分反映蛋白质相互作用的动态性,同时被表达却不处于活性状态的一对蛋白质不能保证它们之间的相互作用的发生。在生物过程或细胞周期中,动态表达水平可以间接地反映蛋白质活性的动态性。因此,我们用时序的基因表达数据可以推断蛋白质活性动态信息:每种蛋白质有各自的活性周期,当基因表达量处于最大值时,此时基因产物(蛋白质)是活性的。我们用3-sigma准则根据每个基因的表达曲线为其设计活性阈值,从而区分在一个细胞周期内蛋白质在哪些时刻处于活性状态。在预测蛋白质复合物时,我们分析了已知复合物的内部特征,并设想蛋白质复合物形成的过程,从蛋白质复合物形成过程以及蛋白质活性状态出发,提出了一种基于即时(just-in-time)机制和蛋白质活性的蛋白质复合物提炼方法。与人类社会网络类似,生物分子网络中,生物分子之间存在协作关系以及调控关系,具有不同拓扑特征的蛋白质可能以不同的方式来聚合成蛋白质复合物,应该区别对待,因此我们还从这个角度出发去识别蛋白质复合物。因为蛋白质必须位于正确的亚细胞区间才能执行它们的功能,也只有当蛋白质位于相同的亚细胞区间时,蛋白质相互作用才可能发生。因此,本书还基于蛋白质亚细胞定位信息,以新的角度研究适用于多物种的关键蛋白质识别、蛋白质复合物挖掘以及蛋白质功能预测。通过对上述问题中相关生物特性的分析,结合蛋白质亚细胞定位信息对这些问题提出新的求解模型,有效地结合多元的生物信息实现对问题的求解。
本书主要包括四部分。第一部分提及的基础知识涉及蛋白质相互作用、蛋白质相互作用网络、蛋白质复合物、关键蛋白质以及蛋白质功能,这些内容都是本书后续部分的研究重点。第二部分主要围绕如何提高蛋白质网络的可靠性来讲述,涉及结合基因表达数据、引入动态信息的动态蛋白质网络构建,以及引入蛋白质的亚细胞区间信息的蛋白质网络的构建和加权方法。第三部分主要介绍蛋白质复合物识别研究的现状,提出几种蛋白质复合物识别方法。这体现了将蛋白质复合物固有的生物特征应用到蛋白质复合物预测,可使预测的蛋白质复合物更具有生物意义。第四部分主要介绍基于亚细胞定位信息的两种关键蛋白质预测方法。第五部分主要介绍蛋白质功能预测相关的问题,以及试图利用亚细胞定位信息提高蛋白质功能预测准确性的尝试。第六部分对未来的蛋白质网络研究的挑战和机遇进行展望。
感谢中南大学计算机学院(原信息科学与工程学院)对我的培养。感谢中南大学生命科学学院的同事对我现阶段自由探索和实践的宽容,这使我能够心无旁骛地研究自己感兴趣的东西。感谢我的老师王建新教授、陈建二教授、潘毅教授和吴方向教授,你们让我领悟到做科研不仅需要有活跃的思维,而且要有精益求精的态度。感谢我先生陈小专给予我的理解和关心,感谢我的宝贝钱钱小朋友以及即将出世的宝宝小蜜糖,你们的陪伴和笑容让我内心充满了力量。
本书由彭小清(中南大学)执笔,得到国家自然科学基金(基金号:61702555)和中南大学特聘副教授启动经费的资助。
限于篇幅与自身学识,本书并未涉及生物信息学的其他研究问题。撰写此书虽已尽全力,成书在即仍旧诚惶诚恐,既恐出现纰漏,贻笑大方,更恐误人子弟,罪莫大焉。相关建议或批评,可直接发至本人邮箱xqpeng@csu.edu.cn交流讨论。
最后,我想说,生命科学领域未知的谜团还有很多很多,我将继续充满好奇和兴奋在这漫漫长路上不断探索,希望能在自然科学前进的道路上铺下一块小小的砖头。
彭小清
于长沙市岳麓山下2020年7月16日