新書推薦:
《
突破不可能:用特工思维提升领导力
》
售價:NT$
352.0
《
王阳明大传:知行合一的心学智慧(精装典藏版)
》
售價:NT$
1010.0
《
失衡与重塑——百年变局下的中国与世界经济
》
售價:NT$
602.0
《
不被定义的年龄:积极年龄观让我们更快乐、健康、长寿
》
售價:NT$
352.0
《
南方谈话:邓小平在1992
》
售價:NT$
367.0
《
纷纭万端 : 近代中国的思想与社会
》
售價:NT$
500.0
《
中国古代文体形态研究(第四版)(中华当代学术著作辑要)
》
售價:NT$
765.0
《
朋党之争与北宋政治·大学问
》
售價:NT$
454.0
|
編輯推薦: |
1. 揭秘人工智能如何赋能药物设计 研发。
2. 涵盖人工智能应用于药物设计领域的核心技术。
3. 基于Python语言介绍人工智能的应用案例,展示人工智能在分子表示、药物分子性质预测、分子生成、配体与蛋白质结合能力预测,以及蛋白质结构预测等新药研发任务中的具体应用
|
內容簡介: |
本书着重介绍人工智能技术在医药研发领域的应用。全书按照循序渐进的方式组织内容:先介绍人工智能的基本方法和生物医药的基本概念,然后介绍人工智能在分子表示、药物分子性质预测、分子生成、配体与蛋白质结合能力预测,以及蛋白质结构预测等新药研发任务中的具体应用,并结合具体示例,介绍如何将人工智能方法应用到实际的药物研发中。
要想更好地掌握本书涵盖的内容,读者须掌握 Python 语言和药物学的基础知识。本书适合想了解人工智能辅助药物研发的从业人员、高等院校医工交叉学科的学生阅读,也适合对人工智能辅助医药研发感兴趣的药物研发人员、程序员阅读。
|
關於作者: |
常珊 教授,美国密苏里大学哥伦比亚分校博士后,江苏理工学院生物信息与医药工程研究所所长。主要研究方向为人工智能辅助药物设计、机器学习和高性能计算。近年来,发表学术论文 120 余篇,被 SCI 检索 100 余篇,Google Scholar 引用 1700 余次,获得软件著作权 14 项,申请发明专利 35 项(授权 9 项),参与出版专著 3 部,译著 1 部。主持国家自然科学基金面上项目 1 项,完成国家自然科学基金 2 项、NSFC- 广东联合基金子课题 1 项以及其他省部级和企业横向课题 10 余个。多次参加国际生物分子结构预测竞赛(CASP),排名位居国际前列,在 2022 年的 CASP 15 中获得蛋白质 -Ligand 预测赛道冠军。
谢良旭 香港大学博士,江苏理工学院生物信息与医药工程研究所副研究员。中国化学会会员、中国人工智能学会终身会员、Current Topics in Medicinal Chemistry 专刊编辑、江苏省中以产业技术研究院青年博士创新联盟成员。主要研究方向为人工智能辅助药物筛选和探索重要生物过程的分子机制。荣获江苏省高等学校科学技术研究成果三等奖,入选江苏省“双创博士”计划、常州市青年科技人才托举工程项目。近年来,发表 SCI 论文 40 余篇,主持国家自然科学基金、江苏省自然科学基金等多个项目。
|
目錄:
|
第 1章 绪论1
1.1 人工智能发展历史1
1.2 传统计算机辅助药物设计的历史3
1.3 人工智能辅助药物研发概况3
第 2章 机器学习的基本概念5
2.1 机器学习、深度学习与人工智能5
2.1.1 人工智能5
2.1.2 机器学习的关键术语7
2.2 机器学习的分类12
2.2.1 按任务类型分类12
2.2.2 按学习方式分类13
2.3 机器学习与药物研发14
2.3.1 药物设计方法15
2.3.2 药物设计中常见的机器学习方法16
2.3.3 预测模型的构建17
2.4 参考资料18
第3章 支持向量机20
3.1 支持向量机简介20
3.2 间隔与支持向量21
3.3 核函数22
3.4 软间隔与正则化25
3.5 支持向量回归29
3.6 支持向量机算法31
3.6.1 选块算法31
3.6.2 分解算法32
3.6.3 模糊支持向量机算法32
3.6.4 序贯最小优化算法33
3.7 示例34
3.8 参考资料37
第4章 决策树39
4.1 决策树简介39
4.2 决策树划分选择40
4.2.1 信息熵40
4.2.2 信息增益42
4.2.3 信息增益率44
4.2.4 基尼指数45
4.3 示例46
第5章 集成学习51
5.1 集成学习简介51
5.1.1 Bagging52
5.1.2 Boosting53
5.2 集成方法54
5.2.1 集成学习的结合策略54
5.2.2 增加基学习器多样性的
方法55
5.3 随机森林56
5.4 示例57
5.5 参考资料64
第6章 k近邻算法65
6.1 k近邻算法概述65
6.1.1 k近邻算法65
6.1.2 距离加权近邻算法67
6.1.3 对k近邻算法的说明68
6.2 k近邻算法的实现69
6.2.1 准备:使用Python导入数据70
6.2.2 从文本文件中解析数据71
6.2.3 如何测试分类器72
6.3 示例:用k近邻算法改进约会网站的配对效果72
6.4 示例:手写识别系统79
6.5 参考资料82
第7章 神经网络84
7.1 生物神经元对人工神经元的启发84
7.2 生物神经网络与人工神经网络的主要区别86
7.3 前馈神经网络87
7.4 反向传播算法89
7.5 激活函数90
7.5.1 Logistic函数91
7.5.2 Tanh函数91
7.5.3 ReLU函数92
7.5.4 Leaky ReLU函数93
7.5.5 Swish函数93
7.6 用Tensorflow构建神经网络,实现激酶抑制剂分类94
7.6.1 数据预处理94
7.6.2 神经网络构建96
7.6.3 模型训练98
7.6.4 模型使用99
7.7 参考资料100
第8章 卷积神经网络102
8.1 卷积神经网络的结构102
8.1.1 卷积层102
8.1.2 池化层107
8.1.3 反池化110
8.1.4 激活函数层111
8.1.5 全连接层111
8.2 卷积神经网络的相关计算112
8.2.1 特征图112
8.2.2 感受野113
8.2.3 填充114
8.2.4 膨胀卷积115
8.3 示例:用卷积神经网络预测药物分子性质116
8.4 参考资料118
第9章 生成式深度学习119
9.1 深度学习与GAN119
9.1.1 深度学习119
9.1.2 GAN120
9.2 GAN的相关概念121
9.2.1 梯度下降法121
9.2.2 信息熵与KL散度122
9.2.3 纳什均衡123
9.2.4 高斯分布和高斯过程123
9.3 GAN理论基础124
9.3.1 什么是GAN124
9.3.2 GAN的原理124
9.4 GAN的训练过程126
9.4.1 训练判别器D127
9.4.2 训练生成器G127
9.5 GAN的应用与代码示例128
9.6 GAN的特点和GAN ZOO132
9.6.1 GAN的优点132
9.6.2 GAN的缺点132
9.6.3 GAN ZOO133
9.7 参考资料134
第 10章 Python编程基础与计算环境搭建135
10.1 Python简介135
10.2 Python基本编程136
10.2.1 Anaconda介绍137
10.2.2 安装Anaconda137
10.2.3 终端窗口运行Python代码片段140
10.2.4 PyCharm简介140
10.2.5 配置PyCharm140
10.2.6 在PyCharm中编写Python脚本142
10.3 Python语言基本要素143
10.3.1 基本数据类型143
10.3.2 if语句147
10.3.3 循环语句147
10.3.4 函数148
10.3.5 类149
10.4 深度学习框架的搭建150
10.4.1 TensorFlow和PyTorch简介150
10.4.2 安装TensorFlow151
10.4.3 安装PyTorch152
10.5 参考资料154
第 11章 常用数据库介绍155
11.1 药物数据库155
11.1.1 PubChem数据库155
11.1.2 DrugBank数据库158
11.1.3 DGIdb160
11.1.4 ChEMBL161
11.1.5 ETCM164
11.2 蛋白质数据库165
11.2.1 UniProt数据库165
11.2.2 PDB167
11.2.3 NCBI数据库168
11.2.4 SMART数据库170
11.2.5 Pfam数据库172
11.2.6 STRING172
11.2.7 其他蛋白质数据库174
11.3 药物-靶点数据库174
11.3.1 TTD174
11.3.2 BindingDB175
11.3.3 其他药物-靶点数据库177
11.4 参考资料178
第 12章 分子对接180
12.1 计算机辅助药物设计概念180
12.2 分子对接的原理与分类182
12.2.1 分子对接的原理182
12.2.2 分子对接的分类182
12.3 分子对接的操作流程183
12.4 人工智能在分子对接中的应用191
12.4.1 打分函数191
12.4.2 蛋白质-配体分子对接中的机器学习192
12.4.3 基于深度学习的多肽与蛋白质相互作用的预测框架192
12.5 参考资料193
第 13章 QSAR的深度学习新应用195
13.1 QSAR195
13.1.1 QSAR的定义195
13.1.2 QSAR的发展简介196
13.1.3 QSAR模型研究方法197
13.2 传统的QSAR199
13.2.1 2D-QSAR的基本原理199
13.2.2 3D-QSAR的基本原理201
13.3 QSAR模型构建步骤203
13.3.1 软件介绍203
13.3.2 3D-QSAR操作步骤203
13.4 机器学习背景下的QSAR211
13.4.1 常见的机器学习方法212
13.4.2 深度学习方法213
13.5 参考资料214
第 14章 分子的特征工程218
14.1 药物分子结构218
14.1.1 什么是分子218
14.1.2 什么是分子键218
14.1.3 什么是分子构象219
14.1.4 什么是分子的手性220
14.2 分子描述符221
14.2.1 什么是分子描述符221
14.2.2 分子描述符的分类221
14.2.3 SMILES字符串222
14.2.4 SMARTS字符串223
14.3 分子指纹224
14.3.1 什么是分子指纹224
14.3.2 分子访问系统结构键224
14.3.3 扩展连通性指纹225
14.4 药物分子的特征工程226
14.4.1 什么是分子特征226
14.4.2 其他特征化方法226
14.4.3 特征选择227
14.5 参考资料228
第 15章 药物分子性质预测231
15.1 药物代谢动力学231
15.1.1 药物代谢动力学介绍231
15.1.2 ADMET简介232
15.1.3 解离常数233
15.2 Lipinski原则233
15.2.1 Lipinski原则介绍233
15.2.2 Lipinski原则的简单程序实现234
15.3 机器学习中的药物分子性质预测235
15.3.1 数据特征化处理235
15.3.2 机器学习预测药物分子性质237
15.4 深度学习中的药物分子性质预测239
15.4.1 特征化处理和数据集划分239
15.4.2 深度学习预测药物分子性质241
15.5 参考资料244
第 16章 分子从头生成245
16.1 先导化合物的优化245
16.2 药物分子设计的原则245
16.2.1 前药设计245
16.2.2 孪药设计247
16.2.3 软药设计247
16.3 传统的先导化合物优化247
16.3.1 采用生物电子等排体进行替换247
16.3.2 生物电子等排体的分类248
16.4 计算机辅助的先导化合物优化249
16.4.1 QSAR249
16.4.2 骨架跃迁251
16.5 分子从头生成简介252
16.5.1 什么是分子从头生成252
16.5.2 分子生成的分类253
16.6 深度学习与分子从头生成254
16.6.1 分子从头生成背景254
16.6.2 分子从头生成模型256
16.6.3 分子从头生成的挑战258
16.7 参考资料259
第 17章 蛋白质结构预测262
17.1 蛋白质的结构与功能262
17.1.1 蛋白质的结构层次262
17.1.2 蛋白质的功能264
17.2 蛋白质折叠动力学简介264
17.2.1 蛋白质折叠264
17.2.2 蛋白质折叠动力学265
17.3 蛋白质结构预测算法266
17.3.1 遗传算法266
17.3.2 模拟退火算法267
17.3.3 同源建模方法268
17.4 蛋白质结构预测的颠覆性发展269
17.5 基于蛋白质结构预测的药物设计271
17.5.1 分子对接271
17.5.2 基于半监督学习的药物-靶点相互作用研究272
17.5.3 药物-靶点结合亲和力研究273
17.6 参考资料274
第 18章 蛋白质-分子结合的深度学习预测276
18.1 药物靶点的基本概念276
18.2 药物靶点与小分子的相互作用277
18.3 药物靶点与小分子的结合自由能的计算278
18.3.1 基于物理模型的方法279
18.3.2 经验打分函数280
18.3.3 基于知识的方法281
18.3.4 基于深度学习的蛋白质-配体分子结合能力281
18.4 人工智能预测蛋白质-配体分子结合能的实战283
18.4.1 药物靶点与小分子的特征提取283
18.4.2 基于蛋白质与配体相互作用的指纹提取284
18.4.3 人工智能模型预测蛋白质-配体结合常数285
18.5 参考资料288
|
|