生物信息学中的数据挖掘方法及应用pdf下载pdf下载

生物信息学中的数据挖掘方法及应用百度网盘pdf下载

作者:
简介:本篇主要提供生物信息学中的数据挖掘方法及应用pdf下载
出版社:科学出版社
出版时间:2011-11
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介

《生物信息学中的数据挖掘方法及应用》针对生物信息学领域的一些前沿课题,以数据挖掘算法为中心,系统地介绍了机器学习、统计学习及多种智能算法在生物信息学相关领域的应用,为生物信息学方向的初学者提供了入门知识,也为相关研究人员在特定方向深入研究提供了参考信息。主要内容包括操纵子预测、原核生物系统发生树的构建、基于数据扰动的误标记样本检测、差异表达基因识别以及基因表达数据的特征选择等。

目录

目录
前言
第1章 绪论 1
1.1 什么是生物信息学 1
1.2 生物信息学的研究对象 2
1.2.1 基因组数据 2
1.2.2 蛋白质组数据 2
1.2.3 基因表达数据 5
1.3 生物信息学的研究领域 10
1.4 生物信息学的进展和存在的问题 11
1.4.1 生物信息学的进展 11
1.4.2 生物信息学存在的问题 13
参考文献 14
第2章 操纵子预测 16
2.1 操纵子预测的研究背景及现状 16
2.1.1 操纵子简介 16
2.1.2 操纵子预测的研究现状 17
2.2 操纵子预测的相关数据 18
2.2.1 基因间距离 18
2.2.2 COG功能分类 19
2.2.3 保守基因对(簇) 20
2.2.4 系统进化谱 22
2.2.5 基因本体 24
2.2.6 KEGG同源 27
2.2.7 同义密码子使用偏好性 29
2.2.8 其他属性信息 31
2.2.9 基因组和已知操纵子数据 32
2.3 操纵子预测的相关基础 32
2.3.1 预测问题定义 32
2.3.2 预测数据预处理 33
2.3.3 预测效果评价 35
2.4 基于神经网络的操纵子预测模型 35
2.4.1 模型的具体流程 36
2.4.2 模型的实验验证 40
2.5 基于图聚类方法的操纵子预测模型 43
2.5.1 模型预测流程概括 44
2.5.2 模型预测的具体流程 45
2.5.3 模型的实验验证 53
2.6 小结 55
参考文献 56
第3章 原核生物系统发生树的构建 59
3.1 系统发生树构建的研究背景及现状 59
3.1.1 系统发生树简介 59
3.1.2 原核生物系统发生树构建的研究现状 59
3.2 系统发生树构建的相关数据和基础 60
3.2.1 原核生物基因组数据 60
3.2.2 已知系统进化树数据 62
3.2.3 直系同源信息 62
3.2.4 水平转移基因信息 64
3.2.5 操纵子信息 65
3.2.6 构建问题定义 65
3.2.7 结果性能估计 65
3.3 基于连续直系同源基因的系统发生树构建方法 66
3.3.1 方法描述 66
3.3.2 方法的具体流程 67
3.3.3 方法的实验验证 69
3.4 基于全基因组序列和注释信息的系统发生树构建方法 72
3.4.1 方法描述 72
3.4.2 方法具体流程 73
3.4.3 方法的实验验证 83
3.5 小结 88
参考文献 89
第4章 基于数据扰动的误标记样本检测 92
4.1 误标记样本检测的研究背景及现状 92
4.2 基于LOOPC矩阵的误标记样本检测方法 93
4.2.1 LOOPC矩阵 94
4.2.2 CL-stability方法 95
4.2.3 LOOE-sensitivity方法 96
4.3 基于扰动影响值的误标记样本检测方法 98
4.3.1 扰动影响值 98
4.3.2 基于扰动影响值的列算法 101
4.3.3 基于扰动影响值的行算法 103
4.3.4 行算法中的阈值调整策略 105
4.3.5 渐进修正的行算法 108
4.4 误标记样本检测方法的比较分析 111
4.4.1 测试数据集说明 111
4.4.2 测试指标说明 113
4.4.3 实验结果分析 113
4.5 小结 122
参考文献 122
第5章 基因表达数据中的差异表达基因识别 125
5.1 差异表达基因的研究背景及现状 125
5.2 T-test假设检验方法 126
5.3 SAM方法 127
5.4 RankProd方法 128
5.5 基于总体数据集变化量评估的检测方法 129
5.5.1 基因的表达变化量 129
5.5.2 总体数据集变化量评估 134
5.5.3 总体数据集评估方法的效果分析 136
5.6 小结 142
参考文献 142
第6章 基于微阵列数据的特征选择 144
6.1 特征选择算法的研究背景及现状 144
6.1.1 特征选择在基因芯片中的应用 144
6.1.2 基于微阵列数据的特征选择算法的研究现状 145
6.2 特征选择算法研究的相关基础 146
6.2.1 支持向量机(SVM) 146
6.2.2 支持向量机递归特征剔除(SVM-RFE) 147
6.2.3 改进的支持向量聚类算法(SVC-KM) 148
6.2.4 局部支持向量机(LLA) 148
6.3 多阶段特征选择算法 149
6.3.1 算法描述 149
6.3.2 算法流程 150
6.3.3 算法的实验验证 153
6.4 双向局部化特征选择算法 160
6.4.1 算法描述 160
6.4.2 算法流程 161
6.4.3 算法的实验验证 164
6.5 基于改进遗传算法的特征选择方法 169
6.5.1 算法描述 169
6.5.2 算法过程概括 169
6.5.3 算法流程 170
6.5.4 算法效果的实验分析 174
6.6 小结 177
参考文献 179
第7章 改进的双聚类算法在癌症基因芯片数据中的应用 182
7.1 基因芯片数据聚类算法简介 182
7.1.1 传统聚类算法概述 182
7.1.2 常用的传统聚类算法及其特点 183
7.1.3 传统聚类存在的不足 185
7.1.4 双聚类算法分类及其特点 185
7.1.5 Cheng-Church算法 187
7.2 改进的Cheng-Church算法及模拟数据分析 190
7.2.1 Cheng-Church算法的优缺点 190
7.2.2 Cheng-Church算法的改进 191
7.2.3 模拟数据分析 192
7.3 癌症基因芯片数据的双聚类分析 194
7.3.1 癌症基因芯片数据分析的意义 194
7.3.2 实验数据来源 195
7.3.3 特征基因的选择 199
7.3.4 双聚类分析 200
7.4 小结 205
参考文献 206