书籍详情
《大数据原理与实践:复杂信息的准备、共享和分析朱尔斯,J,》[49M]百度网盘|亲测有效|pdf下载
  • 大数据原理与实践:复杂信息的准备、共享和分析朱尔斯,J,

  • 出版社:辽海出版社图书专营店
  • 出版时间:2020-06
  • 热度:11708
  • 上架时间:2024-06-30 09:38:03
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

基本信息

书名:大数据原理与实践:复杂信息的准备、共享和分析(原书第2版)

定价:119元

作者:[美]朱尔斯,J,伯曼(Jules,J,Berman),张桂刚邢春晓

出版社:机械工业出版社

出版日期:2020-06-01

ISBN:9787111657903

字数:

页码:372

版次:2

装帧:平装

开本:16开

商品重量:

编辑推荐


内容提要


当大数据资源变得越发复杂时,仅靠更强大的计算机系统已无法解决问题。本书带我们重新审视数据准备环节,重点讨论了其中至关重要但又常常被忽略的主题——标识符、不变性、内省和数据索引。此外,书中也涵盖常见的与大数据设计、架构、操作和分析相关的内容,以及涉及法律、社会和伦理问题的非技术性章节。全书视角独特,涉猎广博,尤以医学大数据分析见长,强调基本原理,不关注编程细节和数学公式,适合企业决策者、技术专家以及计算机相关专业的学生阅读。

目录


译者序 n
第2版前言 n
版前言 n
作者简介 n
章 引言1 n
11 大数据的定义1 n
12 大数据与小数据2 n
13 大数据在哪里5 n
14 大数据 常见的目的是产生小数据6 n
15 大数据是研究领域的中心话题6 n
术语表7 n
参考文献11 n
第2章 为非结构化数据提供结构13 n
21 几乎所有数据都是非结构化的、 n
 不可用的原始形式13 n
22 词汇索引14 n
23 术语提取16 n
24 构建索引19 n
25 自动编码20 n
26 案例研究:宇宙中任意原子位置的快速定位(需要安装一些软件)24 n
27 案例研究(高级):一个完整的自动编码器(12行Python代码)26 n
28 案例研究:以词汇索引进行文本转换28 n
29 案例研究(高级):Burrows Wheeler变换30 n
术语表32 n
参考文献43 n
第3章 标识、去标识和重标识45 n
31 什么是标识符45 n
32 标识符和标识系统之间的区别46 n
33 生成标识符48 n
34 糟糕的标识方法50 n
35 注册对象标识符53 n
36 去标识和重标识55 n
37 案例研究:数据清理57 n
38 案例研究(高级):图像标题中的标识符59 n
39 案例研究:单向散列函数61 n
术语表63 n
参考文献69 n
第4章 元数据、语义和三元组71 n
41 元数据71 n
42 可扩展标记语言71 n
43 语义和三元组72 n
44 命名空间74 n
45 案例研究:三元组的语法75 n
46 案例研究:Dublin Core77 n
术语表78 n
参考文献80 n
第5章 分类和本体论81 n
51 关于对象关系的81 n
52 分类: 简单的本体84 n
53 本体:有多个父类的类86 n
54 分类模型选择88 n
55 类混合91 n
56 本体开发的常见陷阱92 n
57 案例研究:上层本体93 n
58 案例研究(高级):悖论94 n
59 案例研究(高级):RDF框架和类属性96 n
510 案例研究(高级):可视化类关系98 n
术语表102 n
参考文献111 n
第6章 内省113 n
61 自我认知113 n
62 数据对象:每个大数据集合中 基本的元素116 n
63 大数据如何使用内省117 n
64 案例研究:时间戳数据119 n
65 案例研究:TripleStore 简介121 n
66 案例研究(高级):大数据必须是面向对象的证明125 n
术语表126 n
参考文献127 n
第7章 标准和数据集成128 n
71 标准128 n
72 规范与标准132 n
73 版本控制134 n
74 合规问题135 n
75 案例研究:标准化巧克力茶壶135 n
术语表136 n
参考文献137 n
第8章 不变性和性139 n
81 数据不变性的重要性139 n
82 不变性和标识符140 n
83 数据产生数据142 n
84 跨机构协调标识符143 n
85 案例研究:可信时间戳144 n
86 案例研究:区块链和分布式账本145 n
87 案例研究(高级):零知识协调147 n
术语表148 n
参考文献150 n
第9章 评估大数据资源的充分性152 n
91 观察数据152 n
92 大数据的 小必要属性158 n
93 附加条件的数据161 n
94 案例研究:用于查看和搜索大型文件的实用程序162 n
95 案例研究:数据扁平化164 n
术语表164 n
参考文献169 n
0章 测量170 n
101 准确性与精度170 n
102 数据范围171 n
103 计数173 n
104 数据标准化和变换176 n
105 约简数据179 n
106 理解控制181 n
107 没有实际意义的统计意义182 n
108 案例研究:基因计数183 n
109 案例研究:早期生物特征和狭窄数据范围的意义184 n
术语表185 n
参考文献186 n
1章 快速简单的大数据分析必不可少的技巧188 n
111 速度和可扩展性188 n
112 适用于大数据的快速操作,并且每台计算机都支持193 n
113 点积—一种简单快速的相关方法197 n
114 聚类199 n
115 数据持久性方法(不使用数据库)201 n
116 案例研究:爬升分类202 n
117 案例研究(高级):数据库示例203 n
118 案例研究(高级):NoSQL205 n
术语表205 n
参考文献209 n
2章 寻找大型数据集中的线索211 n
121 分母211 n
122 词频分布212 n
123 异常值和异常215 n
124 封底分析216 n
125 案例研究:预测用户偏好218 n
126 案例研究:人口数据的多模态219 n
127 案例研究:大小黑洞220 n
术语表220 n
参考文献224 n
3章 使用数将大数据分析问题的规模缩小225 n
131 (伪)数的显著效用225 n
132 重采样230 n
133 蒙特卡罗模拟法234 n
134 案例研究:中心极限定理的证明236 n
135 案例研究:发生一连串小概率事件的频率237 n
136 案例研究:臭名昭著的生日问题238 n
137 案例研究(高级):蒙提霍尔问题239 n
138 案例研究(高级):贝叶斯分析241 n
术语表242 n
参考文献244 n
4章 大数据分析中的特殊注意事项246 n
141 数据搜索理论246 n
142 理论搜索中的数据247 n
143 巨大的偏差248 n
144 大数据的数据子集:不可加和不传递251 n
145 其他大数据陷阱252 n
146 案例研究(高级):维数灾难254 n
术语表257 n
参考文献258 n
5章 大数据的失败以及如何避免260 n
151 失败很常见260 n
152 失败的标准261 n
153 复杂性264 n
154 逐步走进大数据分析265 n
155 失败之后272 n
156 案例研究:癌症生物医学信息学网格—遥远的桥273 n
157 案例研究:高斯Copula函数277 n
术语表278 n
参考文献280 n
6章 数据再分析:比分析更重要283 n
161 次分析(几乎)总是错的283 n
162 为什么再分析比分析更重要285 n
163 案例研究:旧JADE对撞机数据的再分析287 n
164 案例研究:通过再分析证明287 n
165 案例研究:从旧数据中寻找新行星288 n
术语表289 n
参考文献290 n
7章 大数据再利用294 n
171 什么是数据再利用294 n
172 暗数据、废弃数据和遗留数据296 n
173 案例研究:从邮政编码到人口统计学基础297 n
174 案例研究:基因序列数据库的科学推断298 n
175 案例研究:将全球变暖与高强度飓风联系起来298 n
176 案例研究:用地质数据推断气候趋势299 n
177 案例研究:环月影像恢复工程299 n
术语表301 n
参考文献301 n
8章 数据共享和数据安全303 n
181 什么是数据共享,为什么我们不共享更多数据303 n
182 常见的不满303 n
183 数据安全和加密协议308 n
184 案例研究:火星上的生命313 n
185 案例研究:个人标识符314 n
术语表315 n
参考文献317 n
9章 合法性320 n
191 对数据的准确性和合法性负责320 n
192 创建、使用和共享资源的权利322 n
193 因使用标准而招致的版权和专利侵权行为324 n
194 对个人的保护325 n
195 许可问题326 n
196 未经许可的数据330 n
197 隐私策略332 n
198 案例研究:大数据的时效性333 n
199 案例:哈瓦苏派的故事334 n
术语表335 n
参考文献336 n
第20章 社会问题338 n
201 公众的大数据感知338 n
202 用大数据降低成本和提高生产效率340 n
203 公众的疑虑342 n
204 从自己做起343 n
205 谁是大数据344 n
206 傲慢和夸张349 n
207 案例研究:公民科学家351 n
208 案例研究:乔治·奥威尔的《1984》354 n
术语表354 n
参考文献355

作者介绍


朱尔斯·J 伯曼(Jules J Berman) 拥有麻省理工学院数学和地球与行星科学两个学士学位,天普大学哲学博士学位,以及迈阿密大学医学博士学位。撰写信息科学、计算机程序设计和病理学三个专业领域的著作近20本。2006年,伯曼博士成为美国病理信息学协会主席,2011年荣获该协会终身成就奖。

序言