《GoogleBigQuery权威指南》[99M]百度网盘|pdf下载|亲测有效
《GoogleBigQuery权威指南》[99M]百度网盘|pdf下载|亲测有效

GoogleBigQuery权威指南 pdf下载

出版社 中国电力出版社
出版年 2021-08
页数 390页
装帧 精装
评分 8.9(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供GoogleBigQuery权威指南电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

产品特色

编辑推荐

适读人群 :本书面向数据分析师、数据工程师和数据科学家,帮助他们使用BigQuery从大数据集中获得见解。

大规模数据仓库、数据分析和机器学习.
你是否需要从PB级数据中获取洞察,你是否希望构建协作、敏捷的工作空间?本书是Google BigQuery的规范参考书,它的存储系统可以帮助你整合企业的全部数据,其查询引擎可以支持对大型数据集的交互式分析和机器学习。BigQuery帮助企业在一个便捷的框架中有效地存储、查询、导入数据,并从中学习。
本书作者提供了在基于serverless、自动扩缩容的公共云上建立现代数据仓库的最佳实践。无论你是想更全面地了解BigQuery,还是想专注于特定的任务,这份详尽的指南都必不可少。
“BigQuery改变了企业思考数据的方式。Jordan和Lak是最了解BigQuery的人,本书是学习BigQuery的最佳途径。”
——Lloyd Tabb
Looker公司联合创始人及首席技术官

内容简介

  你是否需要从PB级数据中获取洞察,你是否希望构建协作、敏捷的工作空间?该书是Google BigQuery的规范参考书,它的存储系统可以帮助你整合企业的全部数据,其查询引擎可以支持对大型数据集的交互式分析和机器学习。BigQuery帮助企业在一个便捷的框架中有效地存储、查询、导人数据,并从中学习。
  该书作者提供了在基于serverless。自动扩缩容的公共云上建立现代数据仓库的实践。无论你是想更全面地了解BigQuery,还是想专注于特定的任务,这份详尽的指南都必不可少。
  ·深入探讨BigQuery的内部工作方式,包括其整体架构。
  ·学习BigQuery支持的数据类型、函数和运算符。
  ·优化查询语句和schema,从而提高性能或降低成本。
  ·使用标准soL中高级功能,如GIS。历史快照、DDL/DML、用户定义函数和脚本。
  ·使用BigQuery ML解决各类机器学习问题。
  ·学习如何保护数据、监控作业,以及授权用户。

作者简介

  [美]瓦利阿帕·拉克什曼南(Valliappa Lakshmanan)是Google Cloud的数据分析和AI解决方案负责人。他的团队借助BigQuery和Google Cloud上的其他数据分析、机器学习产品,构建软件解决方案来解决业务问题。
  
  乔丹·蒂加尼(Jordan Tigani)是BigQuery的产品管理总监。作为BigQuery的创始工程师之一,他帮助数据仓库发展成为Google Cloud中成功的产品之一。他拥有20年的软件开发经验。

内页插图

精彩书评

  ★“BigQuery改变了企业思考数据的方式。Jordan和Lak是了解BigQuery的人,该书是学习BigQuery的途径。”
  ——Lloyd Tabb Looker公司联合创始人及首席技术官

目录

前言

第1章 Google BigQuery是什么
数据处理架构
关系数据库管理系统
MapReduce框架
BigQuery: 一个Serverless、分布式SQL引擎
使用BigQuery
从数据集中获得洞察
ETL、EL和ELT
强大的分析能力
易于管理
BigQuery起源
是什么使BigQuery成为可能?
计算和存储分离
存储和网络基础设施
存储托管
与Google Cloud Platform集成
安全与合规
小结

第2章 基础查询语法
简单查询
使用SELECT检索行
使用AS给列设置别名
使用WHERE进行过滤
SELECT*、EXCEPT和REPLACE
带WITH的子查询
使用ORDER BY进行排序
聚合
使用GROUP BY计算聚合
使用COUNT统计记录数
使用HAVING过滤分组项
使用DISTINCT查找唯一值
数组与结构体简介
使用ARRAY_AGG创建数组
结构体数组
元组
使用数组
UNNEST数组
Join表
Join释疑
内连接
交叉连接
外连接
保存和分享
查询历史记录和缓存
已保存的查询
视图与分享查询
小结
……
第3章 数据类型、函数和运算符数值类型和函数
第4章 将数据加载到BigQuery
第5章 使用BiaQuerv进行开发
第6章 BigQuery架构
第7章 性能与成本优化
第8章 高级查询
第9章 BigQuery中的机器学习
第10章 BigQuery安全管理
作者介绍
封面介绍

前言/序言

  现如今,越来越多的企业都是数据驱动的,而数据仓库则是任何数据战略的关键组成之一,它是整个公司数据的中央存储库。数据仓库通常被数据分析人员用来创建分析报告,但现在它也越来越多地被用于生成实时仪表盘、执行即席查询,以及通过预测分析提供决策指导。由于存在这些高级分析需求,以及逐渐向成本可控、敏捷和自助数据访问转变的趋势,许多组织正转向基于云的数据仓库,如Google BigQuery。在本书中,我们将全面介绍BigQuery,它是基于serverless的、高度可伸缩、低成本的企业数据仓库,可在Google Cloud上使用。由于不需要管理基础设施,企业可以专注于数据分析,通过使用熟悉的SQL找到有意义的洞察。BigQuery设计的初衷就是为了提供一个数据平台,该平台不仅能够提供最前沿的技术能力,能充分利用云环境中现有的优秀技术,还支持至今仍可靠适用的各种数据技术。例如,Google的BigQuery是一种serverless的计算架构,它实现了计算和存储分离。这使得架构中的不同层能够独立地运行和扩展,让数据开发人员在设计和部署方面具备了灵活性。BigQuery有一些独特的功能,它支持本地机器学习和地理空间分析。通过Cloud Pub/Sub、Cloud Dataflow、CloudBigtable、Cloud AI Platform和许多第三方集成工具,BigQuery可以与传统及现代系统交互,并满足各类吞吐量和延迟需求。此外,BigQuery还支持ANSI标准的SQL、列优化和联邦查询,这些特性是实现用户自助式、即席数据分析的关键。
  读者对象
  本书面向数据分析师、数据工程师和数据科学家,帮助他们使用BigQuery从大数据集中获得见解。数据分析师可以通过SQL、仪表板工具(如Looker、Data Studio和Tableau)与BigQuery交互。数据工程师可以借助Apache Spark和Apache Beam等框架,用Python或Java编写数据pipeline,并将其与BigQuery集成。数据科学家可以在BigQuery中构建机器学习模型,对BigQuery中的数据运行TensorFlow模型,并在Jupyter notebook译注1中委托BigQuery执行分布式大规模运算。