本篇主要提供机器学习互联网业务实践王帅计算机与互联网书籍电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
商品基本信息,请以下列介绍为准 | |
商品名称: | 机器学习互联网业务实践 |
作者: | 王帅 |
定价: | 128.0 |
出版社: | 电子工业出版社 |
出版日期: | 2019-09-01 |
ISBN: | 9787121355684 |
印次: | |
版次: | |
装帧: | |
开本: | 24开 |
内容简介 | |
互联网产业正在从IT时代迈入DT时代(数据时代),同时互联网产业的繁荣也催生了黑灰产这样的群体。那么,在数据时代应该如何应对互联网业务威胁?机器学习技术在互联网业务领域的应用正是答案。本书先从机器学原理入手,自成体系地介绍了机器学基础知识,从数学的角度揭示了算法模型背后的基本原理;然后介绍了互联网业务所涉及的重要业务场景,以及机器学习技术在这些场景中的应用实践;*后介绍了如何应用互联网技术栈来建设业务技术架构。作者根据多年的一线互联网公司从业经验给出了很多独到的见解,供读者参考。本书既适合机器学习从业者作为入门参考书,也适合互联网业务从业者学灰产对抗手段,帮助他们做到知己知彼,了解如何应用机器学习技术来提高与黑灰产对抗的能力。 |
目录 | |
第1章 互联网业务简述 1 1.1 互联网业务现状 1 1.2 如何应对挑战 4 1.3 本章小结 6 参考资料 6 第2章 机器学习入门 8 2.1 相似性 9 2.1.1 范数 9 2.1.2 度量 12 2.2 矩阵 20 2.2.1 线性空间 20 2.2.2 线性算子 24 2.3 空间 33 2.3.1 内积空间 33 2.3.2 欧几里得空间(Euclid space) 34 2.3.3 酉空间 37 2.3.4 赋范线性空间 38 2.3.5 巴拿赫空间 39 2.3.6 希尔伯特空间 43 2.3.7 核函数 44 2.4 机器学数学结构 46 2.4.1 线性结构与非线性结构 46 2.4.2 图论基础 47 2.4.3 树 56 2.4.4 神经网络 62 2.4.5 深度网络结构 80 2.4.6 小结 95 2.5 统计基础 96 2.5.1 贝叶斯统计 96 2.5.2 共轭先验分布 99 2.6 策略与算法 106 2.6.1 凸优化的基本概念 106 2.6.2 对偶原理 120 2.6.3 非线性规划问题的解决方法 129 2.6.4 无约束问题的化方法 134 2.7 机器学习算法应用的经验 145 2.7.1 如何定义机器学习目标 145 2.7.2 如何从数据中获取价值的信息 149 2.7.3 评估模型的表现 154 2.7.4 测试效果远差于预期怎么办 156 2.8 本章小结 159 参考资料 160 第3章 模型 163 3.1 基本概念 163 3.2 模型评价指标 166 3.2.1 混淆矩阵 167 3.2.2 分类问题的基础指标 167 3.2.3 ROC曲线与AUC 171 3.2.4 基尼系数 173 3.2.5 回归问题的评价指标 175 3.2.6 交叉验证 175 3.3 回归算法 177 3.3.1 二乘法 177 3.3.2 脊回归 181 3.3.3 Lasso回归线性模型 181 3.3.4 多任务Lasso 181 3.3.5 L1、L2正则杂谈 182 3.4 分类算法 183 3.4.1 CART算法 183 3.4.2 支持向量机 186 3.5 降维 188 3.5.1 贝叶斯网络 189 3.5.2 主成分分析 195 3.6 主题模型LDA 198 3.6.1 马尔可夫链蒙特卡罗法 198 3.6.2 贝叶斯网络与生成模型 199 3.6.3 学习方法在LDA中的应用 206 3.7 集成学习方法(Enle Method) 215 3.7.1 Boosting方法 216 3.7.2 Bootstrap Aggregating方法 220 3.7.3 Sta方法 221 3.7.4 小结 222 参考资料 223 第4章 机器学基 226 4.1 简介 226 4.2 Python机器学习基础环境 228 4.2.1 Jupyter Notebook 228 4.2.2 Numpy、Scipy、Matplotlib和pandas 231 4.2.3 scikit-learn、gensim、TensorFlow和Keras 250 4.3 Scala的基础库 266 4.3.1 Zeppelin 266 4.3.2 Breeze 267 4.3.3 Spark MLlib 276 4.4 本章小结 281 参考资料 282 第5章 机器学金刚钻 283 5.1 简介 283 5.2 XGBoost 284 5.3 Prediction IO(PIO) 287 5.3.1 部署PIO 287 5.3.2 机器学习模型引擎的开发 294 5.3.3 机器学习模型引擎的部署 296 5.3.4 PIO系统的优化 297 5.4 Caffe 298 5.5 TensorFlow 304 5.6 BigDL 306 5.7 本章小结 308 参考资料 308 第6章 账户业务 310 6.1 背景介绍 310 6.2 账户保障 312 6.2.1 注册环节 312 6.2.2 登录环节 314 6.3 聚类算法在账户中的应用 315 6.3.1 K-Means算法 315 6.3.2 高斯混合模型(GMM) 317 6.3.3 OPTICS算法和DBSCAN算法 326 6.3.4 应用案例 331 6.4 本章小结 334 参考资料 334 第7章台业务 335 7.1 背景介绍 335 7.2 电台业务 338 7.3 社台业务 343 7.4 复杂网络算法台业务中的应用 346 7.4.1 在电台作弊团伙识别中的应用 346 7.4.2 在识别虚假社交关系中的应用 351 7.5 本章小结 353 参考资料 354 第8章 内容业务 355 8.1 背景介绍 355 8.2 如何做好内容业务工作 357 8.2.1 面临的挑战 357 8.2.2 部门协作 358 8.2.3 技术体系 359 8.3 卷积神经网络在内容业务中的应用 361 8.3.1 人工神经网络(Artificial Neural Network) 361 8.3.2 深度神经网络(Deep Neural Network) 367 8.3.3 卷积神经网络(Convolutional Neural Network) 379 8.3.4 应用案例 392 8.4 本章小结 405 参考资料 405 第9章 信息业务 406 9.1 背景介绍 406 9.2 反欺诈业务 407 9.3 反爬虫业务 412 9.3.1 验证问题的可分性 412 9.3.2 提升模型效果 413 9.4 循环神经网络在信息中的应用 414 9.4.1 原始RNN(Vanilla RNN) 414 9.4.2 LSTM算法及其变种 415 9.4.3 应用案例 419 9.5 本章小结 429 参考资料 430 第10章 信贷业务 432 10.1 背景介绍 432 10.2 信贷业务简介 434 10.3 分类算法在信贷业务中的应用 438 10.3.1 典型分类算法的介绍 438 10.3.2 应用案例:逻辑回归模型在信贷中风控阶段的应用 463 10.4 本章小结 468 参考资料 469 第11章 业务系统技术架构 470 11.1 整体介绍 470 11.2台层 471 11.3 数据层 473 11.4 策略层 474 11.5 服务层 480 11.6 业务层 481 11.7 本章小结 484 参考资料 484 第12章结与展望 486 12.1结 486 12.2 展望 487 参考资料 489 后记一 490 后记二 491 本书常见数学符号定义 492 |
√ 垃圾注册||薅羊毛|信息泄露,反欺诈|反爬虫|账户|内容|信贷,完整方案|成熟体系与一手实践。 √ 利用机器学习扩大风险识别范围|提高风险识别的度|提升业务的自动化,跨与AI领域的入行指南。 √ 业务从业者可用来快速选择至优机器学习方案,算法工程师可用来了解ML业务应用之处以备深入研究。 √ 覆盖真实业务场景|机器学习算法原理|算法实现优化与生产环境上线迭代,与常胜高手过招一般快速力。 |
媒体评论 | |
对于行业来说,业务正随着业务形态的复杂化而变得越来越具有挑战性,本书从概念到实例都有比较详细的讲解,能够帮助阅读者更好地思考和学习,提供业务需求相关的更多技术选择。 ——张作裕? 钉钉 CRO ——陈朝钢? 风控架构师 机器学习是多学科交叉的领域,有极广泛的应用。作为一名互联网行业的从业者,很高兴从本书中看到了知识与正义的共鸣:从的视角探索机器学应用,以高端的技术构筑互联网业务的防护盾。本书作者对业务的理解深刻,从数学基础、模型算法、系统应用方面对机器学习知行了梳理,值得点赞和学习。 ——陈景东? 蚂蚁金服技术专家 机器学习、都是目前互联网领域的热门研究方向,两者的交叉更是的研究热点之一。这本书深入浅出,从机器学基础理论、模型出发,一步步揭示如何将机器学习应用在业务中,书中既有理论的讲解也有经验结,值得机器学习和业务的开发人员学习和借鉴。 ——邓钦华? 网易云音乐算法智能部负责人 在业务形势日益严峻的今天,如何利用机器学习扩大风险的识别范围,提高风险识别的度,提升业务的自动化,是业务从业人员高度关注的问题。本书作者对业务中常用的机器学习算法和模行了深入的讲解,并通过反欺诈、反爬虫、账户、内容、信贷等实际案例指引读者在业务工作中选择和应用合适的算法和模型。作者将他们的丰富实战经验完整教授给读者,不仅授人以鱼,更授人以渔。 阅读本书,做业务工作的同学可以快速为自己的业务选择合适的机器学习方案;设计算法的同学可以了解机器学习在业务应用中的之处,激发灵感,对机器学习在业务中的应行更深入的研究。 市面上鲜有图书既深入讲解机器学习算法和模型,又毫无保留地分享在业务实践中应用机器学经验,本书尤其值得业务的初学者深入研读。 ——许瑞? 唯品会业务负责人 通常我认为有两类(机器学习)算法书比较:一类是书中的知识体系是自洽的,读者不需要同时查阅其他资料就可以学习;另一类是将知识和实践有机结合,不会让读者有学习屠龙术之感,能很快上手实践。难得的是,这两个特征都体现在本书中,因而此书入智能网络领域的一本棒的入门书籍。知易行难,让我们像作者一样在机器学习这条路上漫漫求索吧。 ——张金? 搜索事业部? 算法专家 |