Java学习者论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

恭喜Java学习者论坛(https://www.javaxxz.com)已经为数万Java学习者服务超过8年了!积累会员资料超过10000G+
成为本站VIP会员,下载本站10000G+会员资源,购买链接:点击进入购买VIP会员
JAVA高级面试进阶视频教程Java架构师系统进阶VIP课程

分布式高可用全栈开发微服务教程

Go语言视频零基础入门到精通

Java架构师3期(课件+源码)

Java开发全终端实战租房项目视频教程

SpringBoot2.X入门到高级使用教程

大数据培训第六期全套视频教程

深度学习(CNN RNN GAN)算法原理

Java亿级流量电商系统视频教程

互联网架构师视频教程

年薪50万Spark2.0从入门到精通

年薪50万!人工智能学习路线教程

年薪50万!大数据从入门到精通学习路线年薪50万!机器学习入门到精通视频教程
仿小米商城类app和小程序视频教程深度学习数据分析基础到实战最新黑马javaEE2.1就业课程从 0到JVM实战高手教程 MySQL入门到精通教程
查看: 9058|回复: 278

【No308】《图解Spark 核心技术与案例实战》PDF

[复制链接]
  • TA的每日心情
    开心
    2021-12-13 21:45
  • 签到天数: 15 天

    [LV.4]偶尔看看III

    发表于 2021-4-4 19:09:41 | 显示全部楼层 |阅读模式

    资源名称:

    【No308】《图解Spark 核心技术与案例实战》PDF

    百度地址:

    网盘链接:请先登录后查看此内容

    失效声明:

    如果资料失效,VIP和荣耀会员或者使用金币兑换的普通会员,可以直接联系资料客服QQ索取:QQ。在线时间为:8:00-23:30。请下载后24小时内删除,若侵权请联系客服删除该资料。

    如何获取:

    1,本资料VIP会员下载地址直接可见,购买VIP:点击购买会员>>,开通后可下载全站所有资料。
    2,非会员使用5000Java金币兑换,金币充值:点击进入充值页面

    资源描述及截图:

    第1章  Spark及其生态圈概述
    1.1  Spark简介
    1.1.1  什么是Spark
    1.1.2  Spark与MapReduce比较
    1.1.3  Spark的演进路线图
    1.2  Spark生态系统
    1.2.1  Spark Core
    1.2.2  Spark Streaming
    1.2.3  Spark SQL
    1.2.4  BlinkDB
    1.2.5  MLBase/MLlib
    1.2.6  GraphX
    1.2.7  SparkR
    1.2.8  Alluxio
    1.3  小结
    第2章  搭建Spark实战环境
    2.1  基础环境搭建
    2.1.1  搭建集群样板机
    2.1.2  配置集群环境
    2.2  编译Spark源代码
    2.2.1  配置Spark编译环境
    2.2.2  使用Maven编译Spark
    2.2.3  使用SBT编译Spark
    2.2.4  生成Spark部署包
    2.3  搭建Spark运行集群
    2.3.1  修改配置文件
    2.3.2  启动Spark
    2.3.3  验证启动
    2.3.4  第一个实例
    2.4  搭建Spark实战开发环境
    2.4.1  CentOS中部署IDEA
    2.4.2  使用IDEA开发程序
    2.4.3  使用IDEA阅读源代码
    2.5  小结

    第二篇  核心篇
    第3章  Spark编程模型
    3.1  RDD概述
    3.1.1  背景
    3.1.2  RDD简介
    3.1.3  RDD的类型
    3.2  RDD的实现
    3.2.1  作业调度
    3.2.2  解析器集成
    3.2.3  内存管理
    3.2.4  检查点支持
    3.2.5  多用户管理
    3.3  编程接口
    3.3.1  RDD分区(Partitions)
    3.3.2  RDD首选位置(PreferredLocations)
    3.3.3  RDD依赖关系(Dependencies)
    3.3.4  RDD分区计算(Iterator)
    3.3.5  RDD分区函数(Partitioner)
    3.4  创建操作
    3.4.1  并行化集合创建操作
    3.4.2  外部存储创建操作
    3.5  转换操作
    3.5.1  基础转换操作
    3.5.2  键值转换操作
    3.6  控制操作
    3.7  行动操作
    3.7.1  集合标量行动操作
    3.7.2  存储行动操作
    3.8  小结
    第4章  Spark核心原理
    4.1  消息通信原理
    4.1.1  Spark消息通信架构
    4.1.2  Spark启动消息通信
    4.1.3  Spark运行时消息通信
    4.2  作业执行原理
    4.2.1  概述
    4.2.2  提交作业
    4.2.3  划分调度阶段
    4.2.4  提交调度阶段
    4.2.5  提交任务
    4.2.6  执行任务
    4.2.7  获取执行结果
    4.3  调度算法
    4.3.1  应用程序之间
    4.3.2  作业及调度阶段之间
    4.3.3  任务之间
    4.4  容错及HA
    4.4.1  Executor异常
    4.4.2  Worker异常
    4.4.3  Master异常
    4.5  监控管理
    4.5.1  UI监控
    4.5.2  Metrics
    4.5.3  REST
    4.6  实例演示
    4.6.1  计算年降水实例
    4.6.2  HA配置实例
    4.7  小结
    第5章  Spark存储原理
    5.1  存储分析
    5.1.1  整体架构
    5.1.2  存储级别
    5.1.3  RDD存储调用
    5.1.4  读数据过程
    5.1.5  写数据过程
    5.2  Shuffle分析
    5.2.1  Shuffle简介
    5.2.2  Shuffle的写操作
    5.2.3  Shuffle的读操作
    5.3  序列化和压缩
    5.3.1  序列化
    5.3.2 压缩
    5.4  共享变量
    5.4.1  广播变量
    5.4.2  累加器
    5.5  实例演示
    5.6  小结
    第6章  Spark运行架构
    6.1  运行架构总体介绍
    6.1.1  总体介绍
    6.1.2  重要类介绍
    6.2  本地(Local)运行模式
    6.2.1  运行模式介绍
    6.2.2  实现原理
    6.3  伪分布(Local-Cluster)运行模式
    6.3.1  运行模式介绍
    6.3.2  实现原理
    6.4  独立(Standalone)运行模式
    6.4.1  运行模式介绍
    6.4.2  实现原理
    6.5  Yarn运行模式
    6.5.1  Yarn运行框架
    6.5.2  YARN-Client运行模式介绍
    6.5.3  YARN-Client 运行模式实现原理
    6.5.4  YARN-Cluster运行模式介绍
    6.5.5  YARN-Cluster 运行模式实现原理
    6.5.6  YARN-Client与YARN-Cluster对比
    6.6  Mesos运行模式
    6.6.1  Mesos介绍
    6.6.2  粗粒度运行模式介绍
    6.6.3  粗粒度实现原理
    6.6.4  细粒度运行模式介绍
    6.6.5  细粒度实现原理
    6.6.6  Mesos粗粒度和Mesos细粒度对比
    6.7  实例演示
    6.7.1  独立运行模式实例
    6.7.2  YARN-Client实例
    6.7.3  YARN-Cluster实例
    6.8  小结

    第三篇  组件篇
    第7章  Spark SQL
    7.1  Spark SQL简介
    7.1.1  Spark SQL发展历史
    7.1.2  DataFrame/Dataset介绍
    7.2  Spark SQL运行原理
    7.2.1  通用SQL执行原理
    7.2.2  SparkSQL运行架构
    7.2.3  SQLContext运行原理分析
    7.2.4  HiveContext介绍
    7.3  使用Hive-Console
    7.3.1  编译Hive-Console
    7.3.2  查看执行计划
    7.3.3  应用Hive-Console
    7.4  使用SQLConsole
    7.4.1  启动HDFS和Spark Shell
    7.4.2  与RDD交互操作
    7.4.3  读取JSON格式数据
    7.4.4  读取Parquet格式数据
    7.4.5  缓存演示
    7.4.6  DSL演示
    7.5  使用Spark SQL CLI
    7.5.1  配置并启动Spark SQL CLI
    7.5.2  实战Spark SQL CLI
    7.6  使用Thrift Server
    7.6.1  配置并启动Thrift Server
    7.6.2  基本操作
    7.6.3  交易数据实例
    7.6.4  使用IDEA开发实例
    7.7  实例演示
    7.7.1  销售数据分类实例
    7.7.2  网店销售数据统计
    7.8  小结
    第8章  Spark Streaming
    8.1  Spark Streaming简介
    8.1.1  术语定义
    8.1.2  Spark Streaming特点
    8.2  Spark Streaming编程模型
    8.2.1  DStream的输入源
    8.2.2  DStream的操作
    8.3  Spark Streaming运行架构
    8.3.1  运行架构
    8.3.2  消息通信
    8.3.3  Receiver分发
    8.3.4  容错性
    8.4  Spark Streaming运行原理
    8.4.1  启动流处理引擎
    8.4.2  接收及存储流数据
    8.4.3  数据处理
    8.5  实例演示
    8.5.1  流数据模拟器
    8.5.2  销售数据统计实例
    8.5.3  Spark Streaming+Kafka实例
    8.6  小结
    第9章  Spark MLlib
    9.1  Spark MLlib简介
    9.1.1  Spark MLlib介绍
    9.1.2  Spark MLlib数据类型
    9.1.3  Spark MLlib基本统计方法
    9.1.4  预言模型标记语言
    9.2  线性模型
    9.2.1  数学公式
    9.2.2  线性回归
    9.2.3  线性支持向量机
    9.2.4  逻辑回归
    9.2.5  线性最小二乘法、Lasso和岭回归
    9.2.6  流式线性回归
    9.3  决策树
    9.4  决策模型组合
    9.4.1  随机森林
    9.4.2  梯度提升决策树
    9.5  朴素贝叶斯
    9.6  协同过滤
    9.7  聚类
    9.7.1  K-means
    9.7.2  高斯混合
    9.7.3  快速迭代聚类
    9.7.4  LDA
    9.7.5  二分K-means
    9.7.6  流式K-means
    9.8  降维
    9.8.1  奇异值分解降维
    9.8.2  主成分分析降维
    9.9  特征提取和变换
    9.9.1  词频―逆文档频率
    9.9.2  词向量化工具
    9.9.3  标准化
    9.9.4  范数化
    9.10  频繁模式挖掘
    9.10.1  频繁模式增长
    9.10.2  关联规则挖掘
    9.10.3  PrefixSpan
    9.11  实例演示
    9.11.1  K-means聚类算法实例
    9.11.2  手机短信分类实例
    9.12  小结
    第10章  Spark GraphX
    10.1  GraphX介绍
    10.1.1  图计算
    10.1.2  GraphX介绍
    10.1.3  发展历程
    10.2  GraphX实现分析
    10.2.1  GraphX图数据模型
    10.2.2  GraphX图数据存储
    10.2.3  GraphX图切分策略
    10.2.4  GraphX图操作
    10.3  实例演示
    10.3.1  图例演示
    10.3.2  社区发现演示
    10.4  小结
    第11章  SparkR
    11.1  概述
    11.1.1  R语言介绍
    11.1.2  SparkR介绍
    11.2  SparkR与DataFrame
    11.2.1  DataFrames介绍
    11.2.2  与DataFrame的相关操作
    11.3  编译安装SparkR
    11.3.1  编译安装R语言
    11.3.2  安装SparkR运行环境
    11.3.3  安装SparkR
    11.3.4  启动并验证安装
    11.4  实例演示
    11.5  小结
    第12章  Alluxio
    12.1  Alluxio简介
    12.1.1  Alluxio介绍
    12.1.2  Alluxio系统架构
    12.1.3  HDFS与Alluxio
    12.2  Alluxio编译部署
    12.2.1  编译Alluxio
    12.2.2  单机部署Alluxio
    12.2.3  集群模式部署Alluxio
    12.3  Alluxio命令行使用
    12.3.1  接口说明
    12.3.2  接口操作示例
    12.4  实例演示
    12.4.1  启动环境
    12.4.2  Alluxio上运行Spark
    12.4.3  Alluxio上运行MapReduce
    12.5  小结

    本书附录部分请到博文视点网站下载www.broadview.com.cn/30236
    回复

    使用道具 举报

    该用户从未签到

    发表于 2021-4-8 10:20:40 | 显示全部楼层
    路过还不错
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2023-11-22 09:18
  • 签到天数: 50 天

    [LV.5]常住居民I

    发表于 2021-4-10 15:56:21 | 显示全部楼层
    谢谢楼主的辛苦分享
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2021-4-13 16:59:03 | 显示全部楼层
    这个论坛真好
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2024-10-25 19:35
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    发表于 2021-4-14 18:50:10 | 显示全部楼层
    是我找了很久的资料,谢谢楼主
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2023-10-18 18:37
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    发表于 2021-4-15 18:55:14 | 显示全部楼层
    是我想要的资料、
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    难过
    2023-4-26 17:30
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    发表于 2021-4-16 17:27:36 | 显示全部楼层
    不错,下载看看
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2022-10-28 11:53
  • 签到天数: 34 天

    [LV.5]常住居民I

    发表于 2021-4-17 14:44:19 | 显示全部楼层
    支持!!!!!!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2024-7-21 13:42
  • 签到天数: 38 天

    [LV.5]常住居民I

    发表于 2021-4-19 11:21:49 | 显示全部楼层
    太感谢楼主了
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2021-4-20 09:14:12 | 显示全部楼层
    期待中......
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|Java学习者论坛 ( 声明:本站资料整理自互联网,用于Java学习者交流学习使用,对资料版权不负任何法律责任,若有侵权请及时联系客服屏蔽删除 )

    GMT+8, 2024-12-22 23:41 , Processed in 0.335506 second(s), 47 queries .

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表