手机上看 切换到窄版 快捷导航
注册
查看: 272|回复: 1

[Spark/Scala] 《Spark 1.X 大数据平台V2》炼数成金大数据视频教程 11月份班 10周课程完整版-云计算大数据技术

[复制链接]

184

主题

417

帖子

6万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
65313
发表于 2017-11-26 14:21:05 | 显示全部楼层 |阅读模式



下载地址
游客,如果您要查看本帖隐藏内容请回复

《Spark 1.X 大数据平台V2》炼数成金大数据视频教程 11月份班 10周课程完整版






      







      



课程介绍《Spark 大数据平台》  本课程内容全面涵盖了Spark生态系统的概述及其编程模型,深入内核的研究,Spark on Yarn,Spark Streaming流式计算原理与实践
Spark SQL,基于Spark的机器学习,图计算,Techyon,Spark的多语言编程以及SparkR的原理和运行。面向研究Spark的学员,它是一门非常有学习指引意义的课程。
时间:共10周

-------------------课程目录-------------------

第一周 Spark生态系统概述与编程模型  Spark生态系统概述
  回顾Hadoop MapReduce
  Spark运行模式
  RDD
  Spark运行时模型简介
  缓存策略介绍
  transformation
  action
  lineage
  容错处理
  宽依赖与窄依赖
  集群配置

第二周 深入Spark内核
  Spark术语解释
  集群概览
  核心组件
  数据本地性
  常用RDD
  任务调度
  DAGScheduler
  TaskScheduler
  Task细节
  广播变量
  累加器
  性能调优

第三周 Spark on Yarn  Spark as a service
  Spark on Yarn原理
  Spark on Yarn实践
  JobServer架构
  JobServer API介绍
  JobServer配置与部署

第四周 Spark Streaming原理与实践
  DStream
  数据源
  无状态transformation与有状态transformation
  checkpoint
  容错
  性能优化

第五周 Shark与Spark SQL
  Shark数据模型
  Shark数据类型
  Shark架构
  Shark部署
  缓存(分区)表
  SharkServer
  Shark与Spark结合
  Spark SQL架构
  Parquet支持
  DSL
  SQL on RDD
  Hive支持
  UDF
  JDBC Server

第六周 Machine Learning on Spark
  LinearRegression
  K-Means
  Collaborative Filtering

第七周 Spark多语言编程
  Python简介
  PySpark API
  使用Python编写Spark程序
  Spark with Java

第八周 图计算GraphX
  现存的图计算框架
  Table Operators
  Graph Operators
  GraphX设计

第九周 Tachyon原理与实践
  Tachyon原理与架构
  Tachyon实践

第十周 SparkR
  SparkR原理介绍
  安装配置与运行

回复

使用道具 举报

0

主题

19

帖子

77

积分

vip会员

Rank: 1

积分
77
发表于 2018-2-7 21:32:11 | 显示全部楼层
谢谢分享,下来看看噢批
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

 
 



邮件留言:


 

游戏源码

GMT+12, 2019-9-18 01:32 , Processed in 0.501831 second(s), 29 queries , Gzip On.

快速回复 返回顶部 返回列表