Distribution System
Syllabus
| Lecture | Reading Material/hints | Notes |
|---|---|---|
| 1. Prepare knowledge and coding in Java | - reflect in Java - anonymous inner class - Proxy in Java - abstract and interface - thread start() and runnable |
RPC and serialization |
| 2. Distribution File System(DFS) | Distribution File System (DFS) | |
| 3. MapReduce model | MapReduce处理系统 | |
| 4. MapReduce Coding | - 组合式MapReduce - 链式MapReduce - 迭代式MapReduce - C/C++ 与 python通信 |
MapReduce编程 |
| 5. Spark model | Spark 处理框架 | |
| 6. Spark Coding | - Spark Shell简单使用 - RDD操作 - Spark Submit |
Spark 编程 |
| 7. YARN and ZooKeeper | - Yarn之日志分析 |
- Yarn 资源管理框架 - ZooKeeper 元数据管理系统 |
| 8. DataFlow Framework | - Async-loop-died - Storm处理Stream Join的简单实例 |
流计算系统概述 |
| 9. Flink | - Flink 原理与实现:架构和拓扑概览 | 批流融合系统--Flink |
| 10. Spark v2 & Beam | 批流融合系统--展望 | |
| 11. 分布式图处理系统 | 分布式图处理系统--Pregel | |
| 12. 机器学习系统--mahout | 机器学习系统--mahout | |
| 13. 机器学习系统--GraphLab | 机器学习系统--GraphLab | |
| 14. 机器学习系统-- Parameter Server | 机器学习系统--Parameter Server |
Lab
- RPC model in Java
- hadoop安装与配置
- hadoop编程实践(一)
- hadoop编程实践(二)
- hadoop编程练习
- Hadoop 编程总结
- spark安装与配置
- spark编程实践
- spark编程练习
- Spark 编程总结
- 使用 Docker 配置 hadoop/spark
- 使用 docker 搭建 spark(2.3.1) 集群
- ZooKeeper配置及简单使用
- Yarn框架下的系统部署
- Storm部署与运行
- Storm编程练习
- Storm 编程总结
- SparkSteaming使用
- Flink安装及使用
- Flink编程练习(一)
- Flink编程练习(二)
- 常用图算法实现--Hadoop
- 常用图算法实现--Spark
- 常用图算法实现--Flink
- Giraph配置及使用
- Flink迭代小记
Recap
This GitBook notes are maintained by zealscott.