Distribution System

Syllabus

Lecture Reading Material/hints Notes
1. Prepare knowledge and coding in Java - reflect in Java
- anonymous inner class
- Proxy in Java
- abstract and interface
- thread start() and runnable
RPC and serialization
2. Distribution File System(DFS) Distribution File System (DFS)
3. MapReduce model MapReduce处理系统
4. MapReduce Coding - 组合式MapReduce
- 链式MapReduce
- 迭代式MapReduce
- C/C++ 与 python通信
MapReduce编程
5. Spark model Spark 处理框架
6. Spark Coding - Spark Shell简单使用
- RDD操作
- Spark Submit
Spark 编程
7. YARN and ZooKeeper - Yarn之日志分析
- Yarn 资源管理框架
- ZooKeeper 元数据管理系统
8. DataFlow Framework - Async-loop-died
- Storm处理Stream Join的简单实例
流计算系统概述
9. Flink - Flink 原理与实现:架构和拓扑概览 批流融合系统--Flink
10. Spark v2 & Beam 批流融合系统--展望
11. 分布式图处理系统 分布式图处理系统--Pregel
12. 机器学习系统--mahout 机器学习系统--mahout
13. 机器学习系统--GraphLab 机器学习系统--GraphLab
14. 机器学习系统-- Parameter Server 机器学习系统--Parameter Server

Lab

Recap

This GitBook notes are maintained by zealscott.

@Last updated at 1/27/2021

results matching ""

    No results matching ""