大数据相关的资料信息整理篇

星期一, 2020-04-13 | Author: Lee | 大数据 | 1,474 views

1.大数据相关的资料信息 需要了解和掌握的东西记录下

1.大数据技术知识

第一章:基础组件篇

分布式协调系统:ZooKeeper

大数据基础平台:Hadoop

第二章:数据采集篇

分布式日志采集系统:Flume、Canal

分布式导入数据系统:Sqoop

第三章:数据存储篇

分布式数据仓库:Hive

分布式列式数据库:HBase

分布式消息系统:Kafka

分布式列式存储系统:Kudu

第四章:数据处理篇

快速通用的分布式计算引擎:Spark

新一代的分布式计算引擎:Flink

第五章:调度篇

分布式调度系统:Azkaban

第六章:OLAP篇

分布式内存实时分析系统:Druid

实时多维分析系统:Kylin

第七章:源码篇

分布式文件系统HDFS源码深度剖析

经典分布式计算模型MapReduce源码深度剖析

分布式消息系统Kafka源码深度剖析

新一代计算引擎内核SparkCore源码深度剖析

2.大数据中台架构设计实践篇

第一章:大数据架构设计篇

企业级大数据架构方案

企业级大数据架构方案落地

第二章:千亿级数仓库架构设计篇

数据仓库设计

企业级案例实战

Tags:

文章作者: Lee

本文地址: https://www.pomelolee.com/2059.html

除非注明,Pomelo Lee文章均为原创,转载请以链接形式标明本文地址

No comments yet.

Leave a comment

Search

文章分类

Links

Meta