全民捕鱼注册送金币吧 > 云计算/大数据 > hadoop

授课机构:速学堂

hadoop

适合零基础学大数据的初学者

价      格免费

优惠活动   无

特色服务 社区交流 24H答疑 作业批改 系统化学习 资料下载
选择班次

报班即学,有效期320天

课程简介

  Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。


适合人群

  l 适合零基础学大数据的初学者

  l 想转行进入大数据行业的工作人员

  l 已经掌握Linux服务器内核和命令

  l 准备学习大数据框架内部结构

课程亮点

  尚学堂的Hadoop课程已经经历了5年的发展,版本1.x到现在的3.X一直处于行业的最前端,课程中也是从1.x开始讲起,直到3.x。包括各个版本的架构,节点划分,功能概括,协同调度,数据切分...让你直到Hadoop从1到3经历什么样的心路历程,也领略大数据处理时对技术的取舍,更好的把握大数据发展的方向。

主讲内容

  01讨论

  02历史

  03存储和架构模型

  04持久化

  05读写流程

  06伪分布式

  07全分布安装

  08高可用ha

  09联邦

  10高可用搭建理论

  11高可用搭建实操

  12单词统计

  13单词统计

  14mr1

  15mr2

  16jobtracker与resourcemanager

  17高可用搭建环境配置

  18高可用搭建实操

  19mrsource1

  20mr源码2

  21mrsource3

  22mrsource4

  23reduce源码

  24tq1

  25tq2

  26fd

  27pagerank1

  28pagerank2

  29tfidf

  30itemcf

猜您喜欢

我知道了

现在就与学习导师聊一聊

北京总部地址:北京市海淀区西三旗街道建材城西路中腾建华商务大厦东侧二层尚学堂

咨询电话:400-009-1906 010-56233821

Copyright 2007-2019 北京尚学堂科技有限公司 京ICP备13018289号-1 京公网安备11010802015183

博聚网