400-009-1906
我们的优势

北京尚学堂大数据在业界内是最早大数据课程的开创者

课程体系目前在业界内最全面,课程设置流程最合理

课程在深度和广度上相比业内其他机构更深、更广

课程顺应时代需求,不断增加主流技术,让学员更具竞争力

大数据老师真正来自于大企业,具备多年实战和教学经验

课程顺应时代需求,不断增加主流技术,让学员更具竞争力

就业服务+面试题+简历指导,跟踪就业辅导

老学员遍布各大企业,工作内推机会多,不定期老学员交流活动

咨询了解详情
六大企业实训项目
  • 中国银行审计数据集市平台

  • 电商日志分析数据挖掘项目

  • 电信CMCC基站掉话率分析系统

  • 酷狗音乐数据中心平台

中国银行审计数据集市平台

项目介绍:

中国银行审计数据集市平台项目是一个集在线大数据分析、疑点扫描、风险评估、事件预警、跟踪预警、线索聚集、数据表级操作为一体的通用平台。其中主要内容包含数据仓库的建设,数据集市建设,数据流转分析等功能。本项目可以让我们学习到真正的大数据公司如何对数据仓库及数据集市平台进行设计和搭建,如何对数据进行模型化分析,此项目基于同学们掌握的大数据基础知识进行实战化训练,强化同学们对数据模型的建立。

技术架构:

  • sqoop
  • Flume
  • HDFS
  • CDH
  • Azkaban
  • Hive
  • Hbase
  • Zookeeper

大型电商日志分析和数据挖掘综合项目

项目介绍:

用户在访问 Web 站点的过程中,服务器会记录这些访问形成访问日志。对访问日志进行必要的处理可以获取大量的决策数据。就电子商务网站而言,处理网站访问日志有助于为网站的管理者提供决策支持进而指导网站运营,如改善网站结构提升用户体验;进行关键词营销提升流量、促进转化、提升效益;分析用户行为进行个性化的推荐和营销来提高网站的核心竞争力,在激烈的市场竞争中保持优势。

技术架构:

  • CDH
  • flume
  • sqoop
  • HDFS
  • Mapreduce
  • Hive
  • Hbase
  • Zookeeper
  • mysql
  • oozie

电信CMCC基站掉话率分析系统

项目介绍:

移动用户在使用移动通信的过程中,电信基站服务器会记录这些访问形成访问日志。对访问日志进行必要的处理可以获取大量的决策数据。就移动通信公司而言,处理移动通信访问日志有助于为移动通信公司的管理者提供决策支持进而指导网络运营,如改善基站部署结构提升用户体验;进行定点营销提升网络利用率、促进转化、提升效益;分析用户行为进行个性化的推荐和营销来提高移动网络的核心竞争力,在激烈的市场竞争中保持优势。

技术架构:

  • storm
  • kafka
  • flume
  • javaee

酷狗音乐数据中心平台

项目介绍:

用户在选择播放音乐或者搜索音乐时,数据平台会对用户产生的行为进行记录,同时获取操作日志详细信息,对用户行为进行必要的处理可以获取大量的决策数据。就公司核心模块而言,处理用户产生的行为事件,有助于公司产品的改良,用户体验感的提升,提高产品的核心竞争力。

技术架构:

  • CDH
  • Flume
  • sqoop
  • HDFS
  • Spark
  • Hive
  • Hbase
  • Zookeeper
  • mysql
  • yarn
  • superset
  • kylin
获取项目教程与源码
领取机器学习 (100课时)平台架构(140课时)
大数据174.35G视频
行业大咖 倾囊相授
对话行业大咖
好口碑、用数据说话
咨询了解详情
大数据零基础班课程大纲

第一阶段:预科班

HTML、CSS、12306案例、初识Java、数据类型和运算符、控制语句和方法、数组、双色 球案例

第二阶段:JavaSE

面向对象编程、异常机制、Java常用类、数据结构和算法、集合(容器)、IO流、多线程、 网络编程、集合提升训练、多线程提升训练

第三阶段:数据库

MySQL入门、数据库表、DDL、DML、简单查询、连接查询和子查询、索引、视图、事务、 存储过程、JDBC及其案例、使用Properties读取属性文件、Log4j、连接池、反射技术、使用反射模拟ORM框架、三大范式、使用PowerDesigner进行数据库建模、UML建模、手写Web服务器案例、设计模式、MyBatis

第四阶段:Web前端

JavaScript、jQuery、Bootstrap、购物车

第五阶段:JavaEE

Tomcat与HTTP、Servlet基础、会话技术与Servlet域对象、JSP基本语法、JSP内建对象、 EL+JSTL、Filter&Listener、MVC架构、JSON与Ajax、分页技术、文件上传/下载、项目:SXTOA

第六阶段:高级框架

Spring、SpringMVC、EasyUI、RBAC、MyBatis Plus、支付、短信验证、二选一项目: 未来出行汽车租赁平台/Ting域主持人团队

第七阶段:框架强化阶段

MWare、Linux、Maven、Spring Boot、HikariCP、Druid、Spring Boot Admin、 logback、Quartz、Shiro、Swagger、Git、项目:至尊智能家居

第八阶段:分布式

Zookeeper、RPC、Dubbo、Redis、Solr、RabbitMQ、FastDFS、Nignx、Spring Security、Spring Session、Spring Data for Apache Solr、Spring Data Redis、MyBatis Generator、MyCat、大型分布式项目:百战商城

第九阶段:微服务

Elastic Search、MongoDB、Spring Data ES、Spring Cloud Netflix Eureka、CAP定理、Spring Cloud Netflix Ribbon、Spring Cloud OpenFeign、Spring Cloud Netflix Hystrix、Spring Cloud Config、Spring AMQP、Spring Cloud Gateway、Docker、SpringCloud Kubernetes、LCN、Vue、前后端分离+移动项目:livegoods房屋海选平台

第十阶段:项目分析设计

小蚂金服、WMS大中型电商企业智能仓储系统、智能云招聘平台、分布式医疗云计算平台

第十一阶段:Linux和高并发

操作系统介绍、Linux内核、Linux系统搭建、Liunx命令操作、Linux Shell编写、Linux文件系统、Linux高级命令使用、文本分析、用户管理、组管理、系统权限管理、网络管理、Linux系统软件安装、Linux进程管理、网络基础、TCP/IP协议、Net网络、LVS、keepalive、Nginx、IO模型、Session缓存、Memcached

第十二阶段:Hadoop生态体系

Hadoop文件处理、HDFS架构、Hadoop权限管理、HDFS分布式搭建、Hadoop3新特性、 MapReduce、Yarn资源调度和任务调度、MapReduce源码分析、案例分析、Hive架构原理、Hive集群搭建、HiveDML操作、分区分桶、拉链表、Hive事务、Hive安全管理、Hive存储与压缩、Hbase架构、Hbase操作、Hbase Java api、Hbase压缩与存储、Flume架构、Flume Source、Flume Channel、Flume Sink、Sqoop架构、Sqoop操作数据、zookeeper架构原理、zookeeper分布式搭建、ElasticSearch、Lucene、CDH、ClouderaManager安装与部署、Hue架构及原理、Impala机构及原理、Oozie架构和原理

第十三阶段:Strom流式计算

Kafka架构原理、Kakfa集群搭建、Kafka命令操作、Leader均衡机制、生产消费数据模型、Redis架构、Redis命令操作、Storm场景、Storm架构模型、异步与同步、分组策略、drpc、数据整合

第十四阶段:Spark计算框架体系

Scala、Scala IDE使用、类型推断、Scala函数与方法、柯里化、集合可变与不可变、元组、样例类、模式匹配、Trait、隐式转换、隐式参数、隐式值、隐式类、Actor通信模型、Scala迭代器模式、Spark运行模式、Spark核心RDD、Spark容错、Spark算子操作、Spark持久化、SparkCheckpoint、Standalone模式资源调度和任务调度原理、Yarn模式资源调度和任务调度原理、Spark术语、宽窄依赖、SparkStage、Pipeline计算模式、粗粒数与细粒度资源调度、推测执行、二次排序、分组取topN、Spark源码分析、广播变量、累加器、WEBUI、Master HA、SparkShuffle、Spark文件寻址、内存管理、Shark、SparkSQL、谓词下推、DataFrame操作、Spark on Hive、UDF、UDAF、开窗函数、SparkStreaming 原理、流式框架对比分析、数据流程、算子操作、窗口操作、状态管理、DriverHA、SparkStreaming与 Kafka 整合方式及版本变化对比、Receiver模式、Direct 模式、手动维护offset、参数配置、反压机制

第十五阶段:机器学习和算法体系

python、python函数、python os、python设计模式、numpy库、矩阵操作、PySpark、线性回归算法、多元线性回归算法、梯度下降、随机梯度下降、过拟合、欠拟合、贝叶斯算法、拉普拉斯估计、KNN 算法、距离度量、K-means 聚类算法、Kmeans++算法、K 值确定、TF-IDF算法、逻辑回归算法、傅里叶变换、最大似然估计、导数及求导法则、log 对数操作、混淆矩阵、归一化、ROC、AUC、推荐系统、lambda架构解析、python数据分析、dubbo 应用、垃圾邮件分类、微博聚类、道路拥堵预测

第十六阶段:Flink实时计算体系

Flink架构原理、Flink实时计算框架、Flink计算模型、无界数据流、有界数据流、 Flink-checkpoint、savePoint、Flink窗口操作、容错检查点、Flink任务提交、算子链、Flink集群搭建、Flink HA、任务槽、Flink dataSet、Flink DataStream、Flink SQL、Flink on Yarn、Flink+Kafka整合、Flink广播变量、Flink累加器、Flink Time、Watermark、并行度设置、Flink CEP处理

第十七阶段:平台架构师课程体系

数据仓库理论基础、OLTP、OLAP、钻取、上卷、切片、切块、翻转、Kylin架构原理、Kylin cub、维度爆炸、KyLin配置、事实表、维度表、星型模型、雪花模型、模型RowKey原则、降维、关联列、层级维度、KyLin元数据保存、KyLin JDBC访问方式、KyLin与Kafka整合、MapReduce详细源码分析、Hive优化、Hive小文件处理、Hive JVM重用、数据倾斜处理、任务监控、预分区、Hbase Htable并发操作、多线程、BlockCache、Htablepool、Spark算子源码详细分析、Master源码、Worker源码分析、Driver源码分析、Application注册源码分析、资源调度源码分析、SparkShuffle源码分析、资源优化、并行度优化、自定义分区器、Spark数据结构优化、内存优化、Shuffle调优、数据倾斜解决方案、线性不可分问题处理、调整分类阈值、鲁棒性优化、均值归一化、逻辑回归训练方法选择

大数据就业班课程大纲

第一阶段:预科班

HTML、CSS、12306案例、初识Java、数据类型和运算符、控制语句和方法、数组、双色 球案例

第二阶段:JavaSE

面向对象编程、异常机制、Java常用类、数据结构和算法、集合(容器)、IO流、多线程、 网络编程、集合提升训练、多线程提升训练

第三阶段:数据库

MySQL入门、数据库表、DDL、DML、简单查询、连接查询和子查询、索引、视图、事务、 存储过程、JDBC及其案例、使用Properties读取属性文件、Log4j、连接池、反射技术、使用反射模拟ORM框架、三大范式、使用PowerDesigner进行数据库建模、UML建模、手写Web服务器案例、设计模式、MyBatis

第四阶段:Web前端

JavaScript、jQuery、Bootstrap、购物车

第五阶段:JavaEE

Tomcat与HTTP、Servlet基础、会话技术与Servlet域对象、JSP基本语法、JSP内建对象、 EL+JSTL、Filter&Listener、MVC架构、JSON与Ajax、分页技术、文件上传/下载、项目:SXTOA

第六阶段:高级框架

Spring、SpringMVC、EasyUI、RBAC、MyBatis Plus、支付、短信验证、二选一项目: 未来出行汽车租赁平台/Ting域主持人团队

第七阶段:Linux和高并发

操作系统介绍、Linux内核、Linux系统搭建、Liunx命令操作、Linux Shell编写、Linux文件系统、Linux高级命令使用、文本分析、用户管理、组管理、系统权限管理、网络管理、Linux系统软件安装、Linux进程管理、网络基础、TCP/IP协议、Net网络、LVS、keepalive、Nginx、IO模型、Session缓存、Memcached

第八阶段:Hadoop生态体系

Hadoop文件处理、HDFS架构、Hadoop权限管理、HDFS分布式搭建、Hadoop3新特性、 MapReduce、Yarn资源调度和任务调度、MapReduce源码分析、案例分析、Hive架构原理、Hive集群搭建、HiveDML操作、分区分桶、拉链表、Hive事务、Hive安全管理、Hive存储与压缩、Hbase架构、Hbase操作、Hbase Java api、Hbase压缩与存储、Flume架构、Flume Source、Flume Channel、Flume Sink、Sqoop架构、Sqoop操作数据、zookeeper架构原理、zookeeper分布式搭建、ElasticSearch、Lucene、CDH、ClouderaManager安装与部署、Hue架构及原理、Impala机构及原理、Oozie架构和原理

第九阶段:Strom流式计算

Kafka架构原理、Kakfa集群搭建、Kafka命令操作、Leader均衡机制、生产消费数据模型、Redis架构、Redis命令操作、Storm场景、Storm架构模型、异步与同步、分组策略、drpc、数据整合

第十阶段:Spark计算框架体系

Scala、Scala IDE使用、类型推断、Scala函数与方法、柯里化、集合可变与不可变、元组、样例类、模式匹配、Trait、隐式转换、隐式参数、隐式值、隐式类、Actor通信模型、Scala迭代器模式、Spark运行模式、Spark核心RDD、Spark容错、Spark算子操作、Spark持久化、SparkCheckpoint、Standalone模式资源调度和任务调度原理、Yarn模式资源调度和任务调度原理、Spark术语、宽窄依赖、SparkStage、Pipeline计算模式、粗粒数与细粒度资源调度、推测执行、二次排序、分组取topN、Spark源码分析、广播变量、累加器、WEBUI、Master HA、SparkShuffle、Spark文件寻址、内存管理、Shark、SparkSQL、谓词下推、DataFrame操作、Spark on Hive、UDF、UDAF、开窗函数、SparkStreaming 原理、流式框架对比分析、数据流程、算子操作、窗口操作、状态管理、DriverHA、SparkStreaming与 Kafka 整合方式及版本变化对比、Receiver模式、Direct 模式、手动维护offset、参数配置、反压机制

第十一阶段:机器学习和算法体系

python、python函数、python os、python设计模式、numpy库、矩阵操作、PySpark、线性回归算法、多元线性回归算法、梯度下降、随机梯度下降、过拟合、欠拟合、贝叶斯算法、拉普拉斯估计、KNN 算法、距离度量、K-means 聚类算法、Kmeans++算法、K 值确定、TF-IDF算法、逻辑回归算法、傅里叶变换、最大似然估计、导数及求导法则、log 对数操作、混淆矩阵、归一化、ROC、AUC、推荐系统、lambda架构解析、python数据分析、dubbo 应用、垃圾邮件分类、微博聚类、道路拥堵预测

第十二阶段:Flink实时计算体系

Flink架构原理、Flink实时计算框架、Flink计算模型、无界数据流、有界数据流、 Flink-checkpoint、savePoint、Flink窗口操作、容错检查点、Flink任务提交、算子链、Flink集群搭建、Flink HA、任务槽、Flink dataSet、Flink DataStream、Flink SQL、Flink on Yarn、Flink+Kafka整合、Flink广播变量、Flink累加器、Flink Time、Watermark、并行度设置、Flink CEP处理

第十三阶段:平台架构师课程体系

数据仓库理论基础、OLTP、OLAP、钻取、上卷、切片、切块、翻转、Kylin架构原理、Kylin cub、维度爆炸、KyLin配置、事实表、维度表、星型模型、雪花模型、模型RowKey原则、降维、关联列、层级维度、KyLin元数据保存、KyLin JDBC访问方式、KyLin与Kafka整合、MapReduce详细源码分析、Hive优化、Hive小文件处理、Hive JVM重用、数据倾斜处理、任务监控、预分区、Hbase Htable并发操作、多线程、BlockCache、Htablepool、Spark算子源码详细分析、Master源码、Worker源码分析、Driver源码分析、Application注册源码分析、资源调度源码分析、SparkShuffle源码分析、资源优化、并行度优化、自定义分区器、Spark数据结构优化、内存优化、Shuffle调优、数据倾斜解决方案、线性不可分问题处理、调整分类阈值、鲁棒性优化、均值归一化、逻辑回归训练方法选择

大数据高手班课程大纲

第一阶段:Linux和高并发

操作系统介绍、Linux内核、Linux系统搭建、Liunx命令操作、Linux Shell编写、Linux文件系统、Linux高级命令使用、文本分析、用户管理、组管理、系统权限管理、网络管理、Linux系统软件安装、Linux进程管理、网络基础、TCP/IP协议、Net网络、LVS、keepalive、Nginx、IO模型、Session缓存、Memcached

第二阶段:Hadoop生态体系

Hadoop文件处理、HDFS架构、Hadoop权限管理、HDFS分布式搭建、Hadoop3新特性、 MapReduce、Yarn资源调度和任务调度、MapReduce源码分析、案例分析、Hive架构原理、Hive集群搭建、HiveDML操作、分区分桶、拉链表、Hive事务、Hive安全管理、Hive存储与压缩、Hbase架构、Hbase操作、Hbase Java api、Hbase压缩与存储、Flume架构、Flume Source、Flume Channel、Flume Sink、Sqoop架构、Sqoop操作数据、zookeeper架构原理、zookeeper分布式搭建、ElasticSearch、Lucene、CDH、ClouderaManager安装与部署、Hue架构及原理、Impala机构及原理、Oozie架构和原理

第三阶段:Strom流式计算

Kafka架构原理、Kakfa集群搭建、Kafka命令操作、Leader均衡机制、生产消费数据模型、Redis架构、Redis命令操作、Storm场景、Storm架构模型、异步与同步、分组策略、drpc、数据整合

第四阶段:Spark计算框架体系

Scala、Scala IDE使用、类型推断、Scala函数与方法、柯里化、集合可变与不可变、元组、样例类、模式匹配、Trait、隐式转换、隐式参数、隐式值、隐式类、Actor通信模型、Scala迭代器模式、Spark运行模式、Spark核心RDD、Spark容错、Spark算子操作、Spark持久化、SparkCheckpoint、Standalone模式资源调度和任务调度原理、Yarn模式资源调度和任务调度原理、Spark术语、宽窄依赖、SparkStage、Pipeline计算模式、粗粒数与细粒度资源调度、推测执行、二次排序、分组取topN、Spark源码分析、广播变量、累加器、WEBUI、Master HA、SparkShuffle、Spark文件寻址、内存管理、Shark、SparkSQL、谓词下推、DataFrame操作、Spark on Hive、UDF、UDAF、开窗函数、SparkStreaming 原理、流式框架对比分析、数据流程、算子操作、窗口操作、状态管理、DriverHA、SparkStreaming与 Kafka 整合方式及版本变化对比、Receiver模式、Direct 模式、手动维护offset、参数配置、反压机制

第五阶段:机器学习和算法体系

python、python函数、python os、python设计模式、numpy库、矩阵操作、PySpark、线性回归算法、多元线性回归算法、梯度下降、随机梯度下降、过拟合、欠拟合、贝叶斯算法、拉普拉斯估计、KNN 算法、距离度量、K-means 聚类算法、Kmeans++算法、K 值确定、TF-IDF算法、逻辑回归算法、傅里叶变换、最大似然估计、导数及求导法则、log 对数操作、混淆矩阵、归一化、ROC、AUC、推荐系统、lambda架构解析、python数据分析、dubbo 应用、垃圾邮件分类、微博聚类、道路拥堵预测

第六阶段:Flink实时计算体系

Flink架构原理、Flink实时计算框架、Flink计算模型、无界数据流、有界数据流、 Flink-checkpoint、savePoint、Flink窗口操作、容错检查点、Flink任务提交、算子链、Flink集群搭建、Flink HA、任务槽、Flink dataSet、Flink DataStream、Flink SQL、Flink on Yarn、Flink+Kafka整合、Flink广播变量、Flink累加器、Flink Time、Watermark、并行度设置、Flink CEP处理

第七阶段:平台架构师课程体系

数据仓库理论基础、OLTP、OLAP、钻取、上卷、切片、切块、翻转、Kylin架构原理、Kylin cub、维度爆炸、KyLin配置、事实表、维度表、星型模型、雪花模型、模型RowKey原则、降维、关联列、层级维度、KyLin元数据保存、KyLin JDBC访问方式、KyLin与Kafka整合、MapReduce详细源码分析、Hive优化、Hive小文件处理、Hive JVM重用、数据倾斜处理、任务监控、预分区、Hbase Htable并发操作、多线程、BlockCache、Htablepool、Spark算子源码详细分析、Master源码、Worker源码分析、Driver源码分析、Application注册源码分析、资源调度源码分析、SparkShuffle源码分析、资源优化、并行度优化、自定义分区器、Spark数据结构优化、内存优化、Shuffle调优、数据倾斜解决方案、线性不可分问题处理、调整分类阈值、鲁棒性优化、均值归一化、逻辑回归训练方法选择

获取详细课程大纲
每12名学员有8名来自老学员推荐
好老师!好课程!造就好口碑

回忆起在尚学堂学习的岁月,自己都感到非常庆幸!

好想留住在尚学堂那一段奋斗的岁月,感谢每一位老师!

尚学堂的教学模式真的无人能及,有理论还有实战,毕业找工作都是轻而易举的事情!

讲真,这里的老师都很可爱,讲解也很透彻并且很有激情,很给力!

我爱尚学堂,不需要解释!感谢尚学堂,让我重回校园时光!

培训我只服尚学堂,不管是线下课程还是线上视频还是书籍,都特别棒!

在学校只学了理论,尚学堂还有实战,我现在工作中用到的百分之八十的知识

都是从尚学堂学习到的,非常感谢!

我是尚学堂的忠实粉丝,教给我很多真本领!

尚学堂的公司文化、学生管理都非常棒,希望你们越来越好!

查看更多学员心声