山河都在眼里 发表于 2024-9-12 11:38:23

尚硅谷大数据项目之电商数仓5.0 优化数据仓库架构与海量数据处理最佳策略 全面可视化

尚硅谷大数据项目之电商数仓5.0 优化数据仓库架构与海量数据处理最佳策略 全面可视化

课程介绍

在课程中,我系统地学习了电商数仓的概念和核心原理。我了解到电商数仓是一个综合性的数据存储和分析平台,用于收集、清洗、建模和分析海量的电商数据。通过学习实践项目,我深入了解了如何设计和优化数据仓库架构,包括数据模型设计、维度建模和事实表设计等。我还学会了如何使用ETL工具进行数据抽取、转换和加载,以及如何应对数据仓库的性能优化和查询优化。在实践项目的过程中,我学习了海量数据处理的最佳策略。我了解了分布式计算和并行处理的概念,学会了使用Hadoop和Spark等工具进行大规模数据处理和分析。通过学习数据分区和数据切片等技术,我能够高效地处理和查询海量数据。此外,我还学到了如何应对数据倾斜和数据倾斜问题,以保证数据处理的平衡和效率。

最重要的是,我学会了如何实现数据的全面可视化。通过学习数据可视化工具和技术,我能够将数据以直观、易理解的方式展示出来,帮助业务团队和决策者更好地理解和利用数据。我还学到了如何构建智能报表和仪表盘,通过数据透视和交互式可视化,提供更深入的数据洞察和决策支持。

课程目录

├─代码.zip
├─笔记.zip
├─资料.zip
(1)\视频;目录中文件数:200个
├─001_离线数仓_课程简介.mp4
├─002_数仓概念-数仓简介.mp4
├─003_数仓概念-数据分类.mp4
├─004_数仓概念-数仓总体介绍.mp4
├─005_数仓概念-项目需求分析.mp4
├─006_数仓概念-技术选型.mp4
├─007_数仓概念-系统数据流程.mp4
├─008_数仓概念-框架版本的选择.mp4
├─009_数仓概念-具体版本号选择.mp4
├─010_数仓概念-服务器选型.mp4
├─011_数仓概念-集群规模.mp4
├─012_数仓概念-集群资源规划.mp4
├─013_同步行为数据模拟-埋点简介.mp4
├─014_用户行为数据模拟-用户行为日志内容.mp4
├─015_用户行为数据模拟-埋点日志格式.mp4
├─016_用户行为数据模拟-克隆三台服务器.mp4
├─017_用户行为数据模拟-阿里云准备(备选).mp4
├─018_用户行为数据模拟-集群同步脚本.mp4
├─019_用户行为数据模拟-免密登录配置.mp4
├─020_用户行为数据模拟-安装JDK.mp4
├─021_用户行为数据模拟-Linux环境变量说明.mp4
├─022_用户行为数据模拟-模拟数据.mp4
├─023_用户行为数据采集-hadoop安装.mp4
├─024_用户行为数据采集-Hadoop项目经验.mp4
├─025_用户行为数据采集-Zookeeper安装.mp4
├─026_用户行为数据采集-Kafka安装.mp4
├─027_用户行为数据采集-Flume安装.mp4
├─028_用户行为数据采集-Flume的KafkaChannel.mp4
├─029_用户行为数据采集-采集Flume配置.mp4
├─030_业务数据采集-电商业务简介.mp4
├─031_业务数据采集-电商业务表结构.mp4
├─032_业务数据采集-业务数据模拟.mp4
├─033_业务数据采集-业务数据通道.mp4
├─034_业务数据采集-Maxwell简介.mp4
├─035_业务数据采集-Maxwell配置.mp4
├─036_业务数据采集-Maxwell使用.mp4
├─037_业务数据采集-采集通道maxwell配置.mp4
├─038_实时数仓数据同步-实时数仓同步数据.mp4
├─039_离线数仓数据同步-用户行为数据同步通道.mp4
├─040_离线数仓数据同步-用户行为数据同步flume配置.mp4
├─041_离线数仓数据同步-业务数据同步策略.mp4
├─042_业务数据采集-DataX简介.mp4
├─043_业务数据采集-DataX部署.mp4
├─044_业务数据采集-DataX案例.mp4
├─045_业务数据采集-DataX的HdfsWriter的Null值存储问题.mp4
├─046_业务数据采集-DataX参数调优.mp4
├─047_业务数据采集-全量同步流程.mp4
├─048_业务数同步-增量同步流程.mp4
├─049_业务数据同步-集群总启停脚本.mp4
├─050_业务数据同步-Hive安装部署.mp4
├─051-数据仓库-概述.mp4
├─052-数据仓库-核心架构.mp4
├─053-建模方法论.mp4
├─054-建模方法论-ER模型-数据库规范化.mp4
├─055-建模方法论-ER模型-函数依赖.mp4
├─056-建模方法论-ER模型-三范式.mp4
├─057-建模方法论-维度模型-概述.mp4
├─058-采集集群-要求.mp4
├─059-维度模型-事实表-事务事实表-概述.mp4
├─060-维度模型-事实表-事务事实表-设计流程.mp4
├─061-维度模型-事实表-事务事实表-不足.mp4
├─062-维度模型-事实表-周期快照事实表.mp4
├─063-维度模型-事实表-累积快照表.mp4
├─064-维度模型-维度表-设计步骤.mp4
├─065-维度模型-维度表-确定维度属性-要点.mp4
├─066-维度模型-维度表-维度设计要点-规范化&反规范化.mp4
├─067-维度模型-维度表-维度设计要点-维度变化-全量表.mp4
├─068-维度模型-维度表-维度设计要点-维度变化-拉链表-制作和使用.mp4
├─069-维度模型-维度表-维度设计要点-多值维度.mp4
├─070-维度模型-维度表-维度设计要点-多值属性.mp4
├─071-维度模型-对同步策略的影响.mp4
├─072-设计-分层规划.mp4
├─073-设计-构建流程.mp4
├─074-构建流程-数据调研-业务调研.mp4
├─075-构建流程-数据调研-需求分析.mp4
├─076-构建流程-划分数据域.mp4
├─077-构建流程-构建总线矩阵&维度模型设计.mp4
├─078-构建流程-明确统计需求-指标体系.mp4
├─079-构建流程-明确统计需求-汇总模型设计思路.mp4
├─080-运行环境-说明.mp4
├─081-运行环境-Hive-on-spark-编译源码.mp4
├─082-运行环境-Hive-on-spark-部署.mp4
├─083-开发环境-使用说明.mp4
├─084-数据准备-日志.mp4
├─085-数据准备-业务-全量&增量.mp4
├─086-Hive-on-spark环境问题排查思路.mp4
├─087-ODS层-设计要点.mp4
├─088-ODS层-日志表-设计思路.mp4
├─089-ODS层-日志表-json表.mp4
├─090-ODS层-日志表-复杂数据类型.mp4
├─091-ODS层-日志表-建表语句.mp4
├─092-ODS层-日志表-数据装载.mp4
├─093-ODS层-日志表-数据装载脚本.mp4
├─094-ODS层-业务表-建表语句-全量&增量.mp4
├─095-ODS层-数据装载.mp4
├─096-DataGrip元数据显示异常问题说明.mp4
├─097-DIM层-维度模型规划.mp4
├─098-DIM层-设计要点.mp4
├─099-DIM层-商品维度表-确定主维表和相关维表.mp4
├─100-DIM层-商品维度表.mp4
├─101-DIM层-优惠券维度表.mp4
├─102-Hive元数据中文乱码问题说明.mp4
├─103-DIM层-活动维度.mp4
├─104-DIM层-地区维度.mp4
├─105-DIM层-日期维度.mp4
├─106-DIM层-用户维度-拉链表-建表语句.mp4
├─107-DIM层-用户维度-拉链表-数据装载-首日.mp4
├─108-DIM层-用户维度-拉链表-数据装载-每日-思路一.mp4
├─109-DIM层-用户维度-拉链表-数据装载-每日-思路二.mp4
├─110-DIM层-数据装载.mp4
├─111-DWD层-设计要求.mp4
├─112-DWD层-交易域加购事务事实表-建表语句.mp4
├─113-DWD层-交易域加购事务事实表-数据流向.mp4
├─114-DWD层-交易域加购事务事实表-数据装载-首日.mp4
├─115-DWD层-交易域加购事务事实表-数据装载-每日.mp4
├─116-DWD层-Hiveserver2-文件描述符问题说明.mp4
├─117-DWD层-交易域下单事实表.mp4
├─118-DWD层-交易域下单事实表-数据装载-首日和每日.mp4
├─119-DWD层-交易域取消订单事实表-建表语句.mp4
├─120-DWD层-交易域取消订单事实表-数据装载-首日和每日.mp4
├─121-DWD层-交易域支付成功事实表-建表语句.mp4
├─122-DWD层-交易域支付成功事实表-数据装载-首日和每日.mp4
├─123-DWD层-交易域退单事实表.mp4
├─124-DWD层-交易域退款成功事实表.mp4
├─125-DWD层-交易域购物车周期快照表.mp4
├─126-DWD层-工具域优惠券业务分析.mp4
├─127-DWD层-互动域收藏商品事务事实表.mp4
├─128-DWD层-互动域评价事务事实表.mp4
├─129-DWD层-流量域页面浏览事务事实表-建表语句.mp4
├─130-DWD层-流量域页面浏览事务事实表-数据装载.mp4
├─131-DWD层-流量域启动事务事实表.mp4
├─132-DWD层-流量域动作事务事实表.mp4
├─133-DWD层-流量域曝光事务事实表.mp4
├─134-DWD层-流量域错误事务事实表.mp4
├─135-DWD层-用户域用户注册事实表.mp4
├─136-DWD层-用户域用户登录事实表.mp4
├─137-DWD层-维度模型-小总结.mp4
├─138-DWD层-数据装载.mp4
├─139-DWS层-设计要点.mp4
├─140-DWS层-设计-构建指标体系.mp4
├─141-DWS层-设计-抽取派生指标.mp4
├─142-DWS层-设计-最近1日n日汇总表.mp4
├─143-DWS层-设计-人数重复计算问题-最近1日n日汇总表.mp4
├─144-DWS层-设计方案-设计V2.0.mp4
├─145-DWS层-设计方案-设计V3.0.mp4
├─146-DWS层-设计-历史至今-汇总表分析.mp4
├─147-DWS层-设计-历史至今-数据装载.mp4
├─148-DWS层-设计-总结.mp4
├─149-DWS层-交易域用户商品粒度订单最近1日汇总表.mp4
├─150-DWS层-交易域用户商品粒度订单最近n日汇总表.mp4
├─151-DWS层-交易域用户商品粒度退单最近1日和n日汇总表.mp4
├─152-DWS层-交易域用户粒度订单汇总表.mp4
├─153-DWS层-交易域用户粒度加购汇总表.mp4
├─154-DWS层-交易域用户粒度支付汇总表.mp4
├─155-DWS层-交易域省份粒度订单汇总表.mp4
├─156-DWS层-交易域用户粒度退单汇总表.mp4
├─157-DWS层-流量域会话粒度页面浏览最近1日汇总表.mp4
├─158-DWS层-流量域访客页面粒度页面浏览汇总表.mp4
├─159-DWS层-交易域优惠券粒度订单最近n日汇总表.mp4
├─160-DWS层-交易域活动粒度订单最近n日汇总表.mp4
├─161-DWS层-交易域用户粒度订单历史至今汇总表.mp4
├─162-DWS层-交易域用户粒度支付历史至今汇总表.mp4
├─163-DWS层-用户域用户粒度登录历史至今汇总表.mp4
├─164-DWS层-数据装载-最近1日n日历史至今.mp4
├─165-ADS层-各渠道流量统计.mp4
├─166-ADS层-用户路径.mp4
├─167-ADS层-用户路径-需求实现.mp4
├─168-ADS层-用户变动统计-需求说明.mp4
├─169-ADS层-用户留存率-需求说明.mp4
├─170-ADS层-用户变动统计-需求实现.mp4
├─171-ADS层-用户留存率-需求实现-2种思路.mp4
├─172-ADS层-用户新增活跃统计-需求说明.mp4
├─173-ADS层-新增活跃用户统计-需求实现.mp4
├─174-ADS层-漏斗分析-需求说明.mp4
├─175-ADS层-新增交易用户统计-需求说明.mp4
├─176-ADS层-品牌复购率-需求说明.mp4
├─177-ADS层-漏斗分析-需求实现.mp4
├─178-ADS层-新增交易用户统计-需求实现.mp4
├─179-ADS层-品牌复购率-需求分析.mp4
├─180-ADS层-各品牌交易统计-需求说明.mp4
├─181-ADS层-购物车存量topN-需求说明.mp4
├─182-ADS层-交易综合统计-需求说明.mp4
├─183-ADS层-各品牌交易统计-需求实现.mp4
├─184-ADS层-购物车存量topN-需求实现.mp4
├─185-ADS层-交易综合统计-需求实现.mp4
├─186-ADS层-各省份交易综合统计.mp4
├─187-ADS层-补贴率统计.mp4
├─188-ADS层-数据装载.mp4
├─189-报表数据导出-DataX.mp4
├─190-全流程调度-DS-核心架构.mp4
├─191-全流程调度-DS-部署模式及要求.mp4
├─192-全流程调度-DS-部署-数据库初始化.mp4
├─193-全流程调度-DS-部署-一键部署.mp4
├─194-全流程调度-DS-使用-安全中心.mp4
├─195-全流程调度-DS-使用-入门.mp4
├─196-全流程调度-DS-使用-进阶.mp4
├─197-全流程调度-集群模式&单机模式.mp4
├─198-可视化-Suserset-安装部署.mp4
├─199-可视化-Suserset-完整流程.mp4
├─200-可视化-Suserset-完结.mp4


下载地址(百度网盘):
**** Hidden Message *****

倾城 发表于 2024-9-28 08:27:05

楼主发贴辛苦了,谢谢楼主分享!

火影之影 发表于 2024-10-5 15:32:00

感谢分享

无名 发表于 2024-10-7 22:55:17

多谢您的分享。

道友留步 发表于 2024-10-8 18:40:13

感谢分享

雨后彩虹 发表于 2024-10-9 12:08:54

相当不错,感谢分享!
页: [1]
查看完整版本: 尚硅谷大数据项目之电商数仓5.0 优化数据仓库架构与海量数据处理最佳策略 全面可视化