实验详情

数据仓库系统的运维优化

本实验解决通过优化数据抽取过程或数据加工处理过程提升数仓系统的数据应用效率问题,这也是采用公共“云”处理平台搭建数据仓库、数据中心所面对的主要优化问题,即优化聚焦在业务数据处理方面而不是基础设施和应用...

20 实验点 兑换实验点
提示: 实验资源会在固定时间后释放,请创建资源后尽快操作。

实验评分

平均时长

3 小时

难易程度

普通

实验编号

A03007

学习人次

503

一、实验概述

              仓库系统运维简单来说就是保障数据仓库系统正常运行,包含两方面的意思,其一是确保系统正常运转;其二则是出现问题能够及时解决。本实验主要聚焦于数据仓库数据处理的优化,当今互联网、大数据时代,随着分布式处理技术的发展,处理能力已经发生了巨变,但随 着数据量的指数级别增长,又会出现新的性能问题。系统上线、运行之后,运维优化也就成了主要的工作重点。采用公共云构建的数据仓库处理系统,更多的运维优化体现在具体的数据处理逻辑优化。

             本实验案例一个是数据加工逻辑的优化、一个是数据加工逻辑的调整,都属于运维优化的范畴。通过本次实验课程希望学习者能够有所收获。

二、实验目标

            1、基本的数据仓库运维知识;

            2、了解常见的运维技术;

            3、掌握使用阿里的大数据工具DataWorks进行数据仓库系统的运维管理、应用;

            4、完成优化实验

三、学习建议

            1、预先了解、掌握数据仓库系统相关的基础知识,掌握基本的SQL语言基础、MaxCompute SQL基础;

            2、了解阿里大数据计算服务MaxCompute、云数据库RDS、大数据开发平台DataWorks等工具;