阿里云大数据ACP认证考试辅导课【新版】

阿里云大数据ACP认证考试辅导课【新版】

102课时 |
27964人已学 |
(21 评论)

加入学习
加入学习

数据分析是基于商业 目的,有目的的 

 

数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrated)、非易失的(Non-Volatile)、时变的(Time Variant)数据集合、用于支持管理决策。


分析需求 确认数据源  ETL处理  汇总/整合  数据建模 分析展示

数据仓库解决的问题

1为业务部门提供准确及时的报表
2 为管理人员提供更强的分析能力
3为数据挖掘和知识发现奠定基础

大数据,指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样的信息资产

第三次浪潮 大数据应用 大数据时代 云计算助力  国内规模化 阿里云

 

大数据特征
体量巨大   种类繁多   价值密度低  处理速度快
 

理解:

不要盲目追求 体量
不要盲目追求 数量
不要盲目追求 技术
不要盲目追求 潮流

云计算提供存储与计算的基础设施,大数据则是运行在其上的应用。


减治 将问题简化成一个理简单的能处理的问题
分治 将问题拆分成多个可以简单求解的小问题

离线 在线 流式 三种计算场景

数据仓库
通过搭建数据仓库,实现传统的数据分析
智能算法
通过智能算法,实现语音、图像、文本分析处理等
大数据应用
将成熟的解决方案应用到系统中
数据可视化
通过大屏数展现
 

 

[展开全文]
sntuuje · 2019-03-11 0

tunnel upload

1、支持文件目录的上传(只支持一级目录)

2、每一次上传只支持数据上传到一个表或表的一个分区。

3、有分区的表一定要指定上传的分区。

示例如下:

tunnel upload d:\test\p1.txt yunxiang_01.t_test_p/gender='male'

gender='male'表示分区名称为'male'

tunel upload d:\test yunxiang_01.t_test_p/gender='male' --scan=only

scan=only表示只是扫描,没有实际上传数据。

tunnel download

1、只支持下载到单个文件

2、每一次下载只支持一个表或者一个分区

3、有分区的表一定要指定下载的分区,多级分区的话,要指定到未级分区。

tunnel download yunxiang_01.t_test_p/gender='male' d:\test\p_download.txt

resume 续传

show 显示任务

purge 清除任务

 

 

 

 

[展开全文]
云风叶 · 2018-09-12 0

 云数据库

ApsaraDB for RDS(简称RDS-关系型数据库服务),一种单机数据库服务 

特点:

1、稳定可靠、可弹性伸缩(修改CPU、内存、硬盘)的在线数据库(24小时)服务;

2、即开即用(几分钟)、DMS可视化界面(Web界面);

3、兼容关系型数据库;

4、提供在线扩容(降配不支持在线)、备份回滚、性能监控及分析等功能;

5、只读实例和临时实例(部分数据库版本不支持)。

优势

1、双击热备:秒级切换;

2、安全防护:防攻击,注入警告,数据多重备份;  

3、简单易用:一键式数据迁移,可是化管理操作。

[展开全文]
lixhac · 2018-08-06 0

授课教师

云生态下的创新人才工场
阿里云开发者社区全面升级
一站式体验,助力云上开发!
进入新社区

相关课程

查看更多 >

本课程相关云产品