数据分析是基于商业 目的,有目的的
数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrated)、非易失的(Non-Volatile)、时变的(Time Variant)数据集合、用于支持管理决策。
分析需求 确认数据源 ETL处理 汇总/整合 数据建模 分析展示
数据仓库解决的问题
1为业务部门提供准确及时的报表
2 为管理人员提供更强的分析能力
3为数据挖掘和知识发现奠定基础
大数据,指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样的信息资产
第三次浪潮 大数据应用 大数据时代 云计算助力 国内规模化 阿里云
大数据特征
体量巨大 种类繁多 价值密度低 处理速度快
理解:
不要盲目追求 体量
不要盲目追求 数量
不要盲目追求 技术
不要盲目追求 潮流
云计算提供存储与计算的基础设施,大数据则是运行在其上的应用。
减治 将问题简化成一个理简单的能处理的问题
分治 将问题拆分成多个可以简单求解的小问题
离线 在线 流式 三种计算场景
数据仓库
通过搭建数据仓库,实现传统的数据分析
智能算法
通过智能算法,实现语音、图像、文本分析处理等
大数据应用
将成熟的解决方案应用到系统中
数据可视化
通过大屏数展现