参加大数据培训
一定先上数外网

什么是数据仓库?数据仓库有哪些特点?小白都能听得懂的解释

什么是数据仓库?很多刚参加大数据培训的同学,都比较疑惑这个问题,本文就来回答大家这个问题,希望对大家有帮助。

数据仓库,英文 Data Warehouse , 简称DW或DWH , 是数据库的一种概念上的升级,是为满足新需求设计的一种新数据库, 表结构是依照分析需求,分析维度,分析指标进行设计的,比普通的数据库能存储更多的数据,目的就是为决策提供支持。

百度百科解释: 数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

做大数据开发,都要求会设计数据仓库。一般中小型公司都是大数据开发工程师做这块内容。而大公司,由于业务量大,分工比较明确,会有专人负责,岗位就叫数据仓库工程师

比如,字节跳动,如下:

数据仓库的特点:

1、面向主题: 主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。 操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题域进行组织。 比如购物是一个主题,那么购物里面包含用户、订单、支付、物流等数据综合,对这些数据要进行归类并分析,分析这个对象数据的一个完整性、一致性的描述,能完整、统一的划分对象所设计的各项数据。

2、不可更新: 数据仓库的数据主要是提供决策分析用,设计的数据主要是数据查询,一般情况下不做修改,这些数据反映的是一段较长时间内历史数据的内容,有一块修改了影响的是整个历史数据的过程数据。数据仓库的查询量往往很大,所以对数据查询提出了更高的要求,要求采用各种复杂的索引技术,并对数据查询的界面友好性和数据凸显性提出更高的要求。

3、 数据仓库是集成的:数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出 数据仓库的核心工具 来,进行加工与集成,统一与综合之后才能进入数据仓库;

4、数据仓库是随时间而变化的:传统的关系数据库系统比较适合处理格式化的数据,能够较好的满足商业商务处理的需求。稳定的数据以只读格式保存,且不随时间改变。

5、汇总的:操作性数据映射成决策可用的格式。

6、大容量:时间序列数据集合通常都非常大。

7、非规范化的:Dw数据可以是而且经常是冗余的。

8、元数据:将描述数据的数据保存起来。

9、数据源:数据来自内部的和外部的非集成操作系统。

赞(0)
未经允许不得转载:数外网 » 什么是数据仓库?数据仓库有哪些特点?小白都能听得懂的解释
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

不要轻易参加大数据培训 有疑惑 先上数外网

疑惑在线解答