其他分享
首页 > 其他分享> > 电商项目_分析,概述,规范,介绍。

电商项目_分析,概述,规范,介绍。

作者:互联网

电商数字化转型之数据仓库建设(基于hive)

第一章 数仓分析

第一节 数仓分层概述

根据实际生产情况,建议将数据仓库分为三层,自下而上为:
数据引入层(ODS,Operation Data Store)
数据公共层(CDM,Common Data Model)
数据应用层(ADS,Application Data Service)

第二节 数仓开发规范

1 数据库命名
    命名规则:数仓对应分层_{业务线|业务项目} 
    命名示例:ods_nshop/dwd_nshop/dws_nshop/dim_nshop/ads_nshop/

2 数仓各层对应数据库
	ods/sda层 -> sda/ods_{业务线|业务项目}(原始数据)
	dw层 -> dwd_{业务线|业务项目} (主题) + dws_{业务线|业务项目}(基于主题宽表汇总)
	dim层 -> dim_维度 (维表库)
	ads层 -> ads_{业务线|业务项目} (应用统计指标等)
	middle层 -> mid_{业务线|业务项目}(中间库)
	临时数据 -> temp_{业务线|业务项目}(临时库)

3 表命名
    (3-1) 数据库表命名规则
          * 原始数据层:
          	命名规则:ods_{业务线|业务项目}_{数据来源类型}_{业务}
            		ods_{业务线|业务项目}_{数据来源类型}_{业务}_{时间粒度}_delta (delta代表增量,主要用于数据同步方向产生的原始数据表)
            命名示例:
          			ods_nshop_01_useractlog XX用户日志原始数据表
          			ods_nshop_02_user XX用户表(全量)
          			ods_nshop_02_user_delta XX用户表(增量)
          			ods_nshop_02_user_hh_delta XX用户表(小时级增量 dd天)
          * 主题/事实数据层:
          	命名规则:dwd_{业务线|业务项目}_{主题域}_{子业务} 
          	命名示例:
          			dwd_nshop_user_logproview XX用户产品浏览日志事实表
          			dwd_nshop_user_comment XX用户关注事实表
          * 主题/事实汇总层:
          	命名规则:dws_{业务线|业务项目}_{主题域}_{汇总相关粒度}_{汇总时间周期}
          	命名示例:
          			dws_nshop_user_order_nd XX用户订单汇总N天统计表
          			dws_nshop_user_cmtpro_nd XX用户产品关注汇总N天统计表
          			
          * 维表层:
          	命名规则:dim_{业务线|业务项目|pub公共}_{维度}
          	命名示例:
          			dim_pub_date 时间维表
          			dim_pub_area 地区维表
          			dim_pub_category 商品分类
          			
          * 集市层:
          	命名规则:ads_{业务线|业务项目}_{统计业务}_{报表form|热门排序topN}
          	命名示例:
          			ads_nshop_order_form    订单统计表
          			ads_nshop_orderpay_form 订单支付统计
          
          
            
          注释:如果业务名称较长可以简写 如 ods_nshop_01_useractlog

    	  数据来源代码(ods层)
          01 -> hdfs数据  ods_nshop.ods_01_action_log 行为日志表
          02 -> mysql数据 ods_nshop.ods_02_user 用户表
          03 -> redis数据
          04 -> mongodb数据
          05 -> tidb数据
 

第三节 数据来源介绍

业务数据往往产生于事务型过程处理,所以一般存储在关系型数据库中,如mysql、oracle
业务数据源:
	用户基本信息、商品分类信息、商品信息、店铺信息、订单数据、订单支付信息、活动信息、物流信息等
埋点日志相对业务数据是用于数据分析、挖掘需求,一般以日志形式存储于日志文件中,随后通过采集落地分布式存储介质中如hdfs、hbase
用户行为日志:
	用户浏览、用户点评、用户关注、用户搜索、用户投诉、用户咨询
当前一般公司都会通过线上广告来进行获客,与三方公司合作更多的提取相关数据来进行深度刻画用户及用户群体,另外爬取公共公开数据也是分析运营的常用方式。
外部数据源:
	广告投放数据、爬虫数据、三方业务接口数据、微信小程序

数据仓库项目建设结构图:

标签:用户,nshop,ods,业务,规范,概述,维度,电商,数据
来源: https://www.cnblogs.com/atao-BigData/p/16448801.html