Tendon 数据汇总
2023-04-12
Tendon 数据汇总模块,包括指标定义和指标计算两部分。数据汇总有时也叫数仓cube。
指标定义,用来统一指标口径,避免
指标分类
指标通过划分,
原子指标
基于业务过程的度量值,通常也就是SQL中的聚合函数sum、count、distinct、avg、max、min等。
组成部分 |
示例 |
SQL示例 |
业务过程 |
购买 |
|
度量 |
用户数 |
count(distinct *) |
派生指标
由以下组成:原子指标、统计粒度、统计周期、业务限定等四部分组成。
组成部分 |
示例 |
SQL示例 |
|
原子指标 |
购买用户数 |
count(distinct user_id) |
|
统计周期 |
最近30天 |
where dt >= now_round_start(-30d) |
|
业务限定 |
VIP会员 |
where user_type = 'vip' |
|
统计粒度 |
商品 |
group by bid |
复合指标
由若干个派生指标,进行逻辑运算复合成的。
常见的有比率、比例。
指标计算
实时计算
source --> 数据过滤 --> 时间窗口 --> 派生指标 --> 复合指标

离线计算
离线计算和实时计算非常相似,只是实时计算使用时间窗口,离线计算则算出窗口编号。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



