Tendon 数据汇总

2023-04-12

Tendon 数据汇总模块,包括指标定义和指标计算两部分。数据汇总有时也叫数仓cube。


指标定义,用来统一指标口径,避免




指标分类

指标通过划分,


原子指标

基于业务过程的度量值,通常也就是SQL中的聚合函数sum、count、distinct、avg、max、min等。


组成部分


示例


SQL示例


业务过程


购买



度量


用户数


count(distinct *)



派生指标

由以下组成:原子指标、统计粒度、统计周期、业务限定等四部分组成。


组成部分


示例


SQL示例



原子指标


购买用户数


count(distinct user_id)



统计周期


最近30天


where dt >= now_round_start(-30d)



业务限定


VIP会员


where user_type = 'vip'



统计粒度


商品


group by bid




复合指标

由若干个派生指标,进行逻辑运算复合成的。


常见的有比率、比例。


指标计算

实时计算

source --> 数据过滤 --> 时间窗口 --> 派生指标 --> 复合指标




离线计算

离线计算和实时计算非常相似,只是实时计算使用时间窗口,离线计算则算出窗口编号。
















本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com