RTF简介

        RTF (Real Time File)实时数据仓库,是一个京东自研的,从底层重新构建的系统,解决了数据的接入、解析及清洗等ETL 过程,同时解决了传统离线模式达不到的实时性和流式实时数据做不到的数据清洗、还原,是一套大数据领域改革性的实时数仓方案。RTF表可以直接查询最新状态的数据,并且无需去重,可以让数据分析人员即使不了解flink或spark streaming等实时计算框架,也能够获取实时数据进行分析。

        RTF实时表通过SQL使用实时数据,完美保留了离线数据的使用习惯,不用再开发实时程序,使用成本低,效率高,为数据分析及涉及算法的朋友大幅简化了实时数据的获取方式。应用场景主要包括了:

1、实时报表2、数据产品3、促销实时战报4、实时风控5、实时多维查询6、实时监控指标7、实时运营监控8、业务流程异常点实时监控,实时接入干预,提升用户体验9、大促临时查询、数据分析

在数据查询方面,RTF支持Hive,Spark,Presto。