揭秘Apache Kylin ：Hadoop上的数据仓库

Byron Li 查看讲师

百林哲咨询（北京）有限公司专家团队成员

Kyligence Inc 联合创始人兼CTO，专注于大数据分析，并行计算，数据索引，关系数学，近似算法，压缩算法等前沿技术。

浏览：5892次

详情 DETAILS

简介

随着大数据领域开源工具的不断发展，越来越多的企业将数据平台搭建到Hadoop、Hive、Spark等。Apache Kylin作为Hadoop上的新型数据仓库。它在大数据上提供标准的SQL接口，能够提供亚秒级的查询速度和超大规模的并发性能。大数据直接对接在线应用重新成为可能，交互式的BI极大解放大数据生产能力。其中：Apache Kylin背后的技术原理为何？企业如何根据自身情况使用开源软件Apache Kylin？在最新的Apache Kylin版本中灵活查询(Ad-hoc Query)又是如何实现的？实际操作中，如何让Apache Kylin替代传统的Hive和SparkSQL？揭秘全球100多家公司是如何部署Apache Kylin？本次演讲理论结合实际案例，娓娓道来其背后的演变历史和设计考量。

目标
a)了解Hadoop上的新型数据仓库－Apache Kylin的工作原理
b)如何使用经典Cube理论极大解放数据查询速度
c)了解如何使用在线自助平台优化工具
d)Apache Kylin最新功能－Snowflake雪花模型、Spark Cubing构建以及Streaming流式构建等
e)了解灵活查询的系统设计以及经典案例

课程时长

2天（12H）

受众人群

数据科学家、数据库管理员、分析师、高级工程师、系统架构师、项目经理，以及企业的CIO和CTO。

分享提纲

1.Apache Kylin的工作原理	1.1 如何提升查询速度
1.Apache Kylin的工作原理	1.2 无缝融合预计算和在线计算的实现
2.Apache Kylin亚秒级查询实践	2.1 SSB基准测试和TPC-H基准测试
2.Apache Kylin亚秒级查询实践	2.2 性能的优化以及最新的研发成果的使用
3.灵活查询（Ad-hoc Query）的系统设计、工作原理和用户案例
4.问题和解答

预约内训 APPLY

前往约课

前往提交您的需求，我们会及时与您联系

课程推荐 COURSE

次