万亿级大数据平台的数据管理与设计实践
Granville 查看讲师
百林哲咨询(北京)有限公司专家团队成员
某大型信息科技公司研发总监、大数据平台技术负责人。主导并负责大数据操作系统BD-OS、数据开放服务平台、机器学习平台等多款产品的架构设计和研发。
浏览:1708次
详情 DETAILS

简介

在数据智能阶段,“中台”应运而生。基于大数据平台对数据的进行存储、融合、分析、管理等“中台”的基础能力的支撑日益重要。本次分享将以一个国家级大数据平台建设为例,介绍百分点的超大规模实时数据分析与数据管理的典型架构和实战经验。在该案例中,我们搭建了以KafkaSpark StreamingClickHouseHBaseCephES为基础的大数据平台,承载了万亿级数据的存储、处理和应用, 平台支持了线上2000+亿/天,峰值500+/秒的数据处理能力。并基于大数据平台建立了统一的数据资产管理平台支持多数据源的数据管理与融合分析, 实现对400+数据源,几千张表进行了数据集成与数据管理和加工。支撑了数据标签化构建,模型化构建,及知识图谱的构建的构建与存储。本次分享将介绍平台的设计理念、关键技术选型、数据管理与融合设计。

课程收益

目标

1百分点超大规模实时数据分析的典型架构;

2大数据平台数据资产管理方法;

3统一数据模型的数据融合设计。

成功(或教训)要点

1基于业务场景的组件选型与设计方法;

2基于数据元标准化方法论的数据资产管理方法;

3统一数据模型的Pipeline与交互式数据融合设计。

受众人群

架构师、大数据工程师、技术经理、工程师,对大数据供应链有兴趣的人群。

课程时长

1天(6H)

分享提纲

1、万亿级平台实时数据分析面临的问题和挑战;

2、百分点数据分析典型架构;

3、核心组件的设计与选型;

4、多数据源数据管理与融合设计。


预约内训 APPLY
前往提交您的需求,我们会及时与您联系
课程推荐 COURSE

企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1