<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Hudi on Ralph's Blog</title><link>https://pothos.dpdns.org/tags/hudi/</link><description>Recent content in Hudi on Ralph's Blog</description><generator>Hugo -- 0.147.7</generator><language>zh-cn</language><lastBuildDate>Sat, 28 Feb 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://pothos.dpdns.org/tags/hudi/index.xml" rel="self" type="application/rss+xml"/><item><title>29.hudi</title><link>https://pothos.dpdns.org/posts/29.hudi/</link><pubDate>Thu, 25 Dec 2025 00:00:00 +0000</pubDate><guid>https://pothos.dpdns.org/posts/29.hudi/</guid><description>&lt;h1 id="apache-hudi技术指南">Apache Hudi技术指南&lt;/h1>
&lt;h2 id="目录">目录&lt;/h2>
&lt;details>
&lt;summary>点击展开目录&lt;/summary>
&lt;ul>
&lt;li>&lt;a href="#apache-hudi%E6%8A%80%E6%9C%AF%E6%8C%87%E5%8D%97">Apache Hudi技术指南&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E7%9B%AE%E5%BD%95">目录&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%A6%82%E8%BF%B0%E4%B8%8E%E6%A0%B8%E5%BF%83%E6%A6%82%E5%BF%B5">概述与核心概念&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E4%BB%80%E4%B9%88%E6%98%AFapache-hudi">什么是Apache Hudi&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%A0%B8%E5%BF%83%E4%BB%B7%E5%80%BC">核心价值&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%8F%91%E5%B1%95%E5%8E%86%E7%A8%8B">发展历程&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%A0%B8%E5%BF%83%E7%89%B9%E6%80%A7">核心特性&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#1-%E5%BF%AB%E9%80%9Fupsert%E5%92%8Cdelete">1. 快速Upsert和Delete&lt;/a>&lt;/li>
&lt;li>&lt;a href="#2-%E5%A2%9E%E9%87%8F%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86">2. 增量数据处理&lt;/a>&lt;/li>
&lt;li>&lt;a href="#3-%E5%A4%9A%E7%A7%8D%E6%9F%A5%E8%AF%A2%E7%B1%BB%E5%9E%8B">3. 多种查询类型&lt;/a>&lt;/li>
&lt;li>&lt;a href="#4-%E5%AD%98%E5%82%A8%E4%BC%98%E5%8C%96">4. 存储优化&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%BA%94%E7%94%A8%E5%9C%BA%E6%99%AF">应用场景&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#1-%E5%AE%9E%E6%97%B6%E6%95%B0%E6%8D%AE%E4%BB%93%E5%BA%93">1. 实时数据仓库&lt;/a>&lt;/li>
&lt;li>&lt;a href="#2-%E6%95%B0%E6%8D%AE%E6%B9%96%E7%8E%B0%E4%BB%A3%E5%8C%96">2. 数据湖现代化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#3-%E5%90%88%E8%A7%84%E6%80%A7%E8%A6%81%E6%B1%82">3. 合规性要求&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E4%B8%8E%E5%85%B6%E4%BB%96%E6%95%B0%E6%8D%AE%E6%B9%96%E6%8A%80%E6%9C%AF%E5%AF%B9%E6%AF%94">与其他数据湖技术对比&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E9%80%89%E6%8B%A9%E5%BB%BA%E8%AE%AE">选择建议&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1">架构设计&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%95%B4%E4%BD%93%E6%9E%B6%E6%9E%84">整体架构&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%A0%B8%E5%BF%83%E8%AE%BE%E8%AE%A1%E5%8E%9F%E5%88%99">核心设计原则&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AD%98%E5%82%A8%E6%A0%BC%E5%BC%8F">存储格式&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%96%87%E4%BB%B6%E7%BB%84%E7%BB%87%E7%BB%93%E6%9E%84">文件组织结构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%96%87%E4%BB%B6%E7%B1%BB%E5%9E%8B%E8%AF%B4%E6%98%8E">文件类型说明&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%97%B6%E9%97%B4%E8%BD%B4timeline">时间轴Timeline&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#timeline%E6%93%8D%E4%BD%9C%E7%B1%BB%E5%9E%8B">Timeline操作类型&lt;/a>&lt;/li>
&lt;li>&lt;a href="#timeline%E7%8A%B6%E6%80%81%E7%AE%A1%E7%90%86">Timeline状态管理&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E7%B4%A2%E5%BC%95%E6%9C%BA%E5%88%B6">索引机制&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E7%B4%A2%E5%BC%95%E7%B1%BB%E5%9E%8B%E5%AF%B9%E6%AF%94">索引类型对比&lt;/a>&lt;/li>
&lt;li>&lt;a href="#bloomfilter%E7%B4%A2%E5%BC%95%E5%8E%9F%E7%90%86">BloomFilter索引原理&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E8%A1%A8%E7%B1%BB%E5%9E%8B%E4%B8%8E%E5%86%99%E5%85%A5%E6%A8%A1%E5%BC%8F">表类型与写入模式&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#copy-on-write-cow">Copy On Write (COW)&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86">工作原理&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%89%B9%E7%82%B9%E5%88%86%E6%9E%90">特点分析&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E9%80%82%E7%94%A8%E5%9C%BA%E6%99%AF">适用场景&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#merge-on-read-mor">Merge On Read (MOR)&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86-1">工作原理&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%89%B9%E7%82%B9%E5%88%86%E6%9E%90-1">特点分析&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E9%80%82%E7%94%A8%E5%9C%BA%E6%99%AF-1">适用场景&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%86%99%E5%85%A5%E6%A8%A1%E5%BC%8F%E5%AF%B9%E6%AF%94">写入模式对比&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E9%80%89%E6%8B%A9%E7%AD%96%E7%95%A5">选择策略&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%86%B3%E7%AD%96%E6%B5%81%E7%A8%8B%E5%9B%BE">决策流程图&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E9%99%85%E9%80%89%E6%8B%A9%E5%BB%BA%E8%AE%AE">实际选择建议&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%A0%B8%E5%BF%83%E7%BB%84%E4%BB%B6">核心组件&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#hoodierecord">HoodieRecord&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%A0%B8%E5%BF%83%E5%B1%9E%E6%80%A7">核心属性&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%93%8D%E4%BD%9C%E7%B1%BB%E5%9E%8B">操作类型&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E8%AE%B0%E5%BD%95%E7%8A%B6%E6%80%81%E8%BD%AC%E6%8D%A2">记录状态转换&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#hoodiekey">HoodieKey&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E7%BB%84%E6%88%90%E7%BB%93%E6%9E%84">组成结构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E8%AE%BE%E8%AE%A1%E5%8E%9F%E5%88%99">设计原则&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5">最佳实践&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#hoodietimeline">HoodieTimeline&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#timeline%E7%BB%93%E6%9E%84">Timeline结构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%93%8D%E4%BD%9C%E7%8A%B6%E6%80%81%E6%B5%81%E8%BD%AC">操作状态流转&lt;/a>&lt;/li>
&lt;li>&lt;a href="#timeline%E6%93%8D%E4%BD%9C%E7%B1%BB%E5%9E%8B-1">Timeline操作类型&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#hoodieindex">HoodieIndex&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E7%B4%A2%E5%BC%95%E6%8E%A5%E5%8F%A3%E8%AE%BE%E8%AE%A1">索引接口设计&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%B4%A2%E5%BC%95%E5%AE%9E%E7%8E%B0%E5%AF%B9%E6%AF%94">索引实现对比&lt;/a>&lt;/li>
&lt;li>&lt;a href="#bloomfilter%E7%B4%A2%E5%BC%95%E8%AF%A6%E8%A7%A3">BloomFilter索引详解&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#hoodiewriteclient">HoodieWriteClient&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%A0%B8%E5%BF%83api">核心API&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%86%99%E5%85%A5%E6%B5%81%E7%A8%8B">写入流程&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E9%85%8D%E7%BD%AE%E4%BC%98%E5%8C%96">配置优化&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E5%86%99%E5%85%A5%E6%93%8D%E4%BD%9C">数据写入操作&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#insert%E6%93%8D%E4%BD%9C">Insert操作&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%89%A7%E8%A1%8C%E6%B5%81%E7%A8%8B">执行流程&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E7%89%B9%E7%82%B9">性能特点&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E4%BB%A3%E7%A0%81%E7%A4%BA%E4%BE%8B">代码示例&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#upsert%E6%93%8D%E4%BD%9C">Upsert操作&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%89%A7%E8%A1%8C%E6%B5%81%E7%A8%8B-1">执行流程&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%B4%A2%E5%BC%95%E6%9F%A5%E6%89%BE%E4%BC%98%E5%8C%96">索引查找优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E8%B0%83%E4%BC%98%E8%A6%81%E7%82%B9">性能调优要点&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#delete%E6%93%8D%E4%BD%9C">Delete操作&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%88%A0%E9%99%A4%E6%A8%A1%E5%BC%8F%E5%AF%B9%E6%AF%94">删除模式对比&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E8%BD%AF%E5%88%A0%E9%99%A4%E5%AE%9E%E7%8E%B0">软删除实现&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%A1%AC%E5%88%A0%E9%99%A4%E5%AE%9E%E7%8E%B0">硬删除实现&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#bulk-insert%E6%93%8D%E4%BD%9C">Bulk Insert操作&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E4%B8%8E%E6%99%AE%E9%80%9Ainsert%E7%9A%84%E5%8C%BA%E5%88%AB">与普通Insert的区别&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E4%BC%98%E5%8C%96%E7%AD%96%E7%95%A5">优化策略&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E9%85%8D%E7%BD%AE%E5%8F%82%E6%95%B0">配置参数&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E4%BD%BF%E7%94%A8%E5%9C%BA%E6%99%AF">使用场景&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E6%9F%A5%E8%AF%A2">数据查询&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%BF%AB%E7%85%A7%E6%9F%A5%E8%AF%A2">快照查询&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%9F%A5%E8%AF%A2%E5%8E%9F%E7%90%86">查询原理&lt;/a>&lt;/li>
&lt;li>&lt;a href="#spark-sql%E6%9F%A5%E8%AF%A2">Spark SQL查询&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96">性能优化&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%A2%9E%E9%87%8F%E6%9F%A5%E8%AF%A2">增量查询&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%9F%A5%E8%AF%A2%E6%A8%A1%E5%BC%8F">查询模式&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E7%8E%B0%E6%96%B9%E5%BC%8F">实现方式&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%BA%94%E7%94%A8%E5%9C%BA%E6%99%AF-1">应用场景&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E8%80%83%E8%99%91">性能考虑&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%97%B6%E9%97%B4%E7%82%B9%E6%9F%A5%E8%AF%A2">时间点查询&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%9F%A5%E8%AF%A2%E8%AF%AD%E6%B3%95">查询语法&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E7%8E%B0%E6%9C%BA%E5%88%B6">实现机制&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E9%85%8D%E7%BD%AE%E8%A6%81%E6%B1%82">配置要求&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%9F%A5%E8%AF%A2%E4%BC%98%E5%8C%96">查询优化&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%88%86%E5%8C%BA%E8%A3%81%E5%89%AA%E4%BC%98%E5%8C%96">分区裁剪优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%88%97%E8%A3%81%E5%89%AA%E4%BC%98%E5%8C%96">列裁剪优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%B4%A2%E5%BC%95%E5%88%A9%E7%94%A8%E4%BC%98%E5%8C%96">索引利用优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%BC%93%E5%AD%98%E7%AD%96%E7%95%A5">缓存策略&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%8E%8B%E7%BC%A9%E7%AD%96%E7%95%A5">压缩策略&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%8E%8B%E7%BC%A9%E8%A7%A6%E5%8F%91%E6%9C%BA%E5%88%B6">压缩触发机制&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%8E%8B%E7%BC%A9%E7%AD%96%E7%95%A5%E7%B1%BB%E5%9E%8B">压缩策略类型&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%8E%8B%E7%BC%A9%E9%85%8D%E7%BD%AE%E4%BC%98%E5%8C%96">压缩配置优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%8E%8B%E7%BC%A9%E6%89%A7%E8%A1%8C%E6%B5%81%E7%A8%8B">压缩执行流程&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%B8%85%E7%90%86%E7%AD%96%E7%95%A5">清理策略&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%B8%85%E7%90%86%E7%B1%BB%E5%9E%8B">清理类型&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%B8%85%E7%90%86%E9%85%8D%E7%BD%AE">清理配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%B8%85%E7%90%86%E6%89%A7%E8%A1%8C%E9%80%BB%E8%BE%91">清理执行逻辑&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%BD%92%E6%A1%A3%E6%9C%BA%E5%88%B6">归档机制&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%BD%92%E6%A1%A3%E6%B5%81%E7%A8%8B">归档流程&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%BD%92%E6%A1%A3%E9%85%8D%E7%BD%AE">归档配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%BD%92%E6%A1%A3%E6%96%87%E4%BB%B6%E7%BB%93%E6%9E%84">归档文件结构&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E8%B0%83%E4%BC%98">性能调优&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%8E%8B%E7%BC%A9%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96">压缩性能优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%B8%85%E7%90%86%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96">清理性能优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%9B%91%E6%8E%A7%E6%8C%87%E6%A0%87">监控指标&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5%E5%BB%BA%E8%AE%AE">最佳实践建议&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E9%9B%86%E6%88%90%E4%B8%8E%E9%83%A8%E7%BD%B2">集成与部署&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#spark%E9%9B%86%E6%88%90">Spark集成&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E4%BE%9D%E8%B5%96%E9%85%8D%E7%BD%AE">依赖配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#spark%E9%85%8D%E7%BD%AE">Spark配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#dataframe-api%E4%BD%BF%E7%94%A8">DataFrame API使用&lt;/a>&lt;/li>
&lt;li>&lt;a href="#spark-sql%E9%9B%86%E6%88%90">Spark SQL集成&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#flink%E9%9B%86%E6%88%90">Flink集成&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#flink%E4%BE%9D%E8%B5%96">Flink依赖&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%B5%81%E5%BC%8F%E5%86%99%E5%85%A5%E9%85%8D%E7%BD%AE">流式写入配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#flink-sql%E9%9B%86%E6%88%90">Flink SQL集成&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%9F%A5%E8%AF%A2%E6%94%AF%E6%8C%81">实时查询支持&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#hive%E9%9B%86%E6%88%90">Hive集成&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#hive%E9%85%8D%E7%BD%AE">Hive配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%90%8C%E6%AD%A5hive%E5%85%83%E6%95%B0%E6%8D%AE">同步Hive元数据&lt;/a>&lt;/li>
&lt;li>&lt;a href="#hive%E6%9F%A5%E8%AF%A2%E7%A4%BA%E4%BE%8B">Hive查询示例&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E9%83%A8%E7%BD%B2%E9%85%8D%E7%BD%AE">部署配置&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E9%9B%86%E7%BE%A4%E9%83%A8%E7%BD%B2%E6%9E%B6%E6%9E%84">集群部署架构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%8E%AF%E5%A2%83%E9%85%8D%E7%BD%AE%E6%B8%85%E5%8D%95">环境配置清单&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E8%B0%83%E4%BC%98%E9%85%8D%E7%BD%AE">性能调优配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%9B%91%E6%8E%A7%E9%85%8D%E7%BD%AE">监控配置&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E7%9B%91%E6%8E%A7%E6%8C%87%E6%A0%87-1">监控指标&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%A0%B8%E5%BF%83%E7%9B%91%E6%8E%A7%E6%8C%87%E6%A0%87%E5%88%86%E7%B1%BB">核心监控指标分类&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%85%B3%E9%94%AE%E6%80%A7%E8%83%BD%E6%8C%87%E6%A0%87kpi">关键性能指标（KPI）&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%9B%91%E6%8E%A7%E9%85%8D%E7%BD%AE-1">监控配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E8%87%AA%E5%AE%9A%E4%B9%89%E7%9B%91%E6%8E%A7%E6%8C%87%E6%A0%87">自定义监控指标&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%95%85%E9%9A%9C%E6%8E%92%E6%9F%A5">故障排查&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98%E8%AF%8A%E6%96%AD%E6%B5%81%E7%A8%8B">常见问题诊断流程&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%85%B8%E5%9E%8B%E6%95%85%E9%9A%9C%E5%9C%BA%E6%99%AF">典型故障场景&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%85%E9%9A%9C%E6%8E%92%E6%9F%A5%E5%B7%A5%E5%85%B7">故障排查工具&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96-1">性能优化&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%86%99%E5%85%A5%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96%E7%AD%96%E7%95%A5">写入性能优化策略&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%85%B7%E4%BD%93%E4%BC%98%E5%8C%96%E9%85%8D%E7%BD%AE">具体优化配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%9F%A5%E8%AF%A2%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96">查询性能优化&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5-1">最佳实践&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E8%A1%A8%E8%AE%BE%E8%AE%A1%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5">表设计最佳实践&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E8%BF%90%E7%BB%B4%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5">运维最佳实践&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%B9%E9%87%8F%E8%A7%84%E5%88%92%E5%BB%BA%E8%AE%AE">容量规划建议&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%81%BE%E9%9A%BE%E6%81%A2%E5%A4%8D%E7%AD%96%E7%95%A5">灾难恢复策略&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E9%AB%98%E7%BA%A7%E7%89%B9%E6%80%A7">高级特性&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%A4%9A%E8%A1%A8%E4%BA%8B%E5%8A%A1">多表事务&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E4%BA%8B%E5%8A%A1%E7%AE%A1%E7%90%86%E6%9E%B6%E6%9E%84">事务管理架构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%A4%9A%E8%A1%A8%E4%BA%8B%E5%8A%A1%E5%AE%9E%E7%8E%B0">多表事务实现&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E4%BA%8B%E5%8A%A1%E9%9A%94%E7%A6%BB%E7%BA%A7%E5%88%AB">事务隔离级别&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#schema%E6%BC%94%E8%BF%9B">Schema演进&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#schema%E6%BC%94%E8%BF%9B%E7%B1%BB%E5%9E%8B">Schema演进类型&lt;/a>&lt;/li>
&lt;li>&lt;a href="#schema%E6%BC%94%E8%BF%9B%E5%AE%9E%E7%8E%B0">Schema演进实现&lt;/a>&lt;/li>
&lt;li>&lt;a href="#schema%E5%85%BC%E5%AE%B9%E6%80%A7%E6%A3%80%E6%9F%A5">Schema兼容性检查&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E8%A1%80%E7%BC%98">数据血缘&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E8%A1%80%E7%BC%98%E4%BF%A1%E6%81%AF%E7%BB%93%E6%9E%84">血缘信息结构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E8%A1%80%E7%BC%98%E8%BF%BD%E8%B8%AA%E5%AE%9E%E7%8E%B0">血缘追踪实现&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%89%E5%85%A8%E6%9C%BA%E5%88%B6">安全机制&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%AE%89%E5%85%A8%E6%9E%B6%E6%9E%84">安全架构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E8%AE%BF%E9%97%AE%E6%8E%A7%E5%88%B6%E9%85%8D%E7%BD%AE">访问控制配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AD%97%E6%AE%B5%E7%BA%A7%E5%8A%A0%E5%AF%86">字段级加密&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%A1%E8%AE%A1%E6%97%A5%E5%BF%97">审计日志&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%9F%BA%E7%A1%80%E6%A6%82%E5%BF%B5%E9%A2%98">基础概念题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#1-%E4%BB%80%E4%B9%88%E6%98%AFapache-hudi%E5%AE%83%E8%A7%A3%E5%86%B3%E4%BA%86%E4%BB%80%E4%B9%88%E9%97%AE%E9%A2%98">1. 什么是Apache Hudi？它解决了什么问题？&lt;/a>&lt;/li>
&lt;li>&lt;a href="#2-hudi%E7%9A%84cow%E5%92%8Cmor%E8%A1%A8%E7%B1%BB%E5%9E%8B%E6%9C%89%E4%BB%80%E4%B9%88%E5%8C%BA%E5%88%AB%E5%A6%82%E4%BD%95%E9%80%89%E6%8B%A9">2. Hudi的COW和MOR表类型有什么区别？如何选择？&lt;/a>&lt;/li>
&lt;li>&lt;a href="#3-%E8%A7%A3%E9%87%8Ahudi%E4%B8%ADtimeline%E7%9A%84%E6%A6%82%E5%BF%B5%E5%92%8C%E4%BD%9C%E7%94%A8">3. 解释Hudi中Timeline的概念和作用&lt;/a>&lt;/li>
&lt;li>&lt;a href="#4-hudi%E7%9A%84%E7%B4%A2%E5%BC%95%E6%9C%BA%E5%88%B6%E6%98%AF%E5%A6%82%E4%BD%95%E5%B7%A5%E4%BD%9C%E7%9A%84">4. Hudi的索引机制是如何工作的？&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1%E9%A2%98">架构设计题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#5-%E8%AE%BE%E8%AE%A1%E4%B8%80%E4%B8%AA%E5%9F%BA%E4%BA%8Ehudi%E7%9A%84%E5%AE%9E%E6%97%B6%E6%95%B0%E6%8D%AE%E6%B9%96%E6%9E%B6%E6%9E%84">5. 设计一个基于Hudi的实时数据湖架构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#6-%E5%A6%82%E4%BD%95%E5%A4%84%E7%90%86hudi%E8%A1%A8%E7%9A%84%E6%95%B0%E6%8D%AE%E5%80%BE%E6%96%9C%E9%97%AE%E9%A2%98">6. 如何处理Hudi表的数据倾斜问题？&lt;/a>&lt;/li>
&lt;li>&lt;a href="#7-%E5%A6%82%E4%BD%95%E8%AE%BE%E8%AE%A1hudi%E8%A1%A8%E7%9A%84%E5%AE%B9%E7%81%BE%E5%92%8C%E5%A4%87%E4%BB%BD%E7%AD%96%E7%95%A5">7. 如何设计Hudi表的容灾和备份策略？&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96%E9%A2%98">性能优化题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#8-hudi%E5%86%99%E5%85%A5%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96%E6%9C%89%E5%93%AA%E4%BA%9B%E7%AD%96%E7%95%A5">8. Hudi写入性能优化有哪些策略？&lt;/a>&lt;/li>
&lt;li>&lt;a href="#9-%E5%A6%82%E4%BD%95%E4%BC%98%E5%8C%96hudi%E7%9A%84%E6%9F%A5%E8%AF%A2%E6%80%A7%E8%83%BD">9. 如何优化Hudi的查询性能？&lt;/a>&lt;/li>
&lt;li>&lt;a href="#10-%E5%9C%A8%E5%A4%A7%E8%A7%84%E6%A8%A1%E6%95%B0%E6%8D%AE%E5%9C%BA%E6%99%AF%E4%B8%8B%E5%A6%82%E4%BD%95%E8%AE%BE%E8%AE%A1hudi%E7%9A%84%E5%8E%8B%E7%BC%A9%E7%AD%96%E7%95%A5">10. 在大规模数据场景下，如何设计Hudi的压缩策略？&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%88%98%E5%BA%94%E7%94%A8%E9%A2%98">实战应用题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#11-%E5%A6%82%E4%BD%95%E5%9F%BA%E4%BA%8Ehudi%E6%9E%84%E5%BB%BA%E4%B8%80%E4%B8%AA%E5%AE%9E%E6%97%B6%E7%94%A8%E6%88%B7%E7%94%BB%E5%83%8F%E7%B3%BB%E7%BB%9F">11. 如何基于Hudi构建一个实时用户画像系统？&lt;/a>&lt;/li>
&lt;li>&lt;a href="#12-%E5%A6%82%E4%BD%95%E5%A4%84%E7%90%86hudi%E8%A1%A8%E7%9A%84%E6%95%B0%E6%8D%AE%E8%B4%A8%E9%87%8F%E9%97%AE%E9%A2%98">12. 如何处理Hudi表的数据质量问题？&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;hr>
&lt;/details>
&lt;h2 id="概述与核心概念">概述与核心概念&lt;/h2>
&lt;h3 id="什么是apache-hudi">什么是Apache Hudi&lt;/h3>
&lt;p>&lt;strong>Apache Hudi&lt;/strong>（Hadoop Upserts Deletes and Incrementals）是一个&lt;strong>开源的数据湖存储框架&lt;/strong>，专门为&lt;strong>大规模分析数据集&lt;/strong>提供&lt;strong>快速的upsert/delete&lt;/strong>和&lt;strong>增量数据处理&lt;/strong>能力。&lt;/p></description></item><item><title>58.实时数仓技术指南</title><link>https://pothos.dpdns.org/posts/58.%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E6%8A%80%E6%9C%AF%E6%8C%87%E5%8D%97/</link><pubDate>Sat, 28 Feb 2026 00:00:00 +0000</pubDate><guid>https://pothos.dpdns.org/posts/58.%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E6%8A%80%E6%9C%AF%E6%8C%87%E5%8D%97/</guid><description>&lt;h1 id="58-实时数仓技术指南">58. 实时数仓技术指南&lt;/h1>
&lt;h2 id="目录">目录&lt;/h2>
&lt;details>
&lt;summary>点击展开目录&lt;/summary>
&lt;ul>
&lt;li>&lt;a href="#58-%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E6%8A%80%E6%9C%AF%E6%8C%87%E5%8D%97">58. 实时数仓技术指南&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E7%9B%AE%E5%BD%95">目录&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E5%9F%BA%E7%A1%80%E6%A6%82%E5%BF%B5">实时数仓基础概念&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E4%BB%80%E4%B9%88%E6%98%AF%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93">什么是实时数仓&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93-vs-%E7%A6%BB%E7%BA%BF%E6%95%B0%E4%BB%93">实时数仓 vs 离线数仓&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E7%9A%84%E6%A0%B8%E5%BF%83%E4%BB%B7%E5%80%BC">实时数仓的核心价值&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E7%9A%84%E6%8A%80%E6%9C%AF%E6%8C%91%E6%88%98">实时数仓的技术挑战&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E7%9A%84%E5%BA%94%E7%94%A8%E5%9C%BA%E6%99%AF">实时数仓的应用场景&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E6%9E%B6%E6%9E%84%E6%BC%94%E8%BF%9B">实时数仓架构演进&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#lambda-%E6%9E%B6%E6%9E%84">Lambda 架构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#kappa-%E6%9E%B6%E6%9E%84">Kappa 架构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%8E%B0%E4%BB%A3%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E6%9E%B6%E6%9E%84">现代实时数仓架构&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%9E%B6%E6%9E%84%E9%80%89%E5%9E%8B%E6%8C%87%E5%8D%97">架构选型指南&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E6%8A%80%E6%9C%AF%E6%A0%88">实时数仓技术栈&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E9%87%87%E9%9B%86%E5%B1%82%E6%8A%80%E6%9C%AF">数据采集层技术&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%B6%88%E6%81%AF%E9%98%9F%E5%88%97%E5%B1%82%E6%8A%80%E6%9C%AF">消息队列层技术&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E8%AE%A1%E7%AE%97%E5%B1%82%E6%8A%80%E6%9C%AF">实时计算层技术&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AD%98%E5%82%A8%E5%B1%82%E6%8A%80%E6%9C%AF">存储层技术&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E6%B9%96%E6%8A%80%E6%9C%AF">数据湖技术&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E5%88%86%E5%B1%82%E8%AE%BE%E8%AE%A1">实时数仓分层设计&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#ods-%E5%B1%82%E8%AE%BE%E8%AE%A1">ODS 层设计&lt;/a>&lt;/li>
&lt;li>&lt;a href="#dwd-%E5%B1%82%E8%AE%BE%E8%AE%A1">DWD 层设计&lt;/a>&lt;/li>
&lt;li>&lt;a href="#dws-%E5%B1%82%E8%AE%BE%E8%AE%A1">DWS 层设计&lt;/a>&lt;/li>
&lt;li>&lt;a href="#ads-%E5%B1%82%E8%AE%BE%E8%AE%A1">ADS 层设计&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%88%86%E5%B1%82%E8%AE%BE%E8%AE%A1%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5">分层设计最佳实践&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E6%8D%AE%E9%87%87%E9%9B%86%E4%B8%8E%E5%90%8C%E6%AD%A5">实时数据采集与同步&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#cdc-%E6%8A%80%E6%9C%AF%E5%8E%9F%E7%90%86">CDC 技术原理&lt;/a>&lt;/li>
&lt;li>&lt;a href="#canal-%E5%AE%9E%E6%88%98">Canal 实战&lt;/a>&lt;/li>
&lt;li>&lt;a href="#debezium-%E5%AE%9E%E6%88%98">Debezium 实战&lt;/a>&lt;/li>
&lt;li>&lt;a href="#flink-cdc-%E5%AE%9E%E6%88%98">Flink CDC 实战&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%85%A8%E9%87%8F%E4%B8%8E%E5%A2%9E%E9%87%8F%E5%90%8C%E6%AD%A5%E7%AD%96%E7%95%A5">全量与增量同步策略&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86">实时数据处理&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E6%B8%85%E6%B4%97">数据清洗&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E8%BD%AC%E6%8D%A2">数据转换&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E5%85%B3%E8%81%94">数据关联&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E8%81%9A%E5%90%88">数据聚合&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%AA%97%E5%8F%A3%E8%AE%A1%E7%AE%97">窗口计算&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96">实时数仓性能优化&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#flink-%E6%80%A7%E8%83%BD%E8%B0%83%E4%BC%98">Flink 性能调优&lt;/a>&lt;/li>
&lt;li>&lt;a href="#clickhouse-%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96">ClickHouse 性能优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#kafka-%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96">Kafka 性能优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%AB%AF%E5%88%B0%E7%AB%AF%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96">端到端性能优化&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E7%9B%91%E6%8E%A7%E4%B8%8E%E8%BF%90%E7%BB%B4">实时数仓监控与运维&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E7%9B%91%E6%8E%A7%E6%8C%87%E6%A0%87%E4%BD%93%E7%B3%BB">监控指标体系&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%91%8A%E8%AD%A6%E6%9C%BA%E5%88%B6%E8%AE%BE%E8%AE%A1">告警机制设计&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%85%E9%9A%9C%E6%8E%92%E6%9F%A5%E6%89%8B%E5%86%8C">故障排查手册&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E8%B4%A8%E9%87%8F%E4%BF%9D%E9%9A%9C">数据质量保障&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E8%BF%90%E7%BB%B4%E8%87%AA%E5%8A%A8%E5%8C%96">运维自动化&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E5%AE%9E%E6%88%98%E6%A1%88%E4%BE%8B">实时数仓实战案例&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E7%94%B5%E5%95%86%E5%AE%9E%E6%97%B6%E5%A4%A7%E5%B1%8F">电商实时大屏&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E9%A3%8E%E6%8E%A7%E7%B3%BB%E7%BB%9F">实时风控系统&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F">实时推荐系统&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%8A%A0%E5%AF%86%E8%B4%A7%E5%B8%81%E5%AE%9E%E6%97%B6%E8%A1%8C%E6%83%85%E6%95%B0%E4%BB%93kafka--flink--doris">加密货币实时行情数仓（Kafka + Flink + Doris）&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E6%8D%AE%E4%B8%AD%E5%8F%B0">实时数据中台&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5">实时数仓最佳实践&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1%E5%8E%9F%E5%88%99">架构设计原则&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%BC%80%E5%8F%91%E8%A7%84%E8%8C%83">开发规范&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%B5%8B%E8%AF%95%E7%AD%96%E7%95%A5">测试策略&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%8F%91%E5%B8%83%E6%B5%81%E7%A8%8B">发布流程&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%88%90%E6%9C%AC%E4%BC%98%E5%8C%96">成本优化&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%B9%E9%87%8F%E8%A7%84%E5%88%92%E4%B8%8E%E6%89%A9%E5%B1%95">容量规划与扩展&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98%E4%B8%8E%E8%A7%A3%E5%86%B3%E6%96%B9%E6%A1%88">实时数仓常见问题与解决方案&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#flink-%E4%BB%BB%E5%8A%A1%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98">Flink 任务常见问题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#flink-oom-%E9%97%AE%E9%A2%98%E6%8E%92%E6%9F%A5">Flink OOM 问题排查&lt;/a>&lt;/li>
&lt;li>&lt;a href="#flink-%E5%8F%8D%E5%8E%8B%E9%97%AE%E9%A2%98%E5%A4%84%E7%90%86">Flink 反压问题处理&lt;/a>&lt;/li>
&lt;li>&lt;a href="#checkpoint-%E5%A4%B1%E8%B4%A5%E9%97%AE%E9%A2%98">Checkpoint 失败问题&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#kafka-%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98">Kafka 常见问题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E6%B6%88%E6%81%AF%E4%B8%A2%E5%A4%B1%E9%97%AE%E9%A2%98">消息丢失问题&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%B6%88%E6%81%AF%E9%87%8D%E5%A4%8D%E6%B6%88%E8%B4%B9%E9%97%AE%E9%A2%98">消息重复消费问题&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#clickhouse-%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98">ClickHouse 常见问题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%86%99%E5%85%A5%E6%80%A7%E8%83%BD%E9%97%AE%E9%A2%98">写入性能问题&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%9F%A5%E8%AF%A2%E4%BC%98%E5%8C%96%E9%97%AE%E9%A2%98">查询优化问题&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E4%B8%80%E8%87%B4%E6%80%A7%E9%97%AE%E9%A2%98">数据一致性问题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E4%B8%8E%E7%A6%BB%E7%BA%BF%E6%95%B0%E6%8D%AE%E4%B8%8D%E4%B8%80%E8%87%B4">实时与离线数据不一致&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E5%BB%B6%E8%BF%9F%E9%97%AE%E9%A2%98">数据延迟问题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E7%AB%AF%E5%88%B0%E7%AB%AF%E5%BB%B6%E8%BF%9F%E4%BC%98%E5%8C%96">端到端延迟优化&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E8%B5%84%E6%BA%90%E7%AE%A1%E7%90%86%E9%97%AE%E9%A2%98">资源管理问题&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#flink-%E8%B5%84%E6%BA%90%E8%A7%84%E5%88%92">Flink 资源规划&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E8%B7%A8%E6%9C%BA%E6%88%BF%E5%AE%B9%E7%81%BE">跨机房容灾&lt;/a>
&lt;ul>
&lt;li>&lt;a href="#%E5%A4%9A%E6%B4%BB%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1">多活架构设计&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/li>
&lt;li>&lt;a href="#%E9%AB%98%E9%A2%91%E9%9D%A2%E8%AF%95%E9%A2%98%E7%B2%BE%E9%80%89">高频面试题精选&lt;/a>&lt;/li>
&lt;/ul>
&lt;/li>
&lt;/ul>
&lt;/details>
&lt;h2 id="实时数仓基础概念">实时数仓基础概念&lt;/h2>
&lt;h3 id="什么是实时数仓">什么是实时数仓&lt;/h3>
&lt;p>&lt;strong>实时数仓（Real-time Data Warehouse）&lt;/strong> 是一种能够实时或准实时地采集、处理、存储和分析数据的数据仓库系统。与传统离线数仓按天或按小时批量处理数据不同，实时数仓能够在秒级甚至毫秒级完成数据的端到端处理，为业务决策提供最新的数据支持。&lt;/p></description></item></channel></rss>