<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Paimon on Ralph's Blog</title><link>https://pothos.dpdns.org/tags/paimon/</link><description>Recent content in Paimon on Ralph's Blog</description><generator>Hugo -- 0.147.7</generator><language>zh-cn</language><lastBuildDate>Thu, 25 Dec 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://pothos.dpdns.org/tags/paimon/index.xml" rel="self" type="application/rss+xml"/><item><title>38.paimon</title><link>https://pothos.dpdns.org/posts/38.paimon/</link><pubDate>Thu, 25 Dec 2025 00:00:00 +0000</pubDate><guid>https://pothos.dpdns.org/posts/38.paimon/</guid><description>&lt;h1 id="38-apache-paimon-技术指南">38. Apache Paimon 技术指南&lt;/h1>
&lt;h2 id="目录">目录&lt;/h2>
&lt;details>
&lt;summary>点击展开目录&lt;/summary>
&lt;p>&lt;a href="#%E6%A6%82%E8%BF%B0%E4%B8%8E%E6%9E%B6%E6%9E%84">概述与架构&lt;/a>&lt;/p>
&lt;ul>
&lt;li>&lt;a href="#%E4%BB%80%E4%B9%88%E6%98%AF-apache-paimon">什么是 Apache Paimon&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%A0%B8%E5%BF%83%E7%89%B9%E6%80%A7">核心特性&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1">架构设计&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E4%B8%8E%E5%85%B6%E4%BB%96%E6%95%B0%E6%8D%AE%E6%B9%96%E6%8A%80%E6%9C%AF%E5%AF%B9%E6%AF%94">与其他数据湖技术对比&lt;/a>&lt;/li>
&lt;/ul>
&lt;p>&lt;a href="#%E6%A0%B8%E5%BF%83%E6%A6%82%E5%BF%B5">核心概念&lt;/a>&lt;/p>
&lt;ul>
&lt;li>&lt;a href="#%E8%A1%A8%E6%A0%BC%E5%BC%8F">表格式&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%96%87%E4%BB%B6%E5%B8%83%E5%B1%80">文件布局&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%BF%AB%E7%85%A7%E6%9C%BA%E5%88%B6">快照机制&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%88%86%E5%8C%BA%E7%AD%96%E7%95%A5">分区策略&lt;/a>&lt;/li>
&lt;/ul>
&lt;p>&lt;a href="#%E5%AD%98%E5%82%A8%E5%BC%95%E6%93%8E">存储引擎&lt;/a>&lt;/p>
&lt;ul>
&lt;li>&lt;a href="#lsm-tree-%E5%AD%98%E5%82%A8">LSM-Tree 存储&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%96%87%E4%BB%B6%E7%BB%84%E7%BB%87">文件组织&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%8E%8B%E7%BC%A9%E7%AD%96%E7%95%A5">压缩策略&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%B4%A2%E5%BC%95%E6%9C%BA%E5%88%B6">索引机制&lt;/a>&lt;/li>
&lt;/ul>
&lt;p>&lt;a href="#%E6%95%B0%E6%8D%AE%E5%86%99%E5%85%A5">数据写入&lt;/a>&lt;/p>
&lt;ul>
&lt;li>&lt;a href="#%E6%89%B9%E9%87%8F%E5%86%99%E5%85%A5">批量写入&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%B5%81%E5%BC%8F%E5%86%99%E5%85%A5">流式写入&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E4%BA%8B%E5%8A%A1%E6%94%AF%E6%8C%81">事务支持&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%86%99%E5%85%A5%E4%BC%98%E5%8C%96">写入优化&lt;/a>&lt;/li>
&lt;/ul>
&lt;p>&lt;a href="#%E6%95%B0%E6%8D%AE%E6%9F%A5%E8%AF%A2">数据查询&lt;/a>&lt;/p>
&lt;ul>
&lt;li>&lt;a href="#%E6%9F%A5%E8%AF%A2%E5%BC%95%E6%93%8E%E9%9B%86%E6%88%90">查询引擎集成&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%97%B6%E9%97%B4%E6%97%85%E8%A1%8C">时间旅行&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%A2%9E%E9%87%8F%E6%9F%A5%E8%AF%A2">增量查询&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%9F%A5%E8%AF%A2%E4%BC%98%E5%8C%96">查询优化&lt;/a>&lt;/li>
&lt;/ul>
&lt;p>&lt;a href="#schema-%E6%BC%94%E8%BF%9B">Schema 演进&lt;/a>&lt;/p>
&lt;ul>
&lt;li>&lt;a href="#schema-%E5%8F%98%E6%9B%B4">Schema 变更&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%85%BC%E5%AE%B9%E6%80%A7%E7%AE%A1%E7%90%86">兼容性管理&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E%8B%E6%94%AF%E6%8C%81">数据类型支持&lt;/a>&lt;/li>
&lt;/ul>
&lt;p>&lt;a href="#%E8%BF%90%E7%BB%B4%E7%AE%A1%E7%90%86">运维管理&lt;/a>&lt;/p>
&lt;ul>
&lt;li>&lt;a href="#%E9%83%A8%E7%BD%B2%E9%85%8D%E7%BD%AE">部署配置&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E7%9B%91%E6%8E%A7%E6%8C%87%E6%A0%87">监控指标&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E8%B0%83%E4%BC%98">性能调优&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%85%E9%9A%9C%E6%8E%92%E6%9F%A5">故障排查&lt;/a>&lt;/li>
&lt;/ul>
&lt;p>&lt;a href="#%E5%AE%9E%E6%88%98%E5%BA%94%E7%94%A8">实战应用&lt;/a>&lt;/p>
&lt;ul>
&lt;li>&lt;a href="#cdc-%E6%95%B0%E6%8D%AE%E5%90%8C%E6%AD%A5">CDC 数据同步&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%97%B6%E6%95%B0%E4%BB%93%E6%9E%84%E5%BB%BA">实时数仓构建&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%95%B0%E6%8D%AE%E6%B9%96%E9%9B%86%E6%88%90">数据湖集成&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5">最佳实践&lt;/a>&lt;/li>
&lt;/ul>
&lt;p>&lt;a href="#%E9%9D%A2%E8%AF%95%E9%A2%98%E8%A7%A3%E6%9E%90">面试题解析&lt;/a>&lt;/p>
&lt;ul>
&lt;li>&lt;a href="#%E5%9F%BA%E7%A1%80%E6%A6%82%E5%BF%B5%E9%A2%98">基础概念题&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1%E9%A2%98">架构设计题&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96%E9%A2%98">性能优化题&lt;/a>&lt;/li>
&lt;li>&lt;a href="#%E5%AE%9E%E6%88%98%E5%BA%94%E7%94%A8%E9%A2%98">实战应用题&lt;/a>&lt;/li>
&lt;/ul>
&lt;/details>
&lt;h2 id="概述与架构">概述与架构&lt;/h2>
&lt;h3 id="什么是-apache-paimon">什么是 Apache Paimon&lt;/h3>
&lt;p>&lt;strong>Apache Paimon&lt;/strong> 是一个&lt;strong>流式数据湖存储&lt;/strong>，为批处理和流处理提供&lt;strong>高性能查询&lt;/strong>。它是 Apache 软件基金会的顶级项目，专门设计用于解决传统数据湖在&lt;strong>实时性&lt;/strong>和&lt;strong>一致性&lt;/strong>方面的挑战。&lt;/p>
&lt;p>&lt;strong>核心定位&lt;/strong>：&lt;/p>
&lt;ul>
&lt;li>&lt;strong>流批一体&lt;/strong>的数据湖存储引擎&lt;/li>
&lt;li>支持&lt;strong>实时写入&lt;/strong>和&lt;strong>历史查询&lt;/strong>&lt;/li>
&lt;li>提供&lt;strong>ACID 事务&lt;/strong>保证&lt;/li>
&lt;li>兼容多种计算引擎&lt;/li>
&lt;/ul>
&lt;p>&lt;strong>主要解决的问题&lt;/strong>：&lt;/p></description></item></channel></rss>