浅析数据块排序

目前主流的数据库引擎可按照实现方式分为以下几种:B+ Tree、LSM、Delta Main。在类 LSM 的存储方案中,RocksDB 和 Kudu 之流通过 append 的方式写日志并定期重新组织,从而将写数据的压力平衡到读取的过程中。由于相邻的数据可能落在 Memtable 以及不同的 SST 中,在涉及到范围扫描时,需要对结构化/半结构化数据进行排序输出。因此,对于数据块排序过程的优化,也会对读性能产生重要影响。

文章将基于类LSM引擎,由浅入深地介绍几种相关方案,原文链接:知乎·尬聊数据库·浅析数据块排序