Java TreeMap与TreeSet：红黑树实现与有序集合应用-代码聚汇网

Java TreeMap与TreeSet：红黑树实现与有序集合应用

南瓜丶奇迹师

1. TreeMap与TreeSet的核心定位

作为Java集合框架中两个特殊的排序容器，TreeMap和TreeSet在需要保持元素有序性的场景中扮演着关键角色。与HashMap和HashSet基于哈希表的实现方式不同，它们底层都依赖于红黑树这种自平衡二叉查找树结构。这种设计选择使得它们能够在O(log n)时间复杂度内完成插入、删除和查找操作，同时始终保持元素的有序状态。

在实际项目中，我经常遇到需要维护有序数据集的场景。比如最近开发的电商价格监控系统，需要实时将抓取到的商品价格按金额排序后进行分析。使用TreeSet存储价格数据后，不仅能够自动维持价格排序，还能快速获取最高价、最低价等边界值，极大简化了业务逻辑的实现。

2. 红黑树：背后的数据结构

2.1 红黑树的五大特性

红黑树通过以下规则维持平衡：

每个节点非红即黑
根节点必须为黑色
红色节点的子节点必须为黑色（即不能有连续红色节点）
从任一节点到其每个叶子节点的路径包含相同数量的黑色节点
所有叶子节点（NIL节点）视为黑色

这些约束保证了最坏情况下，从根到叶子的路径不会超过最短路径的两倍，使得树保持近似平衡。

2.2 树的旋转操作

当插入或删除节点破坏平衡时，需要通过旋转操作进行调整：

java复制// 左旋示例（TreeMap源码节选）
private void rotateLeft(Entry<K,V> p) {
    if (p != null) {
        Entry<K,V> r = p.right;
        p.right = r.left;
        if (r.left != null)
            r.left.parent = p;
        r.parent = p.parent;
        // ...后续父节点关系处理
    }
}

3. TreeMap的实现细节

3.1 数据存储结构

TreeMap使用内部类Entry作为树节点：

java复制static final class Entry<K,V> implements Map.Entry<K,V> {
    K key;
    V value;
    Entry<K,V> left;
    Entry<K,V> right;
    Entry<K,V> parent;
    boolean color = BLACK;
    // ...
}

3.2 排序控制机制

元素的排序可以通过两种方式控制：

自然排序：键对象实现Comparable接口
定制排序：构造时传入Comparator

在最近开发的金融交易系统中，我们使用定制排序实现了按交易时间倒序排列：

java复制TreeMap<Transaction, String> txMap = new TreeMap<>(
    Comparator.comparing(Transaction::getTimestamp).reversed()
);

3.3 关键操作分析

put()操作：平均时间复杂度O(log n)
1. 查找插入位置
2. 创建新节点（默认红色）
3. 平衡修复（可能需要变色+旋转）
get()操作：典型的二叉树查找过程

java复制final Entry<K,V> getEntry(Object key) {
    // 使用comparator或自然顺序进行比较
    while (p != null) {
        int cmp = compare(key, p.key);
        if (cmp < 0) p = p.left;
        else if (cmp > 0) p = p.right;
        else return p;
    }
    return null;
}

4. TreeSet的实现本质

4.1 与TreeMap的关系

TreeSet实际上是基于TreeMap的适配器实现：

java复制public class TreeSet<E> extends AbstractSet<E>
    implements NavigableSet<E>, Cloneable, java.io.Serializable {
    private transient NavigableMap<E,Object> m;
    // 使用PRESENT作为虚拟值
    private static final Object PRESENT = new Object();
    
    public boolean add(E e) {
        return m.put(e, PRESENT)==null;
    }
}

4.2 特有方法实现

由于实现了NavigableSet接口，TreeSet提供了丰富的边界查询方法：

higher(E e)：返回大于e的最小元素
floor(E e)：返回小于等于e的最大元素
subSet(from, to)：返回范围视图

在开发日程管理系统时，这些方法极大简化了时间区间查询：

java复制// 查询9:00-11:00之间的会议
SortedSet<Meeting> morningMeetings = meetings.subSet(
    new Meeting("09:00"), 
    new Meeting("11:00")
);

5. 性能优化实践

5.1 批量插入优化

当需要初始化大量数据时，直接逐个插入会导致频繁的平衡调整。更高效的做法是：

先将数据排序
递归构建平衡树

类似思路在TreeMap的buildFromSorted方法中有所体现：

java复制private void buildFromSorted(int size, Iterator<?> it,
                            java.io.ObjectInputStream str,
                            V defaultVal) {
    // 递归构建平衡树结构
    this.root = buildFromSorted(0, 0, size-1, computeRedLevel(size),
                               it, str, defaultVal);
}

5.2 内存占用考量

每个Entry节点需要存储：

3个引用（左、右、父节点）
1个颜色标记
key和value引用

在内存敏感场景中，可以考虑：

使用原始类型特化版本（如第三方库的Trove）
评估是否真的需要排序特性

6. 典型问题排查

6.1 并发修改异常

TreeMap/TreeSet不是线程安全的，常见错误模式：

java复制// 错误示例：遍历时修改
for (String key : treeSet) {
    if (key.startsWith("test")) {
        treeSet.remove(key); // 抛出ConcurrentModificationException
    }
}

// 正确做法：使用迭代器删除
Iterator<String> it = treeSet.iterator();
while (it.hasNext()) {
    if (it.next().startsWith("test")) {
        it.remove();
    }
}

6.2 比较一致性要求

根据Java规范，比较器必须满足：

sgn(compare(x, y)) == -sgn(compare(y, x))
可传递性：compare(x,y)>0且compare(y,z)>0 ⇒ compare(x,z)>0
compare(x,y)==0 ⇒ compare(x,z)==compare(y,z)

违反这些规则会导致不可预测的行为。曾经在项目中遇到因比较器实现错误导致TreeSet.contains()返回错误结果的情况。

7. 与其它集合的对比选型

7.1 与HashMap/HashSet对比

特性	TreeMap/Set	HashMap/Set
排序保证	有	无
时间复杂度	O(log n)	O(1)
内存占用	较高	较低
范围查询	支持	不支持

7.2 使用场景建议

适合TreeMap/Set的场景：

需要按序遍历
频繁进行范围查询
需要获取邻近元素（如查找最接近的预约时间）

适合HashMap/Set的场景：

只关心存在性检查
数据量大且不需要排序
对性能要求极高

在最近开发的缓存组件中，我们混合使用两种结构：HashMap用于快速查找，TreeMap用于维护最近访问顺序。

8. 高级特性应用

8.1 自定义视图

TreeMap提供了一些有用的视图方法：

java复制// 价格区间视图
NavigableMap<Double, Product> priceMap = ...;
SortedMap<Double, Product> affordable = priceMap.headMap(1000.0);

// 逆序视图
NavigableMap<K,V> descendingMap = treeMap.descendingMap();

8.2 并行处理方案

虽然TreeMap本身不支持并发，但可以通过以下方式实现线程安全：

使用Collections.synchronizedSortedMap包装
对只读操作使用副本：

java复制TreeMap<K,V> snapshot = new TreeMap<>(originalMap);
// 然后对snapshot进行操作

在开发股票分析系统时，我们采用第二种方案，每小时生成数据快照供分析模块使用。

9. 实际案例：实现多级缓存

结合TreeMap和HashMap实现的LRU缓存：

java复制class MultiLevelCache<K,V> {
    private final HashMap<K,V> hashMap = new HashMap<>();
    private final TreeMap<Long,K> accessTimeMap = new TreeMap<>();
    private final int maxSize;
    
    public void put(K key, V value) {
        if (hashMap.size() >= maxSize) {
            // 移除最久未使用的
            Map.Entry<Long,K> oldest = accessTimeMap.firstEntry();
            hashMap.remove(oldest.getValue());
            accessTimeMap.remove(oldest.getKey());
        }
        hashMap.put(key, value);
        accessTimeMap.put(System.nanoTime(), key);
    }
}

这个设计利用了TreeMap的有序特性来跟踪访问顺序，同时通过HashMap保证O(1)的访问性能。