docs/ds/leftist-tree.md
author: JiZiQian, llleixx, firefly-zjyjoe
左偏树 与 配对堆 一样,是一种 可并堆,具有堆的性质,并且可以快速合并.
对于一棵二叉树,我们定义 外节点 为子节点数小于两个的节点,定义一个节点的 $\mathrm{dist}$ 为其到子树中最近的外节点所经过的边的数量.空节点的 $\mathrm{dist}$ 为 $0$.
???+ note "注意" 有些资料中对 $\mathrm{dist}$ 的定义是本文中的 $\mathrm{dist}$ 减 $1$,这样定义是因为代码编写时可以省略一些判空流程,但需要注意应预先置空节点的 $\mathrm{dist}$ 为 $-1$.本文中所有代码对 $\mathrm{dist}$ 的定义 均为空节点 $\mathrm{dist}$ 为 $-1$ 的定义,请注意与行文间 $\mathrm{dist}$ 定义的差别.
左偏树是一棵二叉树,它不仅具有堆的性质,并且是「左偏」的:每个节点左儿子的 $\mathrm{dist}$ 都大于等于右儿子的 $\mathrm{dist}$.
因此,左偏树每个节点的 $\mathrm{dist}$ 都等于其右儿子的 $\mathrm{dist}$ 加一.
需要注意的是,$\mathrm{dist}$ 不是深度,左偏树的深度没有保证,一条向左的链也符合左偏树的定义.
合并两个堆时,由于要满足堆性质,先取值较小(为了方便,本文讨论小根堆)的那个根作为合并后堆的根节点,然后将这个根的左儿子作为合并后堆的左儿子,递归地合并其右儿子与另一个堆,作为合并后的堆的右儿子.为了满足左偏性质,合并后若左儿子的 $\mathrm{dist}$ 小于右儿子的 $\mathrm{dist}$,就交换两个儿子.
参考代码:
???+ note "实现"
cpp int merge(int x, int y) { if (!x || !y) return x | y; // 若一个堆为空则返回另一个堆 if (t[x].val > t[y].val) swap(x, y); // 取值较小的作为根 t[x].rs = merge(t[x].rs, y); // 递归合并右儿子与另一个堆 if (t[t[x].rs].d > t[t[x].ls].d) swap(t[x].ls, t[x].rs); // 若不满足左偏性质则交换左右儿子 t[x].d = t[t[x].rs].d + 1; // 更新dist return x; }
由于左偏性质,每递归一层,其中一个堆根节点的 $\mathrm{dist}$ 就会减小 $1$,而一棵有 $n$ 个节点的二叉树,根的 $\mathrm{dist}$ 不超过 $\left\lceil\log (n+1)\right\rceil$,所以合并两个大小分别为 $n$ 和 $m$ 的堆复杂度是 $O(\log n+\log m)$.
???+ note "关于 $\mathrm{dist}$ 性质的证明" 一棵根的 $\mathrm{dist}$ 为 $x$ 的二叉树至少有 $x-1$ 层是满二叉树,那么就至少有 $2^x-1$ 个节点.注意这个性质是所有二叉树都具有的,并不是左偏树所特有的.
左偏树还有一种无需交换左右儿子的写法:将 $\mathrm{dist}$ 较大的儿子视作左儿子,$\mathrm{dist}$ 较小的儿子视作右儿子:
???+ note "实现" ```cpp int& rs(int x) { return t[x].ch[t[t[x].ch[1]].d < t[t[x].ch[0]].d]; }
int merge(int x, int y) {
if (!x || !y) return x | y;
if (t[x].val < t[y].val) swap(x, y);
int& rs_ref = rs(x);
rs_ref = merge(rs_ref, y);
t[x].d = t[rs(x)].d + 1;
return x;
}
```
单个节点也可以视为一个堆,合并即可.
合并根的左右儿子即可.
先将左右儿子合并,然后自底向上更新 $\mathrm{dist}$、不满足左偏性质时交换左右儿子,当 $\mathrm{dist}$ 无需更新时结束递归:
???+ note "实现" ```cpp int& rs(int x) { return t[x].ch[t[t[x].ch[1]].d < t[t[x].ch[0]].d]; }
// 有了 pushup,直接 merge 左右儿子就实现了删除节点并保持左偏性质
int merge(int x, int y) {
if (!x || !y) return x | y;
if (t[x].val < t[y].val) swap(x, y);
int& rs_ref = rs(x);
rs_ref = merge(rs_ref, y);
t[rs_ref].fa = x;
t[x].d = t[rs(x)].d + 1;
return x;
}
void pushup(int x) {
if (!x) return;
if (t[x].d != t[rs(x)].d + 1) {
t[x].d = t[rs(x)].d + 1;
pushup(t[x].fa);
}
}
void erase(int x) {
int y = merge(t[x].ch[0], t[x].ch[1]);
t[y].fa = t[x].fa;
if (t[t[x].fa].ch[0] == x)
t[t[x].fa].ch[0] = y;
else if (t[t[x].fa].ch[1] == x)
t[t[x].fa].ch[1] = y;
pushup(t[y].fa);
}
```
先考虑 merge 的过程,每次都会使 $x$ 或 $y$ 向下一层,也就是说最极端的情况,就是一直选择左偏树的右节点($\mathrm{dist}$ 最小的节点)向下一层,此时 $\mathrm{dist}$ 减少了 $1$.
再考虑 pushup 的过程,我们令当前 pushup 的这个节点为 $x$,其父亲为 $y$,一个节点的「初始 $\mathrm{dist}$」为它在 pushup 前的 $\mathrm{dist}$.从被删除节点的父亲开始递归,有两种情况:
所以,我们得到,每递归一层 $x$ 的初始 $\mathrm{dist}$ 就会加一,因此最多递归 $O(\log n)$ 层.
其实可以打标记且不改变相对大小的操作都可以.
在根打上标记,删除根/合并堆(访问儿子)时下传标记即可:
???+ note "实现" ```cpp int merge(int x, int y) { if (!x || !y) return x | y; if (t[x].val > t[y].val) swap(x, y); pushdown(x); t[x].rs = merge(t[x].rs, y); if (t[t[x].rs].d > t[t[x].ls].d) swap(t[x].ls, t[x].rs); t[x].d = t[t[x].rs].d + 1; return x; }
int pop(int x) {
pushdown(x);
return merge(t[x].ls, t[x].rs);
}
```
???+ note "实现"
cpp int merge(int x, int y) { if (!x || !y) return x | y; if (t[y].val < t[x].val) swap(x, y); if (rand() & 1) // 随机选择是否交换左右子节点 swap(t[x].ls, t[x].rs); t[x].ls = merge(t[x].ls, y); return x; }
可以看到该实现方法唯一不同之处便是采用了随机数来实现合并,这样一来便可以省去 $\mathrm{dist}$ 的相关计算.且平均时间复杂度亦为 $O(\log n)$,详细证明可参考 Randomized Heap.
斜堆是左偏树的自适应形式.当合并两个堆时,它无条件交换合并路径上的所有节点,以此试图维护平衡.根据均摊分析,自顶向下斜堆(top-down skew heap)插入,合并,删除最小值的复杂度为 $O(\log n)$1.
需要注意的是:
合并前要检查是否已经在同一堆中.
左偏树的深度可能达到 $O(n)$,因此找一个点所在的堆顶要用并查集维护,不能直接暴力跳父亲.(虽然很多题数据水,暴力跳父亲可以过……)(用并查集维护根时要保证原根指向新根,新根指向自己.)
??? note "罗马游戏参考代码"
cpp --8<-- "docs/ds/code/leftist-tree/leftist-tree_1.cpp"
这类题目往往是每个节点维护一个堆,与儿子合并,依题意弹出、修改、计算答案,有点像线段树合并的类似题目.
??? note "城池攻占参考代码"
cpp --8<-- "docs/ds/code/leftist-tree/leftist-tree_2.cpp"
首先,找一个节点所在堆的堆顶要用并查集,而不能暴力向上跳.
再考虑单点查询,若用普通的方法打标记,就得查询点到根路径上的标记之和,最坏情况下可以达到 $O(n)$ 的复杂度.如果只有堆顶有标记,就可以快速地查询了,但如何做到呢?
可以用类似启发式合并的方式,每次合并的时候把较小的那个堆标记暴力下传到每个节点,然后把较大的堆的标记作为合并后的堆的标记.由于合并后有另一个堆的标记,所以较小的堆下传标记时要下传其标记减去另一个堆的标记.由于每个节点每被合并一次所在堆的大小至少乘二,所以每个节点最多被下放 $O(\log n)$ 次标记,暴力下放标记的总复杂度就是 $O(n\log n)$.
再考虑单点加,先删除,再更新,最后插入即可.
然后是全局最大值,可以用一个平衡树/支持删除任意节点的堆(如左偏树)/multiset 来维护每个堆的堆顶.
所以,每个操作分别如下:
??? note "棘手的操作参考代码"
cpp --8<-- "docs/ds/code/leftist-tree/leftist-tree_3.cpp"
这是一道论文题,详见 《黄源河 -- 左偏树的特点及其应用》.