其他分享
首页 > 其他分享> > 整体二分学习笔记

整体二分学习笔记

作者:互联网

# 整体二分

本文代码见[这](https://oi-wiki.org/misc/parallel-binsearch "这")。

二分,精髓就在于一个"猜测"。猜测答案是否小于 $mid$ 、是否等于 $mid$ 。

先想一个简单的问题:一次查询全序列中排名为 $k$ 的数。

排名的定义是:小于一个数的数的个数+1。

当然可以排序然后输出。也可以用二分解决:

猜测排名为 $k$ 的数是 $mid$ ,然后比较 $k$ 与 $mid$ 的排名(记为 $mid.rk$ )。

若 $mid.rk<k$ ,那说明 $mid$ 偏小,排名为 $k$ 的数的值就位于 $[mid+1,r]$ 。反之不赘述。

** 根据排名的定义,一个数的排名可以用桶标记全序列然后做前缀和求。 **

时间复杂度是 $O(n+\lg_n)$ 。

这是一个思维体操。

当询问很多,一次次处理的效率就变得低效。

那么不妨想一想:能否把全部询问放在一起?递归去实现?

此时二分的 $[L,R]$ 是答案的值域,当做传参放进递归。

**对于每个 $[L,R]$ ,都存在一些(可能为0)个询问的答案值属于此区间。**

$L=R$ 时就意味着确定了答案,当前区间"拥有"的所有询问的答案都是 $L$ 。

所以在每次递归时要做的事情是将全部询问**划分为两类**:答案不大于 $mid$ 的、答案大于 $mid$ 的。

然后递归下去。

问题就在于 **如何划分** 。

两个问题阐明:

1、多次查询 **全序列** 中排名第 $k$ 的值。

直接比较 $mid$ 在全序列中的排名和要查询的排名,然后根据比较结果划分。

递归下去。

求全序列中的排名可以在输入完后直接用桶来给每个数打标记,然后做前缀和。

这个操作可以用树状数组优化。

2、多次查询**区间**排名第 $k$ 的值。

考虑比较 $mid$ 在查询区间内的排名和要查询的排名。

能否继续上述操作?很明显不能,为什么?

因为**存在值域不在 $[L,R]$ 内的数**!这样求出的排名是错误的。

那可不可以在当前递归找到值域位于 $[L,R]$ 的数再在递归内计算排名?

**可以。**划分询问都可以完成,把数划分的操作为什么不可以?

所以对于每个 $[L,R]$ ,不仅存在一些询问的答案值位于此区间内,**还存在一些原序列的数的值域位于此区间内。**

那么问题就在于查询 $mid$ 在询问区间内的排名。

可以把值域 $[L,R]$ "拥有"的、小于 $mid$ 的数按照原序列中的位置加入树状数组。

然后树状数组中就都是小于 $mid$ 的数了,在这之中直接**查找查询区间 $[q_i.l,q_i.r]$ 有多少个数**就是 $mid$ 在查询区间的排名。

至此,问题解决。

这样在递归内每次都搞一遍,时间效率怎么样?

记答案值域大小为 $N$ 。

不难发现最多递归 $\lg_N$ 层,每层的时间复杂度是 $N\lg_N$ 级别的,故时间复杂度是 $O(N\lg_N^2)$ 。

那么可以有一个基本的套路:想方设法求出 $mid$ 在每个询问上的数据,将 $mid$ 的数据与查询数据比较以划分区间。

需要注意的是一些时候需要对划分到一侧的询问进行修改,如查询第 $k$ 大,需要将划分到右侧的询问都减去 $mid$ 在查询区间的排名。

OI题瞬息万变,最重要的还是见招拆招,灵活处理。

标签:二分,递归,询问,mid,笔记,查询,学习,区间,排名
来源: https://www.cnblogs.com/2008verser/p/16607497.html