4.寻找两个有序数组的中位数

方法:递归法

为了解决这个问题,我们需要理解 “中位数的作用是什么”。在统计中,中位数被用来:

将一个集合划分为两个长度相等的子集,其中一个子集中的元素总是大于另一个子集中的元素。

如果理解了中位数的划分作用,我们就很接近答案了。

首先,让我们在任一位置 ii 将 \text{A}A 划分成两个部分:

1
2
      left_A             |        right_A
A[0], A[1], ..., A[i-1] | A[i], A[i+1], ..., A[m-1]

由于 \text{A}A 中有 mm 个元素, 所以我们有 m+1m+1 种划分的方法(i = 0 \sim mi=0∼m)。

我们知道:

$$\text{len}(\text{left_A}) = i, \text{len}(\text{right_A}) = m - i.$$

注意:当 $i = 0$ 时,$\text{left_A}$ 为空集, 而当 $i = m$ 时, $\text{right_A}$ 为空集。

采用同样的方式,我们在任一位置 $ j$ 将 $\text{B}$ 划分成两个部分:

1
2
      left_B             |        right_B
B[0], B[1], ..., B[j-1] | B[j], B[j+1], ..., B[n-1]

将 $\text{left_A}$ 和 $\text{left_B}$ 放入一个集合,并将 $\text{right_A}$ 和 $\text{right_B}$ 放入另一个集合。 再把这两个新的集合分别命名为 $\text{left_part}$ 和 $\text{right_part}$:

1
2
3
      left_part          |        right_part
A[0], A[1], ..., A[i-1] | A[i], A[i+1], ..., A[m-1]
B[0], B[1], ..., B[j-1] | B[j], B[j+1], ..., B[n-1]

如果我们可以确认:

  1. $\text{len}(\text{left_part}) = \text{len}(\text{right_part})​$
  2. $\max(\text{left_part}) \leq \min(\text{right_part})​$

那么,我们已经将 ${\text{A}, \text{B}}$ 中的所有元素划分为相同长度的两个部分,且其中一部分中的元素总是大于另一部分中的元素。那么:

$$\text{median} = \frac{\text{max}(\text{left}_\text{part}) + \text{min}(\text{right}_\text{part})}{2}$$

要确保这两个条件,我们只需要保证:

  1. $i + j = m - i + n - j$(或:$m - i + n - j + 1$) 如果 $n \geq m$,只需要使 $ i = 0 \sim m,\ j = \frac{m + n + 1}{2} - i $
  2. $\text{B}[j-1] \leq \text{A}[i]$ 以及 $\text{A}[i-1] \leq \text{B}[j]$

ps.1 为了简化分析,我假设 $\text{A}[i-1], \text{B}[j-1], \text{A}[i], \text{B}[j]$ 总是存在,哪怕出现 $i=0,i=m,j=0$ 或是 $j=n$ 这样的临界条件。 我将在最后讨论如何处理这些临界值。

ps.2 为什么 $n \geq m$?由于$0 \leq i \leq m$ 且 $j = \frac{m + n + 1}{2} - i$,我必须确保 $j$ 不是负数。如果 $n < m$,那么 $j$ 将可能是负数,而这会造成错误的答案。

所以,我们需要做的是:

在 $[0,m]​$ 中搜索并找到目标对象 $i​$,以使:

$\qquad \text{B}[j-1] \leq \text{A}[i]$ 且 $\text{A}[i-1] \leq \text{B}[j]$ 其中 $j = \frac{m + n + 1}{2} - i$

接着,我们可以按照以下步骤来进行二叉树搜索:

  1. 设 $\text{imin} = 0$,$\text{imax} = m$, 然后开始在 $[\text{imin}, \text{imax}]$ 中进行搜索。
  2. 令 $i = \frac{\text{imin} + \text{imax}}{2}$, $j = \frac{m + n + 1}{2} - i$
  3. 现在我们有 $\text{len}(\text{left}_\text{part})=\text{len}(\text{right}_\text{part})$。 而且我们只会遇到三种情况:
    • $\text{B}[j-1] \leq \text{A}[i]$ 且 $\text{A}[i-1] \leq \text{B}[j]$:
      这意味着我们找到了目标对象 $i$,所以可以停止搜索。
    • $\text{B}[j-1] > \text{A}[i]$:
      这意味着 $\text{A}[i]$ 太小,我们必须调整 $i$ 以使 $\text{B}[j-1] \leq \text{A}[i]$。
      我们可以增大 $i$ 吗?
      是的,因为当 $i$ 被增大的时候,$j$ 就会被减小。
      因此 $\text{B}[j-1]$ 会减小,而 $\text{A}[i]$ 会增大,那么 $\text{B}[j-1] \leq \text{A}[i]$ 就可能被满足。
      我们可以减小 $i$ 吗?
      不行,因为当 $i$ 被减小的时候,$j$ 就会被增大。
      因此 $\text{B}[j-1]$ 会增大,而 $\text{A}[i]$ 会减小,那么 $\text{B}[j-1] \leq \text{A}[i]$ 就可能不满足。
      所以我们必须增大 $i$。也就是说,我们必须将搜索范围调整为 $[i+1, \text{imax}]$。 因此,设 $\text{imin} = i+1​$,并转到步骤 2。
    • $\text{A}[i-1] > \text{B}[j]$: 这意味着 $\text{A}[i-1]$ 太大,我们必须减小 $i$ 以使 $\text{A}[i-1]\leq \text{B}[j]$。 也就是说,我们必须将搜索范围调整为 $[\text{imin}, i-1]$。
      因此,设 $\text{imax} = i-1$,并转到步骤 2。

当找到目标对象 $i$ 时,中位数为:

$\max(\text{A}[i-1], \text{B}[j-1])$, 当 $m + n$ 为奇数时

$\frac{\max(\text{A}[i-1], \text{B}[j-1]) + \min(\text{A}[i], \text{B}[j])}{2}$, 当 $m + n​$ 为偶数时

现在,让我们来考虑这些临界值 $i=0,i=m,j=0,j=n$,此时 $\text{A}[i-1],\text{B}[j-1],\text{A}[i],\text{B}[j]​$ 可能不存在。 其实这种情况比你想象的要容易得多。

我们需要做的是确保 $\text{max}(\text{left}_\text{part}) \leq \text{min}(\text{right}_\text{part})$。 因此,如果 $i$ 和 $j$ 不是临界值(这意味着 $\text{A}[i-1], \text{B}[j-1],\text{A}[i],\text{B}[j]$ 全部存在), 那么我们必须同时检查 $\text{B}[j-1] \leq \text{A}[i]$ 以及 $\text{A}[i-1] \leq \text{B}[j]$ 是否成立。 但是如果 $\text{A}[i-1],\text{B}[j-1],\text{A}[i],\text{B}[j]$ 中部分不存在,那么我们只需要检查这两个条件中的一个(或不需要检查)。 举个例子,如果 $i = 0$,那么 $\text{A}[i-1]$ 不存在,我们就不需要检查 $\text{A}[i-1] \leq \text{B}[j]$ 是否成立。 所以,我们需要做的是:

在 $[0,m]$ 中搜索并找到目标对象 $i​$,以使:

($j = 0$ or $i = m$ or $\text{B}[j-1] \leq \text{A}[i]$) 或是 ($i = 0$ or $j = n$ or $\text{A}[i-1] \leq \text{B}[j]$), 其中 $j = \frac{m + n + 1}{2} - i$

在循环搜索中,我们只会遇到三种情况:

  1. ($j = 0$ or $i = m$ or $\text{B}[j-1] \leq \text{A}[i]$) 或是 ($i = 0$ or $j = n$ or $\text{A}[i-1] \leq \text{B}[j]$),这意味着 $i​$ 是完美的,我们可以停止搜索。
  2. $j > 0$ and $i < m$ and $\text{B}[j - 1] > \text{A}[i]$ 这意味着 $i$ 太小,我们必须增大它。
  3. $i > 0$ and $j < n$ and $\text{A}[i - 1] > \text{B}[j]$ 这意味着 $i$ 太大,我们必须减小它。

感谢 @Quentin.chen 指出:$i < m \implies j > 0$ 以及 $i > 0 \implies j < n$ 始终成立,这是因为:

$$m \leq n,\ i < m \implies j = \frac{m+n+1}{2} - i > \frac{m+n+1}{2} - m \geq \frac{2m+1}{2} - m \geq 0$$

$$m \leq n,\ i > 0 \implies j = \frac{m+n+1}{2} - i < \frac{m+n+1}{2} \leq \frac{2n+1}{2} \leq n​$$

所以,在情况 2 和 3中,我们不需要检查 $j > 0$ 或是 $j < n$ 是否成立。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
def median(A, B):
m, n = len(A), len(B)
if m > n:
A, B, m, n = B, A, n, m
if n == 0:
raise ValueError

imin, imax, half_len = 0, m, (m + n + 1) / 2
while imin <= imax:
i = (imin + imax) / 2
j = half_len - i
if i < m and B[j-1] > A[i]:
# i is too small, must increase it
imin = i + 1
elif i > 0 and A[i-1] > B[j]:
# i is too big, must decrease it
imax = i - 1
else:
# i is perfect
if i == 0: max_of_left = B[j-1]
elif j == 0: max_of_left = A[i-1]
else: max_of_left = max(A[i-1], B[j-1])

if (m + n) % 2 == 1:
return max_of_left

if i == m: min_of_right = B[j]
elif j == n: min_of_right = A[i]
else: min_of_right = min(A[i], B[j])

return (max_of_left + min_of_right) / 2.0

复杂度分析

  • 时间复杂度:$O\big(\log\big(\text{min}(m,n)\big)\big)$,
    首先,查找的区间是 $[0, m]$。 而该区间的长度在每次循环之后都会减少为原来的一半。 所以,我们只需要执行 $\log(m)$ 次循环。由于我们在每次循环中进行常量次数的操作,所以时间复杂度为 $O\big(\log(m)\big)$。 由于 $m \leq n$,所以时间复杂度是 $O\big(\log\big(\text{min}(m,n)\big)\big)​$。
  • 空间复杂度:$O(1)$, 我们只需要恒定的内存来存储 9 个局部变量, 所以空间复杂度为 $O(1)$。