SegmentTree 线段树完善

LiYangSir · LiYangSir · commit 1c931a46db12 · 2020-03-10T19:23:35.000+08:00
diff --git a/MaxHeap/README.md b/MaxHeap/README.md
@@ -39,7 +39,9 @@ public interface Queue<E> {
 |顺序线性结构|O(N)：顺序放入元素|O(1)|
 |二叉堆|O(log(N))|O(log(N))|
 
-## 2、什么是二叉堆
+## 2、二叉堆的实现
+
+### 2.1 什么是二叉堆
 
 &emsp;&emsp;二叉堆是一个**完全二叉树**。那什么是完全二叉树呢？
 &emsp;&emsp;**满二叉树**就是除了最下面一层，其他的节点都是具有左右孩子节点，就类似于这样。
@@ -68,7 +70,7 @@ public interface Queue<E> {
 
 可以看出任意子树的最大值永远是自己的父亲节点。
 
-### 2.1、实现方法
+### 2.2、二叉堆的结构
 
 &emsp;&emsp;这里我们可以看出来二叉堆是一层一层的从左到右这么依次排列的，所以这里我们使用数组进行存储二叉树。通过数组索引找到节点。
 <div align=center>
@@ -87,7 +89,7 @@ leftChild(i) = i * 2 + 1
 rightChild(i) = i * 2 + 2
 ```
 
-### 2.2、初始化操作
+### 2.3、初始化操作
 
 &emsp;&emsp;在最大堆这个数据结构当中我们使用的是数组的底层实现，当然我们也就需要动态数组来实现这个动态大小的最大堆。关于Array动态数组这一章可以参考[Array 动态数组](/Array/README.md)。当然也可以直接使用Java自带的动态数组。
 
@@ -119,7 +121,7 @@ private int rightChild(int index) {
 }
 ```
 
-### 2.3、添加元素
+### 2.4、添加元素
 
 &emsp;&emsp;这里的操作底层实现其实是上浮（SiftUp）操作。下面我们就来看看是如何上浮的。
 + 向数组末尾添加一个元素，也就是向树的最下角添加一个元素；
@@ -145,7 +147,7 @@ private void siftUp(int index) {
     }
 }
 ```
-### 2.4、提取最大值
+### 2.5、提取最大值
 
 &emsp;&emsp;对于我们上面实现的最大堆，看得出来，最大值的地方存在于根节点的位置。也就是数组索引位0的位置。而且我们需要维护二叉堆的性质。
 步骤：
@@ -181,16 +183,25 @@ private void siftDown(int index) {
 }
 ```
 
-### 2.5 查询操作
+### 2.6、查询操作
 
 &emsp;&emsp;查询操作就是查找元素最大的值，这里就是根节点位置，也就是索引为 0 的位置。
+**程序实现：**
+```java
+public E findMax() {
+    if (isEmpty())
+        throw new IllegalArgumentException("Empty");
+    return data.get(0);
+}
+```
 
-### 2.6、replace操作
+### 2.7、replace操作
 
 &emsp;&emsp;replace替换操作主要包括：去除最大元素，放入一个新的元素。这其实是一个组合操作。但这里我们准备封装一下，并对其进行优化。
 
 &emsp;&emsp;优化的方式就是在删除元素这里，如果我们分extraMax和add操作就需要两次 O(log(N)) 级别的时间复杂度。在replace操作中，我们可以直接将待添加的元素元素替换到根节点的位置，然后在执行下沉操作就可以，这样就是一次 O(log(N)) 级别的时间复杂度。
 
+**程序实现：**
 ```java
 public E replace(E e) {
     E ret = findMax();
@@ -200,7 +211,7 @@ public E replace(E e) {
 }
 ```
 
-### 2.7、Heapify数组堆化
+### 2.8、Heapify数组堆化
 
 &emsp;&emsp;操作就是将任意数组整理成堆的形状。
 具体的过程就是：
@@ -222,7 +233,7 @@ public MaxHeap(E[] arr) {
 }
 ```
 
-## 3、优先队列的实现——基于二叉堆
+## 3、优先队列的实现——基于最大堆
 
 &emsp;&emsp;具体的函数方法其实在最大堆已经映射过了。
 ||优先队列|最大堆|
diff --git a/SegmentTree/README.md b/SegmentTree/README.md
@@ -0,0 +1,216 @@
+<h1 align=center>SegmentTree 线段树（区间树）</h1>
+<div align="center">
+<image src="https://img.shields.io/badge/Github-LiYangSir-brightgreen">
+<image src="https://img.shields.io/badge/author-teaUrn-green">
+<image src="https://img.shields.io/badge/Language-Java-orange">
+<image src="https://img.shields.io/badge/Version-1.0-blue">
+</div>
+
+-----
+
+## 1、为什么使用线段树
+
+&emsp;&emsp;相信大家都见过一个经典的比赛题目（区间染色）：在一个数组结构当中，对某一端区间不断的进行染色。在m次操作后，在这个数组中包含了多少种颜色。以及在m次操作后我们在某一区间可以看见多少种颜色。
+
+&emsp;&emsp;其中主要包含两种操作，染色操作（更新区间）以及查询操作（查询区间）。我们发现我们主要是针对区间进行操作，而且我们只关心区间的颜色种类的个数，并不关心它的颜色是什么。
+
+&emsp;&emsp;如果我们采用最基本的数组遍历的操作。使用数组实现，两种操作的时间复杂度均为O(N)级别的操作。这样我们的线段树显得就尤为重要。
+
+&emsp;&emsp;还有一种经典问题就是区间查询：例如我们在一段数组内查询某一个区间的最大值、最小值或者区间数字和。针对区间进行操作的我们都要想要线段树这种数据结构。由于我们线段树采用的树结构，所以时间复杂度就会很低。
+
+**时间复杂度：**
+
+||数组实现|线段树实现|
+|:---:|:---:|:---:|
+|更新操作|O(N)|O(log(N))|
+|查询操作|O(N)|O(log(N))|
+
+## 2、线段树的基本结构
+&emsp;&emsp;在线段树中我们并不考虑增加元素和删除元素，我们只考虑在已有的数组结构中构建线段树这种数据结构。
+
+<div align=center>
+<img src=https://markdown-liyang.oss-cn-beijing.aliyuncs.com/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E4%B8%8E%E7%AE%97%E6%B3%95/8-SegmentTree/%E5%9F%BA%E6%9C%AC%E7%BB%93%E6%9E%84.png width=70% alt=基本结构>
+</div>
+<br/>
+
+&emsp;&emsp;我们可以看出，一个数组分成了很多区间，基本上都是对半劈开，小伙伴可能会问了，结构变得更加复杂了。在这里正是运用了计算机领域的一句话 ：
+> **用空间换取时间** 
+
+
+**注意：** 每一个区间并不是存储一个区间，而是一个值。例如我们以求和为例，==A[0 ··· 3]== 节点存储的是这个区间的和。如果是最大值，那么存储的就是这一个区间的最大值。
+
+**例子：** 当我们查询A[2-5]区间的和，那我们只需要知道A[2-3]和A[4-5]的和就可以啦，我们并不需要遍历2-5的所有数据。
+
+### 2.1、线段树的一般结构
+
+&emsp;&emsp;上面的例子当中，正好数组大小正好是 $2^3 = 8$,所以看起来像是~~满二叉树~~，其实不是。我们看下面的图：
+
+<div align=center>
+<img src=https://markdown-liyang.oss-cn-beijing.aliyuncs.com/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E4%B8%8E%E7%AE%97%E6%B3%95/8-SegmentTree/%E5%9F%BA%E6%9C%AC%E7%BB%93%E6%9E%84-%E9%9D%9E.png width=70% alt=基本结构>
+</div>
+<br/>
+&emsp;&emsp;看得出来，这并不是一个满的二叉树，也不是一个完全二叉树。但是这是一个平衡二叉树。
+
+> **平衡二叉树：** 最大深度和最小深度之间的差值为 1 。
+
+### 2.2、线段树存储所需空间
+
+&emsp;&emsp;我们知道线段树是我们损失空间来减小时间的，那我们实际过程中，需要多少空间呢。下面我们就来推导一下。
+|层数|节点个数|
+|:---:|:---:|
+|0|1|
+|1|2|
+|2|4|
+|3|8|
+|···|···|
+|h - 1|$2^{h-1}$|
+
+&emsp;&emsp;对于满的二叉树来说，$h$ 层一共有$2^h-1$个节点。所以大约等于 $2^h$ 个。而且我们看到最后一层的个数为$2^{h-1}$正好等于总个数的一半。于是我们可以得到：
+
+> **最后一层的节点数大致等于（差1）前面所有层数节点之和。**
+
+&emsp;&emsp;假设我们的数组有 n 个元素，按照满的二叉树的形式来看，最底下一层元素的个数为 n。那么他上面的所有节点和也为n,所以对应的总个数为==2 * n==。这只是还在满二叉树的情况下。如果我们的元素不是2的整数次幂，那么它就构成了平衡二叉树，所以需要向下扩充一层，这一层的个数等于我们上面所有节点的和也就是 2 * n。加起来就是 4 * n。我们可以得出结论：
+
+> **对于存储 n 个元素的线段树，我们需要开辟 4 倍的空间大小。**
+
+&emsp;&emsp;虽然我们浪费了大量的空间来存储，但是我们在时间复杂度上有着巨大的提升。随着社会的发展，存储已经变得不再是问题，问题变成了时间速度问题，所以说**牺牲空间提升时间**是一件非常有意义的事情。
+
+## 3、线段树的实现
+
+### 3.1、Merge 函数
+
+&emsp;&emsp;在实际过程中底层并不确定用户对线段树执行什么操作，求和，最大值还是最小值操作，所以这里我们引入merge函数，用户来指定他们需要对线段树执行什么操作。
+**Merge接口函数：**
+```java
+public interface Merger<E> {
+    E merge(E a, E b);
+}
+```
+
+### 3.2、构造函数
+&emsp;&emsp;在构造函数里面需要用户传入用户设定的Merge实例对象，以对线段树进行用户想要类型的操作。
+**构造函数实现:**
+```java
+public SegmentTree(E[] arr, Merger<E> merger) {
+
+    this.merger = merger; // 指定merge实例
+
+    data = (E[])new Object[arr.length]; //拷贝数组
+    System.arraycopy(arr, 0, data, 0, arr.length);
+
+    tree = (E[])new Object[4 * arr.length]; //开启4倍的空间
+    buildSegmentTree(0, 0, data.length - 1);
+}
+```
+### 3.3、基本操作函数
+&emsp;&emsp;主要包含数据的接口操作，例如getSize和get操作。
+```java
+public int getSize() {
+    return data.length;
+}
+
+public E get(int index) {
+    if (index < 0 || index >= data.length)
+        throw new IllegalArgumentException("Index is illegal");
+    return data[index];
+}
+```
+&emsp;&emsp;这里我们线段树的底层依然是数组，所以我们依然可以按照我们之前的[ MaxHeap 最大堆 ](/MaxHeap/README.md)那种结构来实现。
+```java
+private int leftChild(int index) {
+    return index * 2 + 1;
+}
+
+private int rightChild(int index) {
+    return index * 2 + 2;
+}
+```
+
+### 3.4、构建线段树
+
+&emsp;&emsp;我们需要在treeIndex索引的位置创建数组区间。这里我们采用递归方式进行构建树结构。为什么采用递归的形式呢，因为我们需要慢慢回朔到顶层，而且在构建的时候我们需要采用**后序遍历**的形式，这样才能保证节点最后合并孩子节点。
+
+```java
+private void buildSegmentTree(int treeIndex, int l, int r) {
+    if (l == r) {
+        tree[treeIndex] = data[l];
+        return;
+    }
+    int mid = l + (r - l) / 2;  //中间值
+    buildSegmentTree(leftChild(treeIndex), l, mid);
+    buildSegmentTree(rightChild(treeIndex), mid + 1, r);
+    tree[treeIndex] = merger.merge(tree[leftChild(treeIndex)], tree[rightChild(treeIndex)]);
+}
+```
+
+### 3.5、查询操作
+
+&emsp;&emsp;查询操作主要涉及的问题就是区间查找匹配的问题，所以在递归的问题匹配主要分为三种情况：
++ 查询区间完全在右孩子区间上
++ 查询区间完全在左孩子区间上
++ 查询区间部分在左孩子区间上，部分在右孩子区间上
+
+```java
+public E query(int queryL, int queryR) {
+    if (queryL < 0 || queryL >= data.length || queryR < 0 || queryR >= data.length)
+        throw new IllegalArgumentException("index is illegal");
+
+    return query(0,0,data.length - 1, queryL, queryR);
+}
+
+private E query(int treeIndex, int l, int r, int queryL, int queryR) {  
+    if (l == queryL && r == queryR)
+        return tree[treeIndex];
+    int mid = l + (r - l) / 2;   //中间值
+    int leftTreeIndex = leftChild(treeIndex);  //左索引
+    int rightTreeIndex = rightChild(treeIndex); //右索引
+
+    if (queryL >= mid + 1)  //去右子树查找
+        return query(rightTreeIndex, mid + 1, r, queryL, queryR);
+    else if (queryR <= mid)  // 去左子树查找
+        return query(leftTreeIndex, l, mid, queryL, queryR);
+    E left = query(leftTreeIndex, l, mid, queryL, mid); // 分开查询
+    E right = query(rightTreeIndex, mid + 1, r, mid + 1, queryR);
+    return merger.merge(left, right); //将分开的元素合并
+}
+```
+
+### 3.6、更改操作
+
+&emsp;&emsp;当我们对数组的某一个索引位置进行修改，我们需要先找到这个树结构的索引位置，然后不断回朔，重新合并。
+
+**程序实现：**
+```java
+public void set(int index, E e) {
+    if (index < 0 || index >= data.length)
+        throw new IllegalArgumentException("Index is illegal");
+    data[index] = e;
+    set(0, 0, data.length - 1, index, e);
+}
+
+private void set(int treeIndex, int l, int r, int index, E e) {
+    if (l == r){
+        tree[treeIndex] = e;
+        return;
+    }
+    int mid = l + (l - r) / 2;
+    if (index > mid)
+        set(rightChild(treeIndex), mid + 1, r, index, e);
+    else
+        set(leftChild(treeIndex), l, mid, index, e);
+    tree[treeIndex] = merger.merge(tree[leftChild(treeIndex)], tree[rightChild(treeIndex)]);
+}
+```
+
+## 最后
+
+更多精彩内容，大家可以转到我的主页：[曲怪曲怪的主页](http://quguai.cn:8090/)
+
+或者关注我的微信公众号：**TeaUrn**
+
+或者扫描下方二维码进行关注。里面有惊喜等你哦。
+
+**源码地址**：可在公众号内回复 **数据结构与算法源码** 即可获得。
+
+<img src="https://markdown-liyang.oss-cn-beijing.aliyuncs.com/%E5%85%AC%E4%BC%97%E5%8F%B7%E4%BA%8C%E7%BB%B4%E7%A0%81.jpg" width=40%>
+