快速排序 O(nlgn)

2023年 10月 13日 69.5k 0

大家好,我是蓝胖子,我一直相信编程是一门实践性的技术,其中算法也不例外,初学者可能往往对它可望而不可及,觉得很难,学了又忘,忘其实是由于没有真正搞懂算法的应用场景,所以我准备出一个系列,囊括我们在日常开发中常用的算法,并结合实际的应用场景,真正的感受算法的魅力。

代码已经上传github

https://github.com/HobbyBear/codelearning/tree/master/quicksort

算法原理

快速排序的时间复杂度是O(nlgn) ,这类时间复杂度的算法逻辑(归并排序也是类似)在算法逻辑上都有个特点,一般是将整个数组一分为二,然后将分割后的数组继续一分为二,这样整个切割过程就被分成了lg n 层,然后每一层需要对数组中的元素进行操作(这个操作针对于快速排序而言就是找到基点的位置,针对于归并排序而言就是合并相邻两部分的数组),由于每个都要对这个n个元素进行操作,所以整体的时间复杂度算下来就是O(nlgn) 。

接下来我们来仔细看下快速排序的算法逻辑,看看它是如何将数组进行切分的

下面👇🏻介绍的是三路快排的原理,相信懂了三路快排,双路快排也是很好理解的。

Pasted image 20230905103754.png

图中l代表数组的左边界,r代表数组的右边界,i代表当前遍历的元素

算法首先是在数组中选取数组首个元素作为基点,也就是图中的V,然后在遍历数组的过程中,划分出了3个空间,其中[l+1...lt] 部分会存放小于基点的元素, [gt...r] 不分在遍历完成后会存放大于基点的元素。[lt+1...gt-1]这部分区域在遍历完成后会存放等于基点的元素。在遍历完成的最后一步,则是将基点v和lt指向的元素交换位置,同时lt进行减一操作,这样最后完成遍历后,[l...lt]部分则全部放置的是小于基点的元素了。

你可以看到,在遍历完整个数组后,基点就已经找到了它在数组中应该存放的位置了,接下来就是对小于基点的部分数组,和大于基点的部分数组再次执行这个选基点分割的过程,这样每个元素便都能找到各自在数组中的正确位置。

知道了算法的大致逻辑,我们来对遍历元素过程中的三种情况进行分析,因为遍历过程中无非就是3种情况,大于V,小于V,等于V,我们应该如何移动对应的指针来让遍历完数组后,各个指针对应的区间仍然满足上面的定义就是我们需要探讨的。

小于V

Pasted image 20230905105625.png

假设当前遍历到了元素e,发现 e< V ,那么就需要将e和lt+1指向的元素交换位置(lt+1位置放置的是等于V的元素),并且更新lt指针位置到lt+1,同时需要将i进行加1操作继续遍历下一个元素。

等于V

Pasted image 20230905110303.png

假设当前遍历到的元素是e,发现e == V ,那么只需要执行i++ ,让i继续遍历下一个元素即可。

大于V

Pasted image 20230905110402.png
假设当前遍历的元素e > V ,那么需要将e通gt-1位置的元素进行交换,由于交换过来的gt-1位置的元素还未遍历,所以在这一步,i不进行加1操作,gt--即可。

实现

在详细的看完快排算法的思路之后,我们用代码来实现下这部分。

很多时候写算法不能写出来,是因为你不能完整的用文字清晰的描述算法的逻辑,当你能清晰的描绘整个算法逻辑之后,写代码实现起来便是水到渠成的事。

首先,我们定义一个快排的函数,它的定义是对arr数组中的[l...r]区间内的元素进行快排。

func quickSort(arr []int, l int, r int) 

在函数内部,我们需要基点,和几个指针,lt,gt,i 它们分别对应上图中的小于V的边界,大于V的边界,当前要遍历的元素,注意我们定义的lt,gt边界都是闭区间。

在初始化边界时,大于V和小于V 的区间都是没有元素的。

lt := l     // 小于v的右边界  
gt := r + 1 // 大于v的左边界  
i := l + 1  // 当前遍历的元素
v := arr[l]  //  V 为选定的基点

剩下的就是按刚才探讨的遍历i过程对数组进行遍历,遍历的介绍条件则是i < gt 时停止遍历,完整代码如下:

func quickSort(arr []int, l int, r int) {  
   if l >= r {  
      return  
   }  
   lt := l     // 小于v的右边界  
   gt := r + 1 // 大于v的左边界  
   i := l + 1  // 当前遍历的元素  
   swap(arr, l, rand.Int()%(r-l+1)+l)  //  这一步是为了让基点随机化,否则快排在排序近乎有序数组时,不能很好达到切分数组的目的,从而让算法退化成O(n^2)的算法
   v := arr[l]  
   for i  arr[i] {  
         tmp := arr[lt+1]  
         arr[lt+1] = arr[i]  
         arr[i] = tmp  
         lt++  
         i++  
         continue  
      }  
      if v < arr[i] {  
         gt--  
         tmp := arr[gt]  
         arr[gt] = arr[i]  
         arr[i] = tmp  
         continue  
      }  
      i++  
   }  
   tmp := arr[lt]  
   arr[lt] = v  
   arr[l] = tmp  
   lt--  
   quickSort(arr, l, lt)  
   quickSort(arr, gt, r)  
}

(应用场景)在O(n)时间复杂度内选取数组中第k大的元素

接下来,我们来看一个利用快排选取基点切分数组的思想来解决选取数组中第k大元素的问题。这是leetcode的 215号题。

215. 数组中的第K个最大元素  
中等  
2.3K  
相关企业  
给定整数数组 nums 和整数 k,请返回数组中第 k 个最大的元素。  
  
请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素。  
  
你必须设计并实现时间复杂度为 O(n) 的算法解决此问题。  
  
示例 1:  
输入: [3,2,1,5,6,4], k = 2  
输出: 5  
示例 2:  
输入: [3,2,3,1,2,4,5,5,6], k = 4  
输出: 4  
  
提示:  
  
1  k-1 {  
         return nums[k-1]  
      }  
      return partition(nums, k, gt, r)  
   }  
   return partition(nums, k, l, lt)  
}

相关文章

JavaScript2024新功能:Object.groupBy、正则表达式v标志
PHP trim 函数对多字节字符的使用和限制
新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
为React 19做准备:WordPress 6.6用户指南
如何删除WordPress中的所有评论

发布评论