排序算法基础与Python实现：从冒泡到归并-代码聚汇网

排序算法基础与Python实现：从冒泡到归并

我行我素12334

1. 排序算法基础概念

排序算法是计算机科学中最基础也是最重要的算法之一。简单来说，排序就是将一组数据按照特定顺序（通常是升序或降序）重新排列的过程。在实际开发中，排序算法的应用无处不在，从数据库查询优化到用户界面展示，都需要高效的排序算法作为支撑。

1.1 排序算法的稳定性解析

排序算法的稳定性是一个容易被忽视但非常重要的概念。所谓稳定性，指的是当待排序序列中存在相等元素时，排序后这些相等元素的相对位置是否保持不变。

举个例子，假设我们有一组学生成绩记录，每个记录包含学号和分数。现在需要按照分数从高到低排序，但如果分数相同，我们希望保持学号的原始顺序。这时就需要使用稳定的排序算法。

python复制# 原始数据
records = [
    {'id': 101, 'score': 85},
    {'id': 102, 'score': 90},
    {'id': 103, 'score': 85}
]

# 稳定排序后
sorted_records = [
    {'id': 102, 'score': 90},
    {'id': 101, 'score': 85},  # 保持原始顺序
    {'id': 103, 'score': 85}   # 保持原始顺序
]

在Python中，内置的sorted()函数和list.sort()方法都是稳定的排序实现。理解稳定性对于选择正确的排序算法非常重要，特别是在处理复杂对象的排序时。

1.2 常见排序算法效率对比

不同的排序算法在时间复杂度、空间复杂度和稳定性上表现各异。下面是一个常见排序算法的对比表格：

算法名称	平均时间复杂度	最坏时间复杂度	空间复杂度	稳定性
冒泡排序	O(n²)	O(n²)	O(1)	稳定
选择排序	O(n²)	O(n²)	O(1)	不稳定
插入排序	O(n²)	O(n²)	O(1)	稳定
希尔排序	O(n log n)	O(n²)	O(1)	不稳定
快速排序	O(n log n)	O(n²)	O(log n)	不稳定
归并排序	O(n log n)	O(n log n)	O(n)	稳定

实际应用中，我们通常会根据数据规模、数据特征和具体需求来选择合适的排序算法。例如，对于小规模数据，简单的插入排序可能比快速排序更高效；而对于大规模数据，归并排序或优化后的快速排序通常是更好的选择。

2. 冒泡排序深度解析

冒泡排序是最容易理解和实现的排序算法之一，虽然效率不高，但在某些特定场景下仍有其用武之地。

2.1 冒泡排序的核心思想

冒泡排序的基本思想是通过相邻元素的比较和交换，使得较大的元素逐渐"浮"到序列的末尾。这个过程就像气泡从水底升到水面一样，因此得名"冒泡排序"。

算法步骤如下：

比较相邻的两个元素，如果前一个比后一个大，就交换它们
对每一对相邻元素做同样的工作，从开始第一对到结尾最后一对
针对所有元素重复上述步骤，除了最后一个
持续每次对越来越少的元素重复上面的步骤，直到没有任何一对数字需要比较

2.2 冒泡排序的Python实现

python复制def bubble_sort(arr):
    n = len(arr)
    for i in range(n-1):
        # 提前退出标志位
        swapped = False
        for j in range(n-i-1):
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]
                swapped = True
        # 如果没有发生交换，说明数组已经有序
        if not swapped:
            break
    return arr

# 测试
nums = [64, 34, 25, 12, 22, 11, 90]
print(bubble_sort(nums))  # 输出: [11, 12, 22, 25, 34, 64, 90]

这个实现加入了提前退出的优化，如果在某一轮遍历中没有发生任何交换，说明数组已经有序，可以提前结束排序。

2.3 冒泡排序的性能分析

冒泡排序的时间复杂度分析：

最优情况：当输入数组已经是有序的，只需要一次遍历，时间复杂度为O(n)
最坏情况：当输入数组是逆序的，需要进行n(n-1)/2次比较和交换，时间复杂度为O(n²)
平均情况：时间复杂度为O(n²)

空间复杂度：O(1)，因为只需要常数级别的额外空间

稳定性：冒泡排序是稳定的排序算法，因为相等的元素不会被交换

虽然冒泡排序在实际应用中很少使用，但它对于理解排序算法的基本概念非常有帮助。在教学和算法入门阶段，冒泡排序仍然是一个重要的学习内容。

3. 选择排序全面剖析

选择排序是另一种简单直观的排序算法，它的工作原理是每次从未排序部分选择最小（或最大）元素，放到已排序部分的末尾。

3.1 选择排序的工作机制

选择排序的主要步骤：

在未排序序列中找到最小（大）元素，存放到排序序列的起始位置
从剩余未排序元素中继续寻找最小（大）元素
放到已排序序列的末尾
重复第二步，直到所有元素均排序完毕

与冒泡排序相比，选择排序的交换次数更少，每次遍历只需要交换一次元素。

3.2 选择排序的Python实现

python复制def selection_sort(arr):
    n = len(arr)
    for i in range(n-1):
        # 找到未排序部分的最小元素索引
        min_idx = i
        for j in range(i+1, n):
            if arr[j] < arr[min_idx]:
                min_idx = j
        # 将找到的最小元素与第一个未排序元素交换
        arr[i], arr[min_idx] = arr[min_idx], arr[i]
    return arr

# 测试
nums = [64, 25, 12, 22, 11]
print(selection_sort(nums))  # 输出: [11, 12, 22, 25, 64]

3.3 选择排序的特性分析

时间复杂度：

无论最好、最坏还是平均情况，选择排序的时间复杂度都是O(n²)，因为它总是需要执行n(n-1)/2次比较

空间复杂度：O(1)，原地排序，不需要额外空间

稳定性：选择排序是不稳定的排序算法。考虑序列[5,8,5,2,9]，第一次选择最小元素2时，会与第一个5交换，导致两个5的相对顺序改变

选择排序的一个优点是交换次数少，对于交换成本较高的场景（如交换大型对象）可能有一定优势。但在大多数情况下，它的性能不如插入排序。

4. 插入排序深入讲解

插入排序是一种简单直观的排序算法，它的工作原理类似于我们整理扑克牌的方式：每次将一张新牌插入到已经有序的牌中的适当位置。

4.1 插入排序的基本原理

插入排序的基本思想：

将第一个元素看作已排序序列
取出下一个元素，在已排序序列中从后向前扫描
如果该元素（已排序）大于新元素，将该元素移到下一位置
重复步骤3，直到找到已排序的元素小于或等于新元素的位置
将新元素插入到该位置后
重复步骤2~5，直到所有元素都排序完毕

4.2 插入排序的Python实现

python复制def insertion_sort(arr):
    n = len(arr)
    for i in range(1, n):
        key = arr[i]
        j = i-1
        # 将arr[i]插入到已排序序列arr[0..i-1]中的正确位置
        while j >= 0 and key < arr[j]:
            arr[j+1] = arr[j]
            j -= 1
        arr[j+1] = key
    return arr

# 测试
nums = [12, 11, 13, 5, 6]
print(insertion_sort(nums))  # 输出: [5, 6, 11, 12, 13]

4.3 插入排序的性能特点

时间复杂度：

最优情况：输入数组已经有序，每次只需要比较一次，时间复杂度为O(n)
最坏情况：输入数组是逆序的，每次都需要比较i次，时间复杂度为O(n²)
平均情况：时间复杂度为O(n²)

空间复杂度：O(1)，原地排序

稳定性：插入排序是稳定的排序算法，因为相等的元素不会被交换位置

插入排序在小规模数据或基本有序的数据上表现非常好，在实际应用中，它常常被用作快速排序等高级排序算法的子过程，用于处理小的子数组。

5. 希尔排序进阶解析

希尔排序是插入排序的一种高效改进版本，也称为缩小增量排序。它通过将原始列表分割成若干子列表来提高插入排序的性能。

5.1 希尔排序的核心思想

希尔排序的基本步骤：

选择一个增量序列t1, t2, ..., tk，其中ti > tj, tk = 1
按增量序列个数k，对序列进行k趟排序
每趟排序，根据对应的增量ti，将待排序列分割成若干长度为m的子序列，分别对各子表进行直接插入排序
仅增量因子为1时，整个序列作为一个表来处理，表长度即为整个序列的长度

5.2 希尔排序的Python实现

python复制def shell_sort(arr):
    n = len(arr)
    gap = n // 2  # 初始增量设为数组长度的一半
    
    while gap > 0:
        # 从gap位置开始，逐个对其所在组进行直接插入排序
        for i in range(gap, n):
            temp = arr[i]
            j = i
            # 对同一组内的元素进行插入排序
            while j >= gap and arr[j - gap] > temp:
                arr[j] = arr[j - gap]
                j -= gap
            arr[j] = temp
        gap = gap // 2  # 缩小增量
    return arr

# 测试
nums = [12, 34, 54, 2, 3]
print(shell_sort(nums))  # 输出: [2, 3, 12, 34, 54]

5.3 希尔排序的性能分析

时间复杂度：

希尔排序的时间复杂度取决于增量序列的选择
使用希尔增量时，最坏情况时间复杂度为O(n²)
使用Hibbard增量序列时，最坏情况时间复杂度为O(n^(3/2))
平均时间复杂度通常介于O(n log n)和O(n²)之间

空间复杂度：O(1)，原地排序

稳定性：希尔排序是不稳定的排序算法，因为相同的元素可能会被分到不同的子序列中

希尔排序在实际应用中表现良好，特别是对于中等大小的数组。它比简单的O(n²)算法（如插入排序）要快得多，而且实现相对简单。希尔排序的一个优点是它只需要O(1)的额外空间。

6. 快速排序深度剖析

快速排序是一种分治算法，由Tony Hoare在1960年提出。它是实际应用中最常用的排序算法之一，大多数编程语言的标准库中的排序函数都采用了快速排序或其变种。

6.1 快速排序的基本原理

快速排序的基本思想：

从数列中挑出一个元素，称为"基准"(pivot)
重新排序数列，所有比基准值小的元素放在基准前面，所有比基准值大的元素放在基准后面（相同的数可以到任一边）。这个称为分区(partition)操作
递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序

6.2 快速排序的Python实现

python复制def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]  # 选择中间元素作为基准
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quick_sort(left) + middle + quick_sort(right)

# 测试
nums = [3, 6, 8, 10, 1, 2, 1]
print(quick_sort(nums))  # 输出: [1, 1, 2, 3, 6, 8, 10]

这是一个简洁的实现，但效率不是最高的。下面是一个原地排序的优化版本：

python复制def partition(arr, low, high):
    i = low - 1  # 最小元素索引
    pivot = arr[high]  # 选择最后一个元素作为基准
    
    for j in range(low, high):
        # 当前元素小于或等于pivot
        if arr[j] <= pivot:
            i = i + 1
            arr[i], arr[j] = arr[j], arr[i]
    
    arr[i + 1], arr[high] = arr[high], arr[i + 1]
    return i + 1

def quick_sort_inplace(arr, low=0, high=None):
    if high is None:
        high = len(arr) - 1
    if low < high:
        # 分区索引
        pi = partition(arr, low, high)
        # 递归排序分区
        quick_sort_inplace(arr, low, pi - 1)
        quick_sort_inplace(arr, pi + 1, high)
    return arr

# 测试
nums = [10, 7, 8, 9, 1, 5]
quick_sort_inplace(nums)
print(nums)  # 输出: [1, 5, 7, 8, 9, 10]

6.3 快速排序的性能特点

时间复杂度：

最优情况：每次分区都能将数组均匀分成两部分，时间复杂度为O(n log n)
最坏情况：每次分区都极度不平衡（例如已经有序或逆序），时间复杂度为O(n²)
平均情况：时间复杂度为O(n log n)

空间复杂度：

最优情况：O(log n)，递归调用栈的空间
最坏情况：O(n)，当分区极度不平衡时

稳定性：快速排序是不稳定的排序算法

快速排序在实际应用中通常比其他O(n log n)算法更快，因为它的内循环可以在大多数架构上高效实现。快速排序的一个优化是随机选择基准值，这样可以避免最坏情况的发生。

7. 归并排序全面讲解

归并排序是一种典型的分治算法，由John von Neumann在1945年发明。它将排序问题分解为更小的子问题，然后合并这些子问题的解来获得原问题的解。

7.1 归并排序的基本原理

归并排序的基本步骤：

分解：将当前区间一分为二，即求分裂点mid = (low + high)/2
求解：递归地对两个子区间a[low...mid]和a[mid+1...high]进行归并排序
合并：将已排序的两个子区间a[low...mid]和a[mid+1...high]归并为一个有序的区间a[low...high]

7.2 归并排序的Python实现

python复制def merge_sort(arr):
    if len(arr) <= 1:
        return arr
    
    # 分割数组
    mid = len(arr) // 2
    left = arr[:mid]
    right = arr[mid:]
    
    # 递归排序
    left = merge_sort(left)
    right = merge_sort(right)
    
    # 合并两个有序数组
    return merge(left, right)

def merge(left, right):
    result = []
    i = j = 0
    
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    
    # 添加剩余元素
    result.extend(left[i:])
    result.extend(right[j:])
    return result

# 测试
nums = [38, 27, 43, 3, 9, 82, 10]
print(merge_sort(nums))  # 输出: [3, 9, 10, 27, 38, 43, 82]

7.3 归并排序的性能分析

时间复杂度：

最优情况：O(n log n)
最坏情况：O(n log n)
平均情况：O(n log n)

空间复杂度：O(n)，因为需要额外的空间来存储合并后的数组

稳定性：归并排序是稳定的排序算法

归并排序的一个主要优点是它的时间复杂度稳定为O(n log n)，不受输入数据的影响。这使得它非常适合处理大规模数据。然而，它的空间复杂度较高，这在内存受限的环境中可能是一个问题。归并排序也常用于外部排序，即处理无法全部装入内存的大型数据集。

排序算法基础与Python实现：从冒泡到归并

1. 排序算法基础概念

1.1 排序算法的稳定性解析

1.2 常见排序算法效率对比

2. 冒泡排序深度解析

2.1 冒泡排序的核心思想

2.2 冒泡排序的Python实现

2.3 冒泡排序的性能分析

3. 选择排序全面剖析

3.1 选择排序的工作机制

3.2 选择排序的Python实现

3.3 选择排序的特性分析

4. 插入排序深入讲解

4.1 插入排序的基本原理

4.2 插入排序的Python实现

4.3 插入排序的性能特点

5. 希尔排序进阶解析

5.1 希尔排序的核心思想

5.2 希尔排序的Python实现

5.3 希尔排序的性能分析

6. 快速排序深度剖析

6.1 快速排序的基本原理

6.2 快速排序的Python实现

6.3 快速排序的性能特点

7. 归并排序全面讲解

7.1 归并排序的基本原理

7.2 归并排序的Python实现

7.3 归并排序的性能分析

内容推荐