极致排序算法#

桶排序#

典型的空间换时间算法，天然具有O(n)的时间复杂度，但对于数据较为离散的时候容易出现空间浪费

数据必须为无符号整数，且具有上限#
比较冒泡排序，快排等基于比较排序的上线O(n log n)的时间复杂度更低#
空间复杂度为O(n * k)#
当数据较为离散，空间浪费较为严重#
当数据上线过高，需要的空间极大#

C++代码实现

1
#include <vector>
2

3
#define NUMMAX 10000// 数据上限
4
#define length 100  // 数据长度
5

6
void bin_sort(uint32_t *list,size_t n){
7
    vector<uint32_t> bin(NUMMAX);
8
    for (size_t i = 0; i < n; i++) {
9
        uint32_t x = a[i];
10
        bin[x]++;
11
    }
12
    size_t index = 0;
13
    for (size_t i = 0; i < bin.size(); i++) {
14
        for(size_t j = 0;j < bin[i];j++){
15
            a[index++] = i;
16
        }
17
    }
18
}

桶排序的稳定性#

排序算法的稳定性是排序过程中，对于数值相同的两个元素的位置是否会出现改变

即假定有这么一串数据

1
[
2
    {"name":"小明","score":99},
3
    {"name":"小东","score":27},
4
    {"name":"小西","score":63},
5
    {"name":"小红","score":70},
6
    {"name":"小白","score":70}
7
]

在经过排序算法的排序后，成绩相同的小红和小白的前后是否一致，当排序后小红仍然在小白前面恒成立，即可以称算法稳定，反之即为不稳定。

1
// 上述案例是将name作为判断key
2
// 可以修改 DataType 的类型自定义结构体做验证
3
// 并将以下代码作为桶排序优化的开始
4
#define DataType uint32_t
5
void radix_sort(DataType *a,size_t n)
6
{
7
  // 桶排序
8
  // 声明一个二维数组，10000个桶
9
  vector<vector<DataType>> bin(NUMMAX);
10
  for (size_t i = 0; i < n; i++) {
11
    DataType x = a[i];
12
    bin[x].push_back(x);
13
  }
14

15
  // 将桶中的元素放回原数组
16
  size_t index = 0;
17
  for (size_t i = 0; i < bin.size(); i++) {
18
    if (bin[i].empty()) continue;
19
    for (auto x : bin[i]) {
20
      a[index++] = x;
21
    }
22
  }
23
}

利用稳定性，我们可以将桶排序进行拆分优化，将比较的数字拆做一个个十以内的数字组合

例如: [12,321,2,12,32,4323,12,2]

单独看个位数做排序，进行排序后: [321, 12, 2, 12, 32, 12, 2, 4323]

第二次看十位排序，当十位不存在时，其结果为0: [2, 2, 12, 12, 12, 321, 4323, 32]

以此类推，会逐渐排序完成。因为其稳定所以在单独看某位数时排序也不会乱

1
# Python实现，比较容易复现
2
arr = [12,321,2,12,32,4323,12,2]
3

4
def radix_sort(arr):
5
    bin  = [[] for _ in range(10)]
6
    for i in range(len(arr)):
7
        x = arr[i]
8
        bin[x // 1 % 10].append(x)
9
    arr = []
10
    for i in bin:
11
        for j in i:
12
            arr.append(j)
13
    print(arr)
14

15
radix_sort(arr)

C++实现

1
void radix_sort(uint32_t *a,size_t n)
2
{
3
  vector<vector<uint32_t>> bin(10);
4
  // 处理个位数的排序
5
  for (size_t i = 0; i < n; i++) {
6
    uint32_t x = a[i];
7
    bin[x % 10].push_back(x);
8
  }
9
  // 将桶中的元素放回原数组
10
  size_t index = 0;
11
  for (size_t i = 0; i < 10; i++) {
12
    if (bin[i].empty()) continue;
13
    for (auto x : bin[i]) {
14
      a[index++] = x;
15
    }
16
  }
17
    // 清空容器
18
  for (size_t i = 0; i < 10; i++) {
19
    bin[i].clear();
20
  }
21

22
  // 处理十位数
23
  for (size_t i = 0; i < n; i++) {
24
    uint32_t x = a[i];
25
    bin[x / 10 % 10].push_back(x);
26
  }
27
    // 以此类推......
28
}

上述例子中，我们采用10进行数据分段方便理解，计算机中的基础还是二进制，采用二进制可以使计算中除法运算换成位运算，会更加便捷高效，以10000为例

1
> 10000 % 256
2
16
3
> bin(10000)
4
0b10011100010000
5
> bin(256)
6
0b11111111
7
# 10011100010000
8
# 00000011111111
9
# 做 与(and) 操作
10
# 00000000010000 = 16
11
> 10000 // 256
12
39
13
> 10000 & 8
14
39
15
# 256 = 2的8次方
16
# 注意看，第一行的前8位置移到后面，变成第二行
17
# 0010 0111 0001 0000 = 10000 >> 8
18
# 0000 0000 0010 0111 = 39

C++代码实现

1
void radix_sort(uint32_t *a,size_t n)
2
{
3
  vector<vector<uint32_t>> bin(0x100);
4

5
  for (size_t p = 0; p < 4; p++) {
6
    // 清空桶
7
    for (size_t i = 0; i < bin.size(); i++) {
8
      bin[i].clear();
9
    }
10
    // 计算偏移量
11
    uint16_t shift = p * 8;
12
    // 将元素放入桶中
13
    for (size_t i = 0; i < n; i++) {
14
      uint32_t x = a[i];
15
      bin[(x >> shift) & 0xff].push_back(x);
16
    }
17
    // 将桶中的元素放回原数组
18
    size_t index = 0;
19
    for (size_t i = 0; i < bin.size(); i++) {
20
      if (bin[i].empty()) continue;
21
      for (auto x : bin[i]) {
22
        a[index++] = x;
23
      }
24
    }
25
  }
26
}

同时我们可以发现，实现中出现了大量容器的push_back操作，尽管我们在算法中常常将函数调用视作为常数时间计算，但是容器的频繁扩容也会带来大量IO操作。虽然我们无法预测每个桶的大小，但是我们可以通过预先统计桶的大小，根据大小分配容器大小，就可以避免数组的获取和释放了。

1
void radix_sort(uint32_t *a,size_t n)
2
{
3
  vector<vector<uint32_t>> bin(0x100);
4
  vector<size_t> count(0x100); // 统计每个桶的元素数量
5
  vector<size_t> offset(0x100); // 统计每个桶的当前数据量
6
  for (size_t p = 0; p < 4; p++) {
7
    size_t i = 0, shift = p * 8;
8
    for (i = 0; i < bin.size(); i++) {
9
      bin[i].clear();
10
      offset[i] = 0;
11
      count[i] = 0;
12
    }
13
    for (i = 0; i < n; i++) // 原本的push_back操作改为先统计数量
14
      count[(a[i] >> shift) & 0xff]++;
15
    for (i = 0; i < bin.size(); i++) // 预分配空间
16
      bin[i].resize(count[i]);
17

18
    for (i = 0; i < n; i++) { // 放入对应的桶中
19
      uint32_t index = (a[i] >> shift) & 0xff;
20
      bin[index][offset[index]++] = a[i];
21
    }
22

23
    size_t index = 0;
24
    for (i = 0; i < bin.size(); i++) {
25
      if (bin[i].empty()) continue;
26
      for (auto x : bin[i]) {
27
        a[index++] = x;
28
      }
29
    }
30
  }
31
}

前缀和#

既然我们已经可以知道每个桶的大小，那我们也可以通过扁平化二位数组实现数组访问速度的优化

1
void radix_sort(uint32_t *a,size_t n)
2
{
3
  vector<uint32_t> bin(n); // 扁平化数组
4
  vector<size_t> count(0x100); // 统计每个桶的元素数量
5
  vector<size_t> offset(0x100); // 每个桶的当前位置
6
  for (size_t p = 0; p < 4; p++) {
7
    size_t i = 0, shift = p * 8;
8
    for (i = 0; i < 256; i++) {
9
      offset[i] = 0;
10
      count[i] = 0;
11
    }
12
    for (i = 0; i < n; i++) // 原本的push_back操作改为先统计数量
13
      count[(a[i] >> shift) & 0xff]++;
14
    size_t sum = 0;
15
    for (i = 0; i < 256; i++)
16
      offset[i] = sum,  // 计算每个桶的起始位置
17
      sum += count[i];  // 前缀和
18
    for (i = 0;i < n; i++) { // 放入对应的桶中
19
      uint32_t index = (a[i] >> shift) & 0xff;
20
      bin[offset[index]++] = a[i];
21
    }
22

23
    for (size_t i = 0; i < bin.size(); i++) {
24
      a[i] = bin[i];
25
    }
26
  }
27
}

double buffer 双缓冲#

从之前优化的代码可以看出，我们在每次排序过后，都需要将数据从bin拷贝的a，这其实不必要的。我们可以利用双缓冲，调换排序的指针做一个小优化

1
void radix_sort(uint32_t *a,size_t n)
2
{
3
  vector<uint32_t> bin(n);    // 扁平化排序数组
4
  vector<size_t> count(0x100);  // 统计每个桶的元素数量
5
  vector<size_t> offset(0x100); // 统计每个桶的当前数据量
6

7
  uint32_t* b = bin.data();    // 当前操作的数组指针
8

9
  for (size_t p = 0; p < 4; p++) {
10
    size_t i = 0, shift = p * 8;
11
    for (i = 0; i < 256; i++) {
12
      offset[i] = 0;
13
      count[i] = 0;
14
    }
15
    for (i = 0; i < n; i++) // 原本的push_back操作改为先统计数量
16
      count[(a[i] >> shift) & 0xff]++;
17
    size_t sum = 0;
18
    for (i = 0; i < 256; i++)
19
      offset[i] = sum,  // 计算每个桶的起始位置
20
      sum += count[i];
21
    for (i = 0;i < n; i++) { // 放入对应的桶中
22
      uint32_t index = (a[i] >> shift) & 0xff;
23
      b[offset[index]++] = a[i];
24
    }
25
    swap(a, b); // 交换指针，下一轮继续处理
26
  }
27
}

Lovely firefly!

极致排序算法

极致排序算法#

桶排序#

数据必须为无符号整数，且具有上限#

比较冒泡排序，快排等基于比较排序的上线O(n log n)的时间复杂度更低#

空间复杂度为O(n * k)#

当数据较为离散，空间浪费较为严重#

当数据上线过高，需要的空间极大#

桶排序的稳定性#

前缀和#

double buffer 双缓冲#

文章分享

目录