数据结构与算法-队列

队列

先进者先出,就是“队列”,和栈一样,是一种操作受限的线性表数据结构。队列的基本操作是两个入队enqueue(),放一个数据到队列尾部;出队dequeue(),从队列头部取一个元素,示意图如下:

顺序队列

用数组实现的队列叫做顺序队列,用链表实现的队列叫做链式队列。队满的判断条件是tail==n;队空的判断条件是head==tail

下面是用Java实现的基于数组的队列:

// 用数组实现的队列
public class ArrayQueue {
  // 数组:items,数组大小:n
  private String[] items;
  private int n = 0;
  // head 表示队头下标,tail 表示队尾下标
  private int head = 0;
  private int tail = 0;

  // 申请一个大小为 capacity 的数组
  public ArrayQueue(int capacity) {
    items = new String[capacity];
    n = capacity;
  }

  // 入队
  public boolean enqueue(String item) {
    // 如果 tail == n 表示队列已经满了
    if (tail == n) return false;
    items[tail] = item;
    ++tail;
    return true;
  }

  // 出队
  public String dequeue() {
    // 如果 head == tail 表示队列为空
    if (head == tail) return null;
    // 为了让其他语言的同学看的更加明确,把 -- 操作放到单独一行来写了
    String ret = items[head];
    ++head;
    return ret;
  }
}

相比较于栈只需要一个栈顶指针,队列需要两个指针,一个是head指针,指向队头;一个是tail指针,指向队尾。上面的代码有一个问题,当出队达到最右端时,尽管前面数组有空余空间,但是不能继续进行入队操作。

解决方案之一是每次出队操作都进行数据搬移,但是时间复杂度会由O(1)变为O(n)。另一种方式是当没有空闲空间时,在进行入队操作之前,集中触发一次数据的搬移操作,这样均摊时间复杂度就是O(1)。出对函数不变,入队函数变为:

   // 入队操作,将 item 放入队尾
  public boolean enqueue(String item) {
    // tail == n 表示队列末尾没有空间了
    if (tail == n) {
      // tail ==n && head==0,表示整个队列都占满了
      if (head == 0) return false;
      // 数据搬移
      for (int i = head; i < tail; ++i) {
        // head的序号代表了有数据的位置,将所有的下标减去head,就是以0开始的位置
        items[i-head] = items[i];
      }
      // 搬移完之后重新更新 head 和 tail
      tail -= head;
      head = 0;
    }
    items[tail] = item;
    ++tail;
    return true;
  }

当队列的tail指针移动到数组的最右边后,如果有新的额数据入队,可以将head到tail之间数据,整体搬移到数组中0到tail-head的位置。示意图如下:

链式队列

基于链表的实现,同样需要两个指针,head指针和tail指针,分别指向链表的第一个结点和最后一个结点。

入队时:

new_node.next = None
tail.next = new_node
tail = tail.next

出队时:

head = head.next

示意图如下:

循环队列

上面的队列,在tail==n时,会有数据搬移操作,这样对入队性能就会产生影响。

循环队列,是一个环,首尾相连,示意图如下:

当该队列入队a与b元素后,示意图如下:

在实现循环队列的时候,需要确定好队空和对满的判定条件。队空的判断条件是head==tail,队满的判断条件是(tail+1)%n==head,此时tail指向的位置上实际上是没有存储数据的,所以,会浪费一个数组的存储空间。队满时的示意图如下:

整体代码如下:

public class CircularQueue {
  // 数组:items,数组大小:n
  private String[] items;
  private int n = 0;
  // head 表示队头下标,tail 表示队尾下标
  private int head = 0;
  private int tail = 0;

  // 申请一个大小为 capacity 的数组
  public CircularQueue(int capacity) {
    items = new String[capacity];
    n = capacity;
  }

  // 入队
  public boolean enqueue(String item) {
    // 队列满了
    if ((tail + 1) % n == head) return false;
    items[tail] = item;
    tail = (tail + 1) % n;
    return true;
  }

  // 出队
  public String dequeue() {
    // 如果 head == tail 表示队列为空
    if (head == tail) return null;
    String ret = items[head];
    head = (head + 1) % n;
    return ret;
  }
}

阻塞队列

阻塞队列就是在队列基础上增加了阻塞操作,换个角度,阻塞队列就是一个“生产者-消费者”模型,即:

  • 队列为空时,从队头取数据会被阻塞,直到队列中有了数据才能返回
  • 队列为满时,从队尾插入数据会被阻塞,知道队列中有空闲位置后在插入数据

示意图如下:

这种基于阻塞队列实现的生产者-消费者模型,可以有效地协调生成和消费的速度;通过协同生产者和消费者的个数,来提高数据的处理效率,如可以多配置几个消费者,来应对一个生产者,示意图如下:

并发队列

线程安全的队列叫做并发队列,最简单的实现方式是在enqueue()、dequeue()方法上加锁,但是锁粒度大并发度会比较低,同一时刻仅允许一个存或者取操作。

实际上,基于数组的循环队列,利用CAS原子操作,可以实现非常高效的并发队列,这是循环队列比链式队列应用更加广泛的原因。

线程池没有空闲线程时的策略

有两种策略:

  • 非阻塞的方式:直接拒绝任务请求
  • 阻塞方式:将请求排队,等到有空闲线程时,取出排队的请求继续处理

针对存储排队的请求,可以使用队列来实现。

  • 基于链表的方式,可以实现一个支持无限排队的无界队列(unbounded queue),但是可能会造成过多的请求排队等待,请求的处理响应时间过长。因此,针对响应时间比较敏感的系统,基于链表实现的无限排队的线程池是不合适的。
  • 基于数组的方法,实现的是一个有界队列(bounded queue),队列的大小有限,当线程池中排队的请求超过队列大小时,接下来的请求就会被拒绝,这种方式对于响应时间敏感的系统来说,就相对更加合理。
    • 队列大小设置太大,造成等待的请求太多
    • 队列大小设置太小,无法充分利用系统资源、发挥最大性能

实际上,对于大部分资源有限的场景,当没有空闲资源时,基本上都可以通过“队列”来实现请求排队

注:本文是《数据结构与算法之美》的读书笔记,配套代码地址GitHub。本文仅限个人学习,请勿用作商业用途,谢谢。

Note: Cover Picture