队列
先进者先出,就是“队列”,和栈一样,是一种操作受限的线性表数据结构。队列的基本操作是两个入队enqueue(),放一个数据到队列尾部;出队dequeue(),从队列头部取一个元素,示意图如下:
顺序队列
用数组实现的队列叫做顺序队列,用链表实现的队列叫做链式队列。队满的判断条件是tail==n;队空的判断条件是head==tail。
下面是用Java实现的基于数组的队列:
// 用数组实现的队列
public class ArrayQueue {
// 数组:items,数组大小:n
private String[] items;
private int n = 0;
// head 表示队头下标,tail 表示队尾下标
private int head = 0;
private int tail = 0;
// 申请一个大小为 capacity 的数组
public ArrayQueue(int capacity) {
items = new String[capacity];
n = capacity;
}
// 入队
public boolean enqueue(String item) {
// 如果 tail == n 表示队列已经满了
if (tail == n) return false;
items[tail] = item;
++tail;
return true;
}
// 出队
public String dequeue() {
// 如果 head == tail 表示队列为空
if (head == tail) return null;
// 为了让其他语言的同学看的更加明确,把 -- 操作放到单独一行来写了
String ret = items[head];
++head;
return ret;
}
}
相比较于栈只需要一个栈顶指针,队列需要两个指针,一个是head指针,指向队头;一个是tail指针,指向队尾。上面的代码有一个问题,当出队达到最右端时,尽管前面数组有空余空间,但是不能继续进行入队操作。
解决方案之一是每次出队操作都进行数据搬移,但是时间复杂度会由O(1)变为O(n)。另一种方式是当没有空闲空间时,在进行入队操作之前,集中触发一次数据的搬移操作,这样均摊时间复杂度就是O(1)。出对函数不变,入队函数变为:
// 入队操作,将 item 放入队尾
public boolean enqueue(String item) {
// tail == n 表示队列末尾没有空间了
if (tail == n) {
// tail ==n && head==0,表示整个队列都占满了
if (head == 0) return false;
// 数据搬移
for (int i = head; i < tail; ++i) {
// head的序号代表了有数据的位置,将所有的下标减去head,就是以0开始的位置
items[i-head] = items[i];
}
// 搬移完之后重新更新 head 和 tail
tail -= head;
head = 0;
}
items[tail] = item;
++tail;
return true;
}
当队列的tail指针移动到数组的最右边后,如果有新的额数据入队,可以将head到tail之间数据,整体搬移到数组中0到tail-head的位置。示意图如下:
链式队列
基于链表的实现,同样需要两个指针,head指针和tail指针,分别指向链表的第一个结点和最后一个结点。
入队时:
new_node.next = None
tail.next = new_node
tail = tail.next
出队时:
head = head.next
示意图如下:
循环队列
上面的队列,在tail==n时,会有数据搬移操作,这样对入队性能就会产生影响。
循环队列,是一个环,首尾相连,示意图如下:
当该队列入队a与b元素后,示意图如下:
在实现循环队列的时候,需要确定好队空和对满的判定条件。队空的判断条件是head==tail,队满的判断条件是(tail+1)%n==head,此时tail指向的位置上实际上是没有存储数据的,所以,会浪费一个数组的存储空间。队满时的示意图如下:
整体代码如下:
public class CircularQueue {
// 数组:items,数组大小:n
private String[] items;
private int n = 0;
// head 表示队头下标,tail 表示队尾下标
private int head = 0;
private int tail = 0;
// 申请一个大小为 capacity 的数组
public CircularQueue(int capacity) {
items = new String[capacity];
n = capacity;
}
// 入队
public boolean enqueue(String item) {
// 队列满了
if ((tail + 1) % n == head) return false;
items[tail] = item;
tail = (tail + 1) % n;
return true;
}
// 出队
public String dequeue() {
// 如果 head == tail 表示队列为空
if (head == tail) return null;
String ret = items[head];
head = (head + 1) % n;
return ret;
}
}
阻塞队列
阻塞队列就是在队列基础上增加了阻塞操作,换个角度,阻塞队列就是一个“生产者-消费者”模型,即:
- 队列为空时,从队头取数据会被阻塞,直到队列中有了数据才能返回
- 队列为满时,从队尾插入数据会被阻塞,知道队列中有空闲位置后在插入数据
示意图如下:
这种基于阻塞队列实现的生产者-消费者模型,可以有效地协调生成和消费的速度;通过协同生产者和消费者的个数,来提高数据的处理效率,如可以多配置几个消费者,来应对一个生产者,示意图如下:
并发队列
线程安全的队列叫做并发队列,最简单的实现方式是在enqueue()、dequeue()方法上加锁,但是锁粒度大并发度会比较低,同一时刻仅允许一个存或者取操作。
实际上,基于数组的循环队列,利用CAS原子操作,可以实现非常高效的并发队列,这是循环队列比链式队列应用更加广泛的原因。
线程池没有空闲线程时的策略
有两种策略:
- 非阻塞的方式:直接拒绝任务请求
- 阻塞方式:将请求排队,等到有空闲线程时,取出排队的请求继续处理
针对存储排队的请求,可以使用队列来实现。
- 基于链表的方式,可以实现一个支持无限排队的无界队列(unbounded queue),但是可能会造成过多的请求排队等待,请求的处理响应时间过长。因此,针对响应时间比较敏感的系统,基于链表实现的无限排队的线程池是不合适的。
- 基于数组的方法,实现的是一个有界队列(bounded queue),队列的大小有限,当线程池中排队的请求超过队列大小时,接下来的请求就会被拒绝,这种方式对于响应时间敏感的系统来说,就相对更加合理。
- 队列大小设置太大,造成等待的请求太多
- 队列大小设置太小,无法充分利用系统资源、发挥最大性能
实际上,对于大部分资源有限的场景,当没有空闲资源时,基本上都可以通过“队列”来实现请求排队。
注:本文是《数据结构与算法之美》的读书笔记,配套代码地址GitHub。本文仅限个人学习,请勿用作商业用途,谢谢。
Note: Cover Picture