协程的介绍

分享于:2020-09-28 10:16:52

在介绍协程之前,我们需要重温下进程和线程。


什么是进程和线程?


进程就是应用程序的启动实例。比如我们运行一个游戏,打开一个软件,就是开启了一个进程。进程拥有代码和打开的文件资源、数据资源、独立的内存空间。


线程从属于进程,是程序的实际执行者,一个进程至少包含一个主线程,也可以有更多的子线程,线程拥有自己的栈空间。


2020-07-16_134238.png


对操作系统来说,线程是最小的执行单元,进程是最小的资源管理单元。无论进程还是线程,都是由操作系统所管理的。


线程的状态


Java中线程五种状态:初始化、可运行、运行中、阻塞、销毁。


82539cb6fc7b45bd94c4a6e3ad858bf2.png




线程不同状态之间的转化是谁来实现的呢?是JVM吗?


并不是。JVM需要通过操作系统内核中的TCB(Thread Control Block)模块来改变线程的状态,这一过程需要耗费一定的CPU资源。


进程和线程的痛点


线程之间是如何进行协作的呢?


最经典的例子就是生产者/消费者模式


若干个生产者线程向队列中写入数据,若干个消费者线程从队列中消费数据。


2020-07-16_134238.png


用java语言实现生产者/消费者模式


public class ProducerConsumerTest {
 
	public static void main(String args[]) {
		final Queue<Integer> sharedQueue = new Queue();
		Thread producer = new Producer(sharedQueue);
		Thread consumer = new Consumer(sharedQueue);
		producer.start();
		consumer.start();
	}
}


生产者:

class Producer extends Thread {
 
	private static final int MAX_QUEUE_SIZE = 5;
 
	private final Queue sharedQueue;
 
	public Producer(Queue sharedQueue) {
		super();
		this.sharedQueue = sharedQueue;
	}
 
	@Override
	public void run() {
		for (int i = 0; i < 100; i++) {
			synchronized (sharedQueue) {
				while (sharedQueue.size() >= MAX_QUEUE_SIZE) {
					System.out.println("队列满了,等待消费");
					try {
						sharedQueue.wait();
					} catch (InterruptedException e) {
						e.printStackTrace();
					}
				}
				sharedQueue.add(i);
				System.out.println("进行生产 : " + i);
				sharedQueue.notify();
			}
		}
	}
}


消费者:

class Consumer extends Thread {
	private final Queue sharedQueue;
 
	public Consumer(Queue sharedQueue) {
		super();
		this.sharedQueue = sharedQueue;
	}
 
	@Override
	public void run() {
		while (true) {
			synchronized (sharedQueue) {
				while (sharedQueue.size() == 0) {
					try {
						System.out.println("队列空了,等待生产");
						sharedQueue.wait();
					} catch (InterruptedException e) {
						e.printStackTrace();
					}
				}
				int number = sharedQueue.poll();
				System.out.println("进行消费 : " + number);
				sharedQueue.notify();
			}
		}
	}
}


这段代码做了下面几件事:

1.定义了一个生产者类,一个消费者类。

2.生产者类循环100次,向同步队列当中插入数据。

3.消费者循环监听同步队列,当队列有数据时拉取数据。

4.如果队列满了(达到5个元素),生产者阻塞。

5.如果队列空了,消费者阻塞。


上面的代码正确地实现了生产者/消费者模式,但是却并不是一个高性能的实现。为什么性能不高呢?原因如下:

1.涉及到同步锁。

2.涉及到线程阻塞状态和可运行状态之间的切换。

3.涉及到线程上下文的切换。


以上涉及到的任何一点,都是非常耗费性能的操作。


什么是协程呢?


协程(Coroutines)是一种比线程更加轻量级的存在,正如一个进程可以拥有多个线程一样,一个线程可以拥有多个协程。


2020-07-16_134238.png


协程不是被操作系统内核所管理的,而是完全由程序所控制,也就是在用户态执行。这样带来的好处是性能大幅度的提升,因为不会像线程切换那样消耗资源。


来看一段Python中使用协程的案例,同样以生产者消费者模式为例:

#!/usr/bin/env python3

#consume是协程函数
def consume():
    while True:
          #yield此处会被挂起,等待接收数据
          number = yield
          print('开始消费',number)

consumer = consume()
#执行consumer协程,暂时会在yield处停止
next(consumer)

for num in range(1,100):
    print('开始生产',num)
    #发送数据给consumer协程,yield处会被唤醒
    consumer.send(num)


这段代码十分简单,即使没用过python的小伙伴应该也能基本看懂。

代码中创建了一个叫做consumer的协程,并且在主线程中生产数据,协程中消费数据。

其中 yield 是python当中的语法。当协程执行到yield关键字时,会暂停在那一行,等到主线程调用send方法发送了数据,协程才会接到数据继续执行。

但是,yield让协程暂停,和线程的阻塞是有本质区别的。协程的暂停完全由程序控制,线程的阻塞状态是由操作系统内核来进行切换。

协程不是进程也不是线程,而是一个特殊的函数,这个函数可以在某个地方挂起,并且可以重新在挂起处外继续运行。所以说,协程与进程、线程相比并不是一个维度的概念。协程的开销远远小于线程的开销。


进程、线程、协程的对比


一个进程可以包含多个线程,一个线程也可以包含多个协程。简单来说,一个线程内可以由多个这样的特殊函数在运行,但是有一点必须明确的是,一个线程的多个协程的运行是串行的。如果是多核CPU,多个进程或一个进程内的多个线程是可以并行运行的,但是一个线程内协程却绝对是串行的,无论CPU有多少个核。毕竟协程虽然是一个特殊的函数,但仍然是一个函数。一个线程内可以运行多个函数,但这些函数都是串行运行的。当一个协程运行时,其它协程必须挂起。


  • 协程既不是进程也不是线程,协程仅仅是一个特殊的函数,协程它进程和进程不是一个维度的。

  • 一个进程可以包含多个线程,一个线程可以包含多个协程。

  • 一个线程内的多个协程虽然可以切换,但是多个协程是串行执行的,只能在一个线程内运行,没法利用CPU多核能力。想充分利用CPU,就得根据具体的服务器核数启动同样多的线程运行。

  • 协程与进程一样,切换是存在上下文切换问题的。


上下文切换


  • 进程的切换者是操作系统,切换时机是根据操作系统自己的切换策略,用户是无感知的。进程的切换内容包括页全局目录、内核栈、硬件上下文,切换内容保存在内存中。进程切换过程是由“用户态到内核态到用户态”的方式,切换效率低。

  • 线程的切换者是操作系统,切换时机是根据操作系统自己的切换策略,用户无感知。线程的切换内容包括内核栈和硬件上下文。线程切换内容保存在内核栈中。线程切换过程是由“用户态到内核态到用户态”, 切换效率中等。

  • 协程的切换者是用户(编程者或应用程序),切换时机是用户自己的程序所决定的。协程的切换内容是硬件上下文,切换内存保存在用户自己的变量(用户栈或堆)中。协程的切换过程只有用户态,即没有陷入内核态,因此切换效率高。


协程的应用

有哪些编程语言应用到了协程呢?我们举几个栗子:


Lua语言

Lua从5.0版本开始使用协程,通过扩展库coroutine来实现。


Python语言

正如刚才所写的代码示例,python可以通过 yield/send 的方式实现协程。在python 3.5以后,async/await 成为了更好的替代方案。


Go语言

Go语言对协程的实现非常强大而简洁,可以轻松创建成百上千个协程并发执行。


Java语言

如上文所说,Java语言并没有对协程的原生支持,但是某些开源框架模拟出了协程的功能,有兴趣的小伙伴可以看一看Kilim框架的源码:


PHP语言

swoole扩展可以让PHP实现协程的功能。


来源:https://blog.csdn.net/zheng199172/article/details/88800275