協程
協程不是進程或線程,其執行過程更類似于子例程,或者說不帶返回值的函數調用。
一個程序可以包含多個協程,可以對比與一個進程包含多個線程,因而下面我們來比較協程和線程。我們知道多個線程相對獨立,有自己的上下文,切換受系統控制;而協程也相對獨立,有自己的上下文,但是其切換由自己控制,由當前協程切換到其他協程由當前協程來控制。
協程執行順序
首先,我們來看一個原生php代碼:
<?php
function task1(){
for ($i=0;$i<=300;$i++){
//寫入文件,大概要3000微秒
usleep(3000);
echo "寫入文件{$i}\n";
}
}
function task2(){
for ($i=0;$i<=500;$i++){
//發送郵件給500名會員,大概3000微秒
usleep(3000);
echo "發送郵件{$i}\n";
}
}
function task3(){
for ($i=0;$i<=100;$i++){
//模擬插入100條數據,大概3000微秒
usleep(3000);
echo "插入數據{$i}\n";
}
}
task1();
task2();
task3();
在這個代碼中,我們主要做了3件事:寫入文件,發送郵件,以及插入數據. 再看下面這段代碼:
<?php
function task1($i)
{
//使用$i標識 寫入文件,大概要3000微秒
if ($i > 300) {
return false;//超過300不用寫了
}
echo "寫入文件{$i}\n";
usleep(3000);
return true;
}
function task2($i)
{
//使用$i標識 發送郵件,大概要3000微秒
if ($i > 500) {
return false;//超過500不用發送了
}
echo "發送郵件{$i}\n";
usleep(3000);
return true;
}
function task3($i)
{
//使用$i標識 插入數據,大概要3000微秒
if ($i > 100) {
return false;//超過100不用插入
}
echo "插入數據{$i}\n";
usleep(3000);
return true;
}
$i = 0;
$task1Result = true;
$task2Result = true;
$task3Result = true;
while (true) {
$task1Result && $task1Result = task1($i);
$task2Result && $task2Result = task2($i);
$task3Result && $task3Result = task3($i);
if($task1Result===false&&$task2Result===false&&$task3Result===false){
break;//全部任務完成,退出循環
}
$i++;
}
這段代碼也是做了3件事,寫入文件,發送郵件,以及插入數據,但是和上面的不同的是,這段代碼將這3件事交叉執行,每個任務執行完一次之后,切換到另一個任務,如此循環.
類似于這樣的執行順序,就是協程.
協程是指一種用代碼實現任務交叉執行的邏輯,協程可以使得代碼1中的3個函數交叉運行,在實現了協程的框架中,我們不需要通過代碼2的方法實現任務交叉執行.直接可讓代碼1中的while(1),執行一次后切換
協程的實現
在php中,實現協程主要使用2種方式:
- yield生成器實現
- swoole擴展實現
swoole實現協程代碼:
<?php
function task1(){
for ($i=0;$i<=300;$i++){
//寫入文件,大概要3000微秒
usleep(3000);
echo "寫入文件{$i}\n";
Co::sleep(0.001);//掛起當前協程,0.001秒后恢復//相當于切換協程
}
}
function task2(){
for ($i=0;$i<=500;$i++){
//發送郵件給500名會員,大概3000微秒
usleep(3000);
echo "發送郵件{$i}\n";
Co::sleep(0.001);//掛起當前協程,0.001秒后恢復//相當于切換協程
}
}
function task3(){
for ($i=0;$i<=100;$i++){
//模擬插入100條數據,大概3000微秒
usleep(3000);
echo "插入數據{$i}\n";
Co::sleep(0.001);//掛起當前協程,0.001秒后恢復//相當于切換協程
}
}
$pid1 = go('task1');//go函數是swoole的開啟協程函數,用于開啟一個協程
$pid2 = go('task2');
$pid3 = go('task3');
以上代碼,即可實現切換函數
為什么要用sleep掛起協程實現切換呢?因為swoole的協程是自動的,當協程內遇上I/O操作(mysql,redis)等時,swoole的協程會自動切換,運行到下一個協程任務中(切換后,I/O繼續執行),直到下一個協程任務完成或者被切換(遇上I/O),如此反復,直到所有協程任務完成,則任務完成
協程與進程
由上面的協程執行順序
中的代碼2,我們很容易發現,協程其實只是運行在一個進程中的函數,只是這個函數會被切換到下一個執行,可以這么說:
協程只是一串運行在進程中的任務代碼,只是這些任務代碼可以交叉運行 注意,協程并不是多任務并行,屬于多任務串行,每個進程在一個時間只執行了一個任務
協程的作用域
由于協程就是進程中一串任務代碼,所以它的全局變量,靜態變量等變量都是共享的,包括了php的全局緩沖區.
所以,在開發之中,需要特別注意協程中的全局變量,靜態變量,只要某一個協程內修改了,那將會影響全部的協程,在使用ob緩沖區函數攔截的時候,也得考慮是否會被其他協程的輸出給污染.
用協程執行順序
中的代碼2解釋,當task1給$_GET['name']賦值為1時,task2讀取$_GET['name']也會是1,task2將$_GET['name']賦值為2時,task3讀取$_GET['name']也會是2
協程中的I/O連接
在協程中,要特別注意不能共用一個I/O連接,否則會造成數據異常.
用協程執行順序
中的代碼2解釋,當task1,task2函數共用mysql連接,并都進行查詢時,由于協程是交叉運行的,可能會造成task1獲取到task1+task2查詢出來的數據,也可能會丟失部分數據,被task2獲取.
由于協程的交叉運行機制,各個協程的I/O連接都必須是獨立的,所以我們需要在每個協程都創建一個連接,但由于mysql,redis的連接數有限,以及連接的開啟關閉需要消耗大量資源,所以我們可以使用連接池方案實現共用連接(只要保證每個連接每次只有一個協程在使用即可)