22、Golang 教程 - 信道

在上一篇教程中,我们讨论了如何使用协程在go中实现并发。在本教程中,我们将讨论有关信道以及如何使用信道实现协程间通信。

什么是信道

信道Channel)可以被认为是协程之间通信的管道。类似于水在管道中从一端流向另一端一样,数据可以从信道的一端发送并在另一端接收。

声明信道

每个信道都有一个与之关联的类型。此类型是该信道允许传输的数据类型,不允许使用该信道传输其他类型。

chan T 是一个 T 类型的信道。

信道的零值nilnil 信道没有任何用处,因此必须使用内置函数 make 来创建一个信道,就像创建 mapslice 一样。

下面的代码声明了一个信道:

 package main

import "fmt"

func main() {

    var a chan int
    if a == nil {

        fmt.Println("channel a is nil, going to define it")
        a = make(chan int)
        fmt.Printf("Type of a is %T", a)
    }
}

信道的零值为 nil,所以第 6 行声明的信道 a 的值为 nil。因此执行 if 里面的语句创建信道。上面的程序中 a 是一个 int 类型的信道。程序的输出为:

 channel a is nil, going to define it  
Type of a is chan int 

像往常一样,简写声明也是定义频道的有效而简洁的方法。

 a := make(chan int) 

上面的这行代码同样定义了一个 int 型的信道。

通过信道发送和接收数据

通过信道发送和接收数据的语法如下:

 data := <- a // read from channel a  
a <- data // write to channel a  

通过箭头相对于信道的方向来指定是发送还是接收数据。

在第一行中,箭头从信道 a 指向外部,因此我们从信道读取a并将值存储到变量data中。

在第二行,箭头从data指向信道 a,因此我们向信道a中写入数据。

发送与接收默认是阻塞的

对信道发送和接收数据默认是阻塞的。这是什么意思?当数据发送到信道时,程序在发送语句处阻塞,直到其他协程从该信道中读取数据。类似地,当从信道读取数据时,程序在读取语句处被阻塞,直到其他协程向信道写入数据。

信道的这种特性使得协程间通信变得高效,而不是向其他编程语言一样,显式的使用锁和条件变量来达到此目的。

信道示例程序

理论已经讲完了,让我们编写一个程序来了解协程是如何使用信道进行通信。

我们将用信道来重写在上一篇教程协程中的一个例子。

我们在上篇教程中使用的例子如下:

 package main

import (
    "fmt"
    "time"
)

func hello() {

    fmt.Println("Hello world goroutine")
}
func main() {

    go hello()
    time.Sleep(1 * time.Second)
    fmt.Println("main function")
}

这是上一篇教程中的例子,我们通过使用 Sleep 来使主协程休眠,以等待 hello 协程执行结束。如果你不明白这是为什么,我建议你阅读上一篇教程:协程

我们用信道重写上面的程序:

 package main

import (
    "fmt"
)

func hello(done chan bool) {

    fmt.Println("Hello world goroutine")
    done <- true
}
func main() {

    done := make(chan bool)
    go hello(done)
    <-done
    fmt.Println("main function")
}

上面程序的第12行定义了一个 bool 类型的信道 done,然后将它作为参数传递给 hello 协程。在第 14 行,我们从信道 done 中读取数据。程序将在这一行被阻塞,在其他协程向信道 done 里写入数据之前,程序将在这一行一直等待而不会执行下一行语句。因此这里就不需要使用原始程序中 time.Sleep 来阻止主协程退出了。

<-done 这一行从信道 done 中读取数据,但是没有使用该数据,也没有将它赋值给其他变量,这是完全合法的。

现在我们让 main 协程被阻塞,等待从信道 done 中读取数据。hello 协程接受信道 done 作为参数,打印 Hello world goroutine然后将数据写入信道 done 中。当写入完毕后,main 协程从信道 done 中接收到数据,main 协程解除阻塞,继续执行下一条语句,打印:main function

程序的输出为:

 Hello world goroutine  
main function  

让我们来修改这个程序,通过在hello协程中引入休眠操作,来更好地理解阻塞这个概念。

 package main

import (
    "fmt"
    "time"
)

func hello(done chan bool) {

    fmt.Println("hello go routine is going to sleep")
    time.Sleep(4 * time.Second)
    fmt.Println("hello go routine awake and going to write to done")
    done <- true
}
func main() {

    done := make(chan bool)
    fmt.Println("Main going to call hello go goroutine")
    go hello(done)
    <-done
    fmt.Println("Main received data")
}

在上面程序中的第 10 行,我们在 hello 函数中增加了4 秒钟的休眠。

该程序首先打印 Main going to call hello go goroutine 。然后 hello 协程开始执行,它将打印 hello go routine is going to sleep,然后 hello 协程休眠 4 秒,在这期间, main 主协程 在 <-done 这一行阻塞,因为在等待从信道 done 中读取数据。4秒钟之后, hello 协程打印:hello go routine awake and going to write to don,接着 main 协程打印:Main received data

信道的另一个例子

让我们再写一个程序来更好的理解信道。该程序计算一个数中每一位的 平方和 与 立方和,并将平方和与立方和相加得出最后的结果打印出来。

例如,输入123 ,程序将做如下计算以得出最后结果:

 squares = (1 * 1) + (2 * 2) + (3 * 3) 
cubes = (1 * 1 * 1) + (2 * 2 * 2) + (3 * 3 * 3) 
output = squares + cubes = 49

我们将平方和的计算与立方和的计算分别放在一个协程中执行,最后在主协程中将它们的计算结果求和。

 package main

import (
    "fmt"
)

func calcSquares(number int, squareop chan int) {

    sum := 0
    for number != 0 {

        digit := number % 10
        sum += digit * digit
        number /= 10
    }
    squareop <- sum
}

func calcCubes(number int, cubeop chan int) {

    sum := 0
    for number != 0 {

        digit := number % 10
        sum += digit * digit * digit
        number /= 10
    }
    cubeop <- sum
}

func main() {

    number := 589
    sqrch := make(chan int)
    cubech := make(chan int)
    go calcSquares(number, sqrch)
    go calcCubes(number, cubech)
    squares, cubes := <-sqrch, <-cubech
    fmt.Println("Final output", squares+cubes)
}

上面程序第 7 行,函数 calcSquares 计算 number 每一位的平方和,并将结果发送给信道 squareop。同样地,在第 17 行,函数 calcCubes 计算 number 每一位的立方和,并将结果发送给信道 cubeop

这两个函数分别在第31行和32行接受不同的信道作为参数,并运行在各自的协程中,最后将结果写入各自的信道。主协程在第 33 行同时等待这两个信道中的数据。一旦从这两个信道中接收到数据,它们分别被存放在变量 squarescubes 中,最后将它们的和打印出来。程序的输出为:

 Final output 1536  

死锁

使用信道时要考虑的一个重要因素是死锁。如果一个协程发送数据给一个信道,而没有其他的协程从该信道中接收数据,那么程序在运行时会遇到死锁,并触发 panic

同样地,如果一个协程从一个信道中接收数据,我们期望其他的协程向这个信道发送数据,如果没有协程向这个信道发送数据,则程序同样造成死锁,程序将会触发 panic

 package main

func main() {

    ch := make(chan int)
    ch <- 5
}

上面的程序中,创建了一个信道 ch,并通过 ch <- 5 向其中写入 5 。这个程序中没有其他协程从 ch 中接收数据,因此程序在运行时触发 panic,错误如下:

 fatal error: all goroutines are asleep - deadlock!

goroutine 1 [chan send]:  
main.main()  
    /tmp/sandbox249677995/main.go:6 +0x80

单向信道

到目前为止我们讨论的所有信道都是双向信道,数据既可以发送到双向信道,也可以从双向信道中读取。其实也可以创建单向信道,即仅发送或仅接收数据的信道。

 package main

import "fmt"

func sendData(sendch chan<- int) {

    sendch <- 10
}

func main() {

    sendch := make(chan<- int)
    go sendData(sendch)
    fmt.Println(<-sendch)
}

在上面程序中的第 10 行,我们创建了一个仅发送信道 sendchchan<- int 表示只能向信道发送数据,因为箭头的方向指向chan。在第 12 行,我们试图从一个仅发送信道中接收数据,这是非法的,当程序运行时,编译器报错如下:

 main.go:11: invalid operation: <-sendch (receive from send-only type chan<- int)

一切都很好,但如果无法读取,创建一个仅发送通道有什么卵用呢?

这就是信道转型的用途。可以将双向信道转换为仅发送或仅接受信道,但是反过来却不行。

 package main

import "fmt"

func sendData(sendch chan<- int) {

    sendch <- 10
}

func main() {

    chnl := make(chan int)
    go sendData(chnl)
    fmt.Println(<-chnl)
}

在程序的第 10 行,创建了一个双向信道 chnl。在第 11 行它被作为参数传递给协程 sendData。第 5 行,sendData 函数参数是 sendch chan<- int 将该信道转换成仅发送信道。因此在 sendData 函数中该信道为仅发送信道,而在主协程中该信道为双向信道。程序将打印:10

关闭信道和使用 for range 遍历信道

发送者能够关闭信道以通知接收者将不会再在该信道上发送数据。
接收者可以在从信道接收数据时使用附加变量来检查信道是否已关闭。

 v, ok := <- ch  

上面的语句中,如果成功的接收到了发送的数据,则 ok 返回 true ,如果 ok 返回 false 则表示信道已经被关闭。从已关闭的信道中读取到的数据为信道类型的零值。比如从一个被关闭的 int 信道中读取数据,那么将得到 0

 package main

import (
    "fmt"
)

func producer(chnl chan int) {

    for i := 0; i < 10; i++ {

        chnl <- i
    }
    close(chnl)
}
func main() {

    ch := make(chan int)
    go producer(ch)
    for {

        v, ok := <-ch
        if ok == false {

            break
        }
        fmt.Println("Received ", v, ok)
    }
}

上面的程序中,协程 producer 向信道 chnl 中写入 09 并关闭该信道。主协程在第 16行进行无限循环,并在第 18 行循环中检测 ok的值判断信道是否已经被关闭。如果 okfalse 表示信道已经被关闭,则通过 break 退出循环。否则接收数据并打印 ok的值。程序的输出为:

 Received  0 true  
Received  1 true  
Received  2 true  
Received  3 true  
Received  4 true  
Received  5 true  
Received  6 true  
Received  7 true  
Received  8 true  
Received  9 true  

for range 可以用来接收一个信道中的数据,直到该信道关闭。

让我们用for range 循环 重写上面的程序:

 package main

import (
    "fmt"
)

func producer(chnl chan int) {

    for i := 0; i < 10; i++ {

        chnl <- i
    }
    close(chnl)
}
func main() {

    ch := make(chan int)
    go producer(ch)
    for v := range ch {

        fmt.Println("Received ", v)
    }
}

在第16 行,for range 不断从信道 ch 中接收数据,直到该信道关闭。一旦 ch 关闭,循环自动退出。程序的输出如下:

 Received  0  
Received  1  
Received  2  
Received  3  
Received  4  
Received  5  
Received  6  
Received  7  
Received  8  
Received  9  

在信道的另一个例子 中的程序可以使用 for range 重写,以达到更多的代码可重用性。

如果仔细观察该程序,你可以注意到,在 calcSquarescalcCubes 函数中查找一个数的每一位的代码重复了。我们将这段代码提取到一个单独的函数,然后并发的调用它。

 package main

import (
    "fmt"
)

func digits(number int, dchnl chan int) {

    for number != 0 {

        digit := number % 10
        dchnl <- digit
        number /= 10
    }
    close(dchnl)
}
func calcSquares(number int, squareop chan int) {

    sum := 0
    dch := make(chan int)
    go digits(number, dch)
    for digit := range dch {

        sum += digit * digit
    }
    squareop <- sum
}

func calcCubes(number int, cubeop chan int) {

    sum := 0
    dch := make(chan int)
    go digits(number, dch)
    for digit := range dch {

        sum += digit * digit * digit
    }
    cubeop <- sum
}

func main() {

    number := 589
    sqrch := make(chan int)
    cubech := make(chan int)
    go calcSquares(number, sqrch)
    go calcCubes(number, cubech)
    squares, cubes := <-sqrch, <-cubech
    fmt.Println("Final output", squares+cubes)
}

上面的程序中 ,digits 函数包含了获取一个数的每个位数的逻辑,并且被 calcSquarescalcCubes 两个函数并发地调用了。一旦传入数字的每个位数都被解析完,没有更多的位数时,第 13 行就会关闭信道。calcSquarescalcCubes 两个协程使用 for range 循环分别监听了它们的信道,直到该信道关闭。程序的其他地方不变,该程序同样会输出:

 Final output 1536

这就来到了本教程的最后。信道中还有更多的概念,比如缓冲信道工作池select 。我们将在单独的教程中讨论它们。