Go调度器系列（4）源码阅读与探索

发表于 2019-04-14 更新于 2020-12-13 阅读次数：

各位朋友，这次想跟大家分享一下Go调度器源码阅读相关的知识和经验，网络上已经有很多剖析源码的好文章，所以这篇文章不是又一篇源码剖析文章，注重的不是源码分析分享，而是带给大家一些学习经验，希望大家能更好的阅读和掌握Go调度器的实现。

本文主要分2个部分：

解决如何阅读源码的问题。阅读源码本质是把脑海里已经有的调度设计，看看到底是不是这么实现的，是怎么实现的。
带给你一个探索Go调度器实现的办法。源码都到手了，你可以修改、窥探，通过这种方式解决阅读源码过程中的疑问，验证一些想法。比如：负责调度的是g0，怎么才能schedule()在执行时，当前是g0呢？

如何阅读源码

阅读前提

阅读Go源码前，最好已经掌握Go调度器的设计和原理，如果你还无法回答以下问题：

为什么需要Go调度器？
Go调度器与系统调度器有什么区别和关系/联系？
G、P、M是什么，三者的关系是什么？
P有默认几个？
M同时能绑定几个P？
M怎么获得G？
M没有G怎么办？
为什么需要全局G队列？
Go调度器中的负载均衡的2种方式是什么？
work stealing是什么？什么原理？
系统调用对G、P、M有什么影响？
Go调度器抢占是什么样的？一定能抢占成功吗？

建议阅读Go调度器系列文章，以及文章中的参考资料：

优秀源码资料推荐

既然你已经能回答以上问题，说明你对Go调度器的设计已经有了一定的掌握，关于Go调度器源码的优秀资料已经有很多，我这里推荐2个：

雨痕的Go源码剖析六章并发调度，不止是源码，是以源码为基础进行了详细的Go调度器介绍：https://github.com/qyuhen/book
Go夜读第12期，golang中goroutine的调度，M、P、G各自的一生状态，以及转换关系：https://reading.developerlearning.cn/reading/12-2018-08-02-goroutine-gpm/

Go调度器的源码还涉及GC等，阅读源码时，可以暂时先跳过，主抓调度的逻辑。

另外，Go调度器涉及汇编，也许你不懂汇编，不用担心，雨痕的文章对汇编部分有进行解释。

最后，送大家一幅流程图，画出了主要的调度流程，大家也可边阅读边画，增加理解，高清版可到博客下载（原图原文跳转）。

如何探索调度器

这部分教你探索Go调度器的源码，验证想法，主要思想就是，下载Go的源码，添加调试打印，编译修改的源文件，生成修改的go，然后使用修改go运行测试代码，观察结果。

下载和编译Go

Github下载，并且换到go1.11.2分支，本文所有代码修改都基于go1.11.2版本。

$ GODIR=$GOPATH/src/github.com/golang/go
$ mkdir -p $GODIR
$ cd $GODIR/..
$ git clone https://github.com/golang/go.git
$ cd go
$ git fetch origin go1.11.2
$ git checkout origin/go1.11.2
$ git checkout -b go1.11.2
$ git checkout go1.11.2

初次编译，会跑测试，耗时长一点
1
2
$ cd $GODIR/src
$ ./all.bash

以后每次修改go源码后可以这样，4分钟左右可以编译完成

$ cd  $GODIR/src
$ time ./make.bash
Building Go cmd/dist using /usr/local/go.
Building Go toolchain1 using /usr/local/go.
Building Go bootstrap cmd/go (go_bootstrap) using Go toolchain1.
Building Go toolchain2 using go_bootstrap and Go toolchain1.
Building Go toolchain3 using go_bootstrap and Go toolchain2.
Building packages and commands for linux/amd64.
---
Installed Go for linux/amd64 in /home/xxx/go/src/github.com/golang/go
Installed commands in /home/xxx/go/src/github.com/golang/go/bin

real	1m11.675s
user	4m4.464s
sys	0m18.312s

编译好的go和gofmt在$GODIR/bin目录。

$ ll $GODIR/bin
total 16044
-rwxrwxr-x 1 vnt vnt 13049123 Apr 14 10:53 go
-rwxrwxr-x 1 vnt vnt  3377614 Apr 14 10:53 gofmt

为了防止我们修改的go和过去安装的go冲突，创建igo软连接，指向修改的go。
1
2
3
$ mkdir -p ~/testgo/bin
$ cd ~/testgo/bin
$ ln -sf $GODIR/bin/go igo
最后，把~/testgo/bin加入到PATH，就能使用igo来编译代码了，运行下igo，应当获得go1.11.2的版本：
1
2
$ igo version
go version go1.11.2 linux/amd64

当前，已经掌握编译和使用修改的go的办法，接下来就以1个简单的例子，教大家如何验证想法。

验证schedule()由g0执行

阅读源码的文章，你已经知道了g0是负责调度的，并且g0是全局变量，可在runtime包的任何地方直接使用，看到schedule()代码如下（所在文件：$GODIR/src/runtime/proc.go）：

// One round of scheduler: find a runnable goroutine and execute it.
// Never returns.
func schedule() {
	// 获取当前g，调度时这个g应当是g0
	_g_ := getg()

	if _g_.m.locks != 0 {
		throw("schedule: holding locks")
	}

	// m已经被某个g锁定，先停止当前m，等待g可运行时，再执行g，并且还得到了g所在的p
	if _g_.m.lockedg != 0 {
		stoplockedm()
		execute(_g_.m.lockedg.ptr(), false) // Never returns.
	}

	// 省略...
}

问题：既然g0是负责调度的，为何schedule()每次还都执行_g_ := getg()，直接使用g0不行吗？schedule()真的是g0执行的吗？

在《Go调度器系列（2）宏观看调度器》这篇文章中我曾介绍了trace的用法，阅读代码时发现使用debug.schedtrace和print()函数可以用作打印调试信息，那我们是不是可以使用这种方法打印我们想获取的信息呢？当然可以。

另外，注意print()并不是fmt.Print()，也不是C语言的printf，所以不是格式化输出，它是汇编实现的，我们不深入去了解它的实现了，现在要掌握它的用法：

// The print built-in function formats its arguments in an
// implementation-specific way and writes the result to standard error.
// Print is useful for bootstrapping and debugging; it is not guaranteed
// to stay in the language.
func print(args ...Type)

从上面可以看到，它接受可变长参数，我们使用的时候只需要传进去即可，但要手动控制格式。

我们修改schedule()函数，使用debug.schedtrace > 0控制打印，加入3行代码，把goid给打印出来，如果始终打印goid为0，则代表调度确实是由g0执行的：

1
2
3

if debug.schedtrace > 0 {
	print("schedule(): goid = ", _g_.goid, "\n") // 会是0吗？是的
}

schedule()如下：

// One round of scheduler: find a runnable goroutine and execute it.
// Never returns.
func schedule() {
	// 获取当前g，调度时这个g应当是g0
	_g_ := getg()

	if debug.schedtrace > 0 {
		print("schedule(): goid = ", _g_.goid, "\n") // 会是0吗？是的
	}

	if _g_.m.locks != 0 {
		throw("schedule: holding locks")
	}
	// ...
}

编译igo：

1 2	$ cd $GODIR/src $ ./make.bash

编写一个简单的demo（不能更简单）：

package main

func main() {
}

结果如下，你会发现所有的schedule()函数调用都打印goid = 0，足以证明Go调度器的调度由g0完成（如果你认为还是缺乏说服力，可以写复杂一些的demo）：

$ GODEBUG=schedtrace=1000 igo run demo1.go
schedule(): goid = 0
schedule(): goid = 0
SCHED 0ms: gomaxprocs=8 idleprocs=6 threads=4 spinningthreads=1 idlethreads=0 runqueue=0 [0 0 0 0 0 0 0 0]
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
schedule(): goid = 0
// 省略几百行

启发比结论更重要，希望各位朋友在学习Go调度器的时候，能多一些自己的探索和研究，而不仅仅停留在看看别人文章之上。

参考资料

Installing Go from source

如果这篇文章对你有帮助，不妨关注下我的Github，有文章会收到通知。

本文作者：大彬

如果喜欢本文，随意转载，但请保留此原文链接：http://lessisbetter.site/2019/04/14/golang-scheduler-4-explore-source-code/

关注公众号，获取最新Golang文章