zh_CN/locking/mutex-design.rst

0001 .. SPDX-License-Identifier: GPL-2.0
0002 .. include:: ../disclaimer-zh_CN.rst
0003
0004 :Original: Documentation/locking/mutex-design.rst
0005
0006 :翻译:
0007
0008   唐艺舟 Tang Yizhou <tangyeechou@gmail.com>
0009
0010 ================
0011 通用互斥锁子系统
0012 ================
0013
0014 :初稿:
0015
0016   Ingo Molnar <mingo@redhat.com>
0017
0018 :更新:
0019
0020   Davidlohr Bueso <davidlohr@hp.com>
0021
0022 什么是互斥锁？
0023 --------------
0024
0025 在Linux内核中，互斥锁（mutex）指的是一个特殊的加锁原语，它在共享内存系统上
0026 强制保证序列化，而不仅仅是指在学术界或类似的理论教科书中出现的通用术语“相互
0027 排斥”。互斥锁是一种睡眠锁，它的行为类似于二进制信号量（semaphores），在
0028 2006年被引入时[1]，作为后者的替代品。这种新的数据结构提供了许多优点，包括更
0029 简单的接口，以及在当时更少的代码量（见缺陷）。
0030
0031 [1] https://lwn.net/Articles/164802/
0032
0033 实现
0034 ----
0035
0036 互斥锁由“struct mutex”表示，在include/linux/mutex.h中定义，并在
0037 kernel/locking/mutex.c中实现。这些锁使用一个原子变量（->owner）来跟踪
0038 它们生命周期内的锁状态。字段owner实际上包含的是指向当前锁所有者的
0039 `struct task_struct *` 指针，因此如果无人持有锁，则它的值为空（NULL）。
0040 由于task_struct的指针至少按L1_CACHE_BYTES对齐，低位（3）被用来存储额外
0041 的状态（例如，等待者列表非空）。在其最基本的形式中，它还包括一个等待队列和
0042 一个确保对其序列化访问的自旋锁。此外，CONFIG_MUTEX_SPIN_ON_OWNER=y的
0043 系统使用一个自旋MCS锁（->osq，译注：MCS是两个人名的合并缩写），在下文的
0044 （ii）中描述。
0045
0046 准备获得一把自旋锁时，有三种可能经过的路径，取决于锁的状态：
0047
0048 (i) 快速路径：试图通过调用cmpxchg()修改锁的所有者为当前任务，以此原子化地
0049     获取锁。这只在无竞争的情况下有效（cmpxchg()检查值是否为0，所以3个状态
0050     比特必须为0）。如果锁处在竞争状态，代码进入下一个可能的路径。
0051
0052 (ii) 中速路径：也就是乐观自旋，当锁的所有者正在运行并且没有其它优先级更高的
0053      任务（need_resched，需要重新调度）准备运行时，当前任务试图自旋来获得
0054      锁。原理是，如果锁的所有者正在运行，它很可能不久就会释放锁。互斥锁自旋体
0055      使用MCS锁排队，这样只有一个自旋体可以竞争互斥锁。
0056
0057      MCS锁（由Mellor-Crummey和Scott提出）是一个简单的自旋锁，它具有一些
0058      理想的特性，比如公平，以及每个CPU在试图获得锁时在一个本地变量上自旋。
0059      它避免了常见的“检测-设置”自旋锁实现导致的（CPU核间）缓存行回弹
0060      （cacheline bouncing）这种昂贵的开销。一个类MCS锁是为实现睡眠锁的
0061      乐观自旋而专门定制的。这种定制MCS锁的一个重要特性是，它有一个额外的属性，
0062      当自旋体需要重新调度时，它们能够退出MCS自旋锁队列。这进一步有助于避免
0063      以下场景：需要重新调度的MCS自旋体将继续自旋等待自旋体所有者，即将获得
0064      MCS锁时却直接进入慢速路径。
0065
0066 (iii) 慢速路径：最后的手段，如果仍然无法获得锁，该任务会被添加到等待队列中，
0067       休眠直到被解锁路径唤醒。在通常情况下，它以TASK_UNINTERRUPTIBLE状态
0068       阻塞。
0069
0070 虽然从形式上看，内核互斥锁是可睡眠的锁，路径(ii)使它实际上成为混合类型。通过
0071 简单地不中断一个任务并忙着等待几个周期，而不是立即睡眠，这种锁已经被认为显著
0072 改善一些工作负载的性能。注意，这种技术也被用于读写信号量（rw-semaphores）。
0073
0074 语义
0075 ----
0076
0077 互斥锁子系统检查并强制执行以下规则:
0078
0079     - 每次只有一个任务可以持有该互斥锁。
0080     - 只有锁的所有者可以解锁该互斥锁。
0081     - 不允许多次解锁。
0082     - 不允许递归加锁/解锁。
0083     - 互斥锁只能通过API进行初始化（见下文）。
0084     - 一个任务不能在持有互斥锁的情况下退出。
0085     - 持有锁的内存区域不得被释放。
0086     - 被持有的锁不能被重新初始化。
0087     - 互斥锁不能用于硬件或软件中断上下文，如小任务（tasklet）和定时器。
0088
0089 当CONFIG DEBUG_MUTEXES被启用时，这些语义将被完全强制执行。此外，互斥锁
0090 调试代码还实现了一些其它特性，使锁的调试更容易、更快速：
0091
0092     - 当打印到调试输出时，总是使用互斥锁的符号名称。
0093     - 加锁点跟踪，函数名符号化查找，系统持有的全部锁的列表，打印出它们。
0094     - 所有者跟踪。
0095     - 检测自我递归的锁并打印所有相关信息。
0096     - 检测多任务环形依赖死锁，并打印所有受影响的锁和任务（并且只限于这些任务）。
0097
0098
0099 接口
0100 ----
0101 静态定义互斥锁::
0102
0103    DEFINE_MUTEX(name);
0104
0105 动态初始化互斥锁::
0106
0107    mutex_init(mutex);
0108
0109 以不可中断方式（uninterruptible）获取互斥锁::
0110
0111    void mutex_lock(struct mutex *lock);
0112    void mutex_lock_nested(struct mutex *lock, unsigned int subclass);
0113    int  mutex_trylock(struct mutex *lock);
0114
0115 以可中断方式（interruptible）获取互斥锁::
0116
0117    int mutex_lock_interruptible_nested(struct mutex *lock,
0118                                        unsigned int subclass);
0119    int mutex_lock_interruptible(struct mutex *lock);
0120
0121 当原子变量减为0时，以可中断方式（interruptible）获取互斥锁::
0122
0123    int atomic_dec_and_mutex_lock(atomic_t *cnt, struct mutex *lock);
0124
0125 释放互斥锁::
0126
0127    void mutex_unlock(struct mutex *lock);
0128
0129 检测是否已经获取互斥锁::
0130
0131    int mutex_is_locked(struct mutex *lock);
0132
0133 缺陷
0134 ----
0135
0136 与它最初的设计和目的不同，'struct mutex' 是内核中最大的锁之一。例如：在
0137 x86-64上它是32字节，而 'struct semaphore' 是24字节，rw_semaphore是
0138 40字节。更大的结构体大小意味着更多的CPU缓存和内存占用。
0139
0140
0141 何时使用互斥锁
0142 --------------
0143
0144 总是优先选择互斥锁而不是任何其它锁原语，除非互斥锁的严格语义不合适，和/或临界区
0145 阻止锁被共享。