0001 :Original: Documentation/mm/split_page_table_lock.rst
0002
0003 :翻译:
0004
0005 司延腾 Yanteng Si <siyanteng@loongson.cn>
0006
0007 :校译:
0008
0009
0010 =================================
0011 分页表锁(split page table lock)
0012 =================================
0013
0014 最初,mm->page_table_lock spinlock保护了mm_struct的所有页表。但是这种方
0015 法导致了多线程应用程序的缺页异常可扩展性差,因为对锁的争夺很激烈。为了提高可扩
0016 展性,我们引入了分页表锁。
0017
0018 有了分页表锁,我们就有了单独的每张表锁来顺序化对表的访问。目前,我们对PTE和
0019 PMD表使用分页锁。对高层表的访问由mm->page_table_lock保护。
0020
0021 有一些辅助工具来锁定/解锁一个表和其他访问器函数:
0022
0023 - pte_offset_map_lock()
0024 映射pte并获取PTE表锁,返回所取锁的指针;
0025 - pte_unmap_unlock()
0026 解锁和解映射PTE表;
0027 - pte_alloc_map_lock()
0028 如果需要的话,分配PTE表并获取锁,如果分配失败,返回已获取的锁的指针
0029 或NULL;
0030 - pte_lockptr()
0031 返回指向PTE表锁的指针;
0032 - pmd_lock()
0033 取得PMD表锁,返回所取锁的指针。
0034 - pmd_lockptr()
0035 返回指向PMD表锁的指针;
0036
0037 如果CONFIG_SPLIT_PTLOCK_CPUS(通常为4)小于或等于NR_CPUS,则在编译
0038 时启用PTE表的分页表锁。如果分页锁被禁用,所有的表都由mm->page_table_lock
0039 来保护。
0040
0041 如果PMD表启用了分页锁,并且架构支持它,那么PMD表的分页锁就会被启用(见
0042 下文)。
0043
0044 Hugetlb 和分页表锁
0045 ==================
0046
0047 Hugetlb可以支持多种页面大小。我们只对PMD级别使用分页锁,但不对PUD使用。
0048
0049 Hugetlb特定的辅助函数:
0050
0051 - huge_pte_lock()
0052 对PMD_SIZE页面采取pmd分割锁,否则mm->page_table_lock;
0053 - huge_pte_lockptr()
0054 返回指向表锁的指针。
0055
0056 架构对分页表锁的支持
0057 ====================
0058
0059 没有必要特别启用PTE分页表锁:所有需要的东西都由pgtable_pte_page_ctor()
0060 和pgtable_pte_page_dtor()完成,它们必须在PTE表分配/释放时被调用。
0061
0062 确保架构不使用slab分配器来分配页表:slab使用page->slab_cache来分配其页
0063 面。这个区域与page->ptl共享存储。
0064
0065 PMD分页锁只有在你有两个以上的页表级别时才有意义。
0066
0067 启用PMD分页锁需要在PMD表分配时调用pgtable_pmd_page_ctor(),在释放时调
0068 用pgtable_pmd_page_dtor()。
0069
0070 分配通常发生在pmd_alloc_one()中,释放发生在pmd_free()和pmd_free_tlb()
0071 中,但要确保覆盖所有的PMD表分配/释放路径:即X86_PAE在pgd_alloc()中预先
0072 分配一些PMD。
0073
0074 一切就绪后,你可以设置CONFIG_ARCH_ENABLE_SPLIT_PMD_PTLOCK。
0075
0076 注意:pgtable_pte_page_ctor()和pgtable_pmd_page_ctor()可能失败--必
0077 须正确处理。
0078
0079 page->ptl
0080 =========
0081
0082 page->ptl用于访问分割页表锁,其中'page'是包含该表的页面struct page。它
0083 与page->private(以及union中的其他几个字段)共享存储。
0084
0085 为了避免增加struct page的大小并获得最佳性能,我们使用了一个技巧:
0086
0087 - 如果spinlock_t适合于long,我们使用page->ptr作为spinlock,这样我们
0088 就可以避免间接访问并节省一个缓存行。
0089 - 如果spinlock_t的大小大于long的大小,我们使用page->ptl作为spinlock_t
0090 的指针并动态分配它。这允许在启用DEBUG_SPINLOCK或DEBUG_LOCK_ALLOC的
0091 情况下使用分页锁,但由于间接访问而多花了一个缓存行。
0092
0093 PTE表的spinlock_t分配在pgtable_pte_page_ctor()中,PMD表的spinlock_t
0094 分配在pgtable_pmd_page_ctor()中。
0095
0096 请不要直接访问page->ptl - -使用适当的辅助函数。