0001 :Original: Documentation/mm/zsmalloc.rst
0002
0003 :翻译:
0004
0005 司延腾 Yanteng Si <siyanteng@loongson.cn>
0006
0007 :校译:
0008
0009 ========
0010 zsmalloc
0011 ========
0012
0013 这个分配器是为与zram一起使用而设计的。因此,该分配器应该在低内存条件下工作良好。特别是,
0014 它从未尝试过higher order页面的分配,这在内存压力下很可能会失败。另一方面,如果我们只
0015 是使用单(0-order)页,它将遭受非常高的碎片化 - 任何大小为PAGE_SIZE/2或更大的对象将
0016 占据整个页面。这是其前身(xvmalloc)的主要问题之一。
0017
0018 为了克服这些问题,zsmalloc分配了一堆0-order页面,并使用各种"struct page"字段将它
0019 们链接起来。这些链接的页面作为一个单一的higher order页面,即一个对象可以跨越0-order
0020 页面的边界。代码将这些链接的页面作为一个实体,称为zspage。
0021
0022 为了简单起见,zsmalloc只能分配大小不超过PAGE_SIZE的对象,因为这满足了所有当前用户的
0023 要求(在最坏的情况下,页面是不可压缩的,因此以"原样"即未压缩的形式存储)。对于大于这
0024 个大小的分配请求,会返回失败(见zs_malloc)。
0025
0026 此外,zs_malloc()并不返回一个可重复引用的指针。相反,它返回一个不透明的句柄(无符号
0027 长),它编码了被分配对象的实际位置。这种间接性的原因是zsmalloc并不保持zspages的永久
0028 映射,因为这在32位系统上会导致问题,因为内核空间映射的VA区域非常小。因此,在使用分配
0029 的内存之前,对象必须使用zs_map_object()进行映射以获得一个可用的指针,随后使用
0030 zs_unmap_object()解除映射。
0031
0032 stat
0033 ====
0034
0035 通过CONFIG_ZSMALLOC_STAT,我们可以通过 ``/sys/kernel/debug/zsmalloc/<user name>``
0036 看到zsmalloc内部信息。下面是一个统计输出的例子。::
0037
0038 # cat /sys/kernel/debug/zsmalloc/zram0/classes
0039
0040 class size almost_full almost_empty obj_allocated obj_used pages_used pages_per_zspage
0041 ...
0042 ...
0043 9 176 0 1 186 129 8 4
0044 10 192 1 0 2880 2872 135 3
0045 11 208 0 1 819 795 42 2
0046 12 224 0 1 219 159 12 4
0047 ...
0048 ...
0049
0050
0051 class
0052 索引
0053 size
0054 zspage存储对象大小
0055 almost_empty
0056 ZS_ALMOST_EMPTY zspage的数量(见下文)。
0057 almost_full
0058 ZS_ALMOST_FULL zspage的数量(见下图)
0059 obj_allocated
0060 已分配对象的数量
0061 obj_used
0062 分配给用户的对象的数量
0063 pages_used
0064 为该类分配的页数
0065 pages_per_zspage
0066 组成一个zspage的0-order页面的数量
0067
0068 当n <= N / f时,我们将一个zspage分配给ZS_ALMOST_EMPTYfullness组,其中
0069
0070 * n = 已分配对象的数量
0071 * N = zspage可以存储的对象总数
0072 * f = fullness_threshold_frac(即,目前是4个)
0073
0074 同样地,我们将zspage分配给:
0075
0076 * ZS_ALMOST_FULL when n > N / f
0077 * ZS_EMPTY when n == 0
0078 * ZS_FULL when n == N