Back to home page

OSCL-LXR

 
 

    


0001 .. SPDX-License-Identifier: GPL-2.0
0002 
0003 .. include:: ../disclaimer-zh_CN.rst
0004 
0005 :Original: Documentation/filesystems/tmpfs.rst
0006 
0007 translated by Wang Qing<wangqing@vivo.com>
0008 
0009 =====
0010 Tmpfs
0011 =====
0012 
0013 Tmpfs是一个将所有文件都保存在虚拟内存中的文件系统。
0014 
0015 tmpfs中的所有内容都是临时的,也就是说没有任何文件会在硬盘上创建。
0016 如果卸载tmpfs实例,所有保存在其中的文件都会丢失。
0017 
0018 tmpfs将所有文件保存在内核缓存中,随着文件内容增长或缩小可以将不需要的
0019 页面swap出去。它具有最大限制,可以通过“mount -o remount ...”调整。
0020 
0021 和ramfs(创建tmpfs的模板)相比,tmpfs包含交换和限制检查。和tmpfs相似的另
0022 一个东西是RAM磁盘(/dev/ram*),可以在物理RAM中模拟固定大小的硬盘,并在
0023 此之上创建一个普通的文件系统。Ramdisks无法swap,因此无法调整它们的大小。
0024 
0025 由于tmpfs完全保存于页面缓存和swap中,因此所有tmpfs页面将在/proc/meminfo
0026 中显示为“Shmem”,而在free(1)中显示为“Shared”。请注意,这些计数还包括
0027 共享内存(shmem,请参阅ipcs(1))。获得计数的最可靠方法是使用df(1)和du(1)。
0028 
0029 tmpfs具有以下用途:
0030 
0031 1) 内核总有一个无法看到的内部挂载,用于共享匿名映射和SYSV共享内存。
0032 
0033    挂载不依赖于CONFIG_TMPFS。如果CONFIG_TMPFS未设置,tmpfs对用户不可见。
0034    但是内部机制始终存在。
0035 
0036 2) glibc 2.2及更高版本期望将tmpfs挂载在/dev/shm上以用于POSIX共享内存
0037    (shm_open,shm_unlink)。添加内容到/etc/fstab应注意如下:
0038 
0039         tmpfs   /dev/shm        tmpfs   defaults        0 0
0040 
0041    使用时需要记住创建挂载tmpfs的目录。
0042 
0043    SYSV共享内存无需挂载,内部已默认支持。(在2.3内核版本中,必须挂载
0044    tmpfs的前身(shm fs)才能使用SYSV共享内存)
0045 
0046 3) 很多人(包括我)都觉的在/tmp和/var/tmp上挂载非常方便,并具有较大的
0047    swap分区。目前循环挂载tmpfs可以正常工作,所以大多数发布都应当可以
0048    使用mkinitrd通过/tmp访问/tmp。
0049 
0050 4) 也许还有更多我不知道的地方:-)
0051 
0052 
0053 tmpfs有三个用于调整大小的挂载选项:
0054 
0055 =========  ===========================================================
0056 size       tmpfs实例分配的字节数限制。默认值是不swap时物理RAM的一半。
0057            如果tmpfs实例过大,机器将死锁,因为OOM处理将无法释放该内存。
0058 nr_blocks  与size相同,但以PAGE_SIZE为单位。
0059 nr_inodes  tmpfs实例的最大inode个数。默认值是物理内存页数的一半,或者
0060            (有高端内存的机器)低端内存RAM的页数,二者以较低者为准。
0061 =========  ===========================================================
0062 
0063 这些参数接受后缀k,m或g表示千,兆和千兆字节,可以在remount时更改。
0064 size参数也接受后缀%用来限制tmpfs实例占用物理RAM的百分比:
0065 未指定size或nr_blocks时,默认值为size=50%
0066 
0067 如果nr_blocks=0(或size=0),block个数将不受限制;如果nr_inodes=0,
0068 inode个数将不受限制。这样挂载通常是不明智的,因为它允许任何具有写权限的
0069 用户通过访问tmpfs耗尽机器上的所有内存;但同时这样做也会增强在多个CPU的
0070 场景下的访问。
0071 
0072 tmpfs具有为所有文件设置NUMA内存分配策略挂载选项(如果启用了CONFIG_NUMA),
0073 可以通过“mount -o remount ...”调整
0074 
0075 ======================== =========================
0076 mpol=default             采用进程分配策略
0077                          (请参阅 set_mempolicy(2))
0078 mpol=prefer:Node         倾向从给定的节点分配
0079 mpol=bind:NodeList       只允许从指定的链表分配
0080 mpol=interleave          倾向于依次从每个节点分配
0081 mpol=interleave:NodeList 依次从每个节点分配
0082 mpol=local               优先本地节点分配内存
0083 ======================== =========================
0084 
0085 NodeList格式是以逗号分隔的十进制数字表示大小和范围,最大和最小范围是用-
0086 分隔符的十进制数来表示。例如,mpol=bind0-3,5,7,9-15
0087 
0088 带有有效NodeList的内存策略将按指定格式保存,在创建文件时使用。当任务在该
0089 文件系统上创建文件时,会使用到挂载时的内存策略NodeList选项,如果设置的话,
0090 由调用任务的cpuset[请参见Documentation/admin-guide/cgroup-v1/cpusets.rst]
0091 以及下面列出的可选标志约束。如果NodeLists为设置为空集,则文件的内存策略将
0092 恢复为“默认”策略。
0093 
0094 NUMA内存分配策略有可选标志,可以用于模式结合。在挂载tmpfs时指定这些可选
0095 标志可以在NodeList之前生效。
0096 Documentation/admin-guide/mm/numa_memory_policy.rst列出所有可用的内存
0097 分配策略模式标志及其对内存策略。
0098 
0099 ::
0100 
0101         =static         相当于       MPOL_F_STATIC_NODES
0102         =relative       相当于       MPOL_F_RELATIVE_NODES
0103 
0104 例如,mpol=bind=staticNodeList相当于MPOL_BIND|MPOL_F_STATIC_NODES的分配策略
0105 
0106 请注意,如果内核不支持NUMA,那么使用mpol选项挂载tmpfs将会失败;nodelist指定不
0107 在线的节点也会失败。如果您的系统依赖于此,但内核会运行不带NUMA功能(也许是安全
0108 revocery内核),或者具有较少的节点在线,建议从自动模式中省略mpol选项挂载选项。
0109 可以在以后通过“mount -o remount,mpol=Policy:NodeList MountPoint”添加到挂载点。
0110 
0111 要指定初始根目录,可以使用如下挂载选项:
0112 
0113 ====    ====================
0114 模式  权限用八进制数字表示
0115 uid     用户ID
0116 gid     组ID
0117 ====    ====================
0118 
0119 这些选项对remount没有任何影响。您可以通过chmod(1),chown(1)和chgrp(1)的更改
0120 已经挂载的参数。
0121 
0122 tmpfs具有选择32位还是64位inode的挂载选项:
0123 
0124 =======   =============
0125 inode64   使用64位inode
0126 inode32   使用32位inode
0127 =======   =============
0128 
0129 在32位内核上,默认是inode32,挂载时指定inode64会被拒绝。
0130 在64位内核上,默认配置是CONFIG_TMPFS_INODE64。inode64避免了单个设备上可能有多个
0131 具有相同inode编号的文件;比如32位应用程序使用glibc如果长期访问tmpfs,一旦达到33
0132 位inode编号,就有EOVERFLOW失败的危险,无法打开大于2GiB的文件,并返回EINVAL。
0133 
0134 所以'mount -t tmpfs -o size=10G,nr_inodes=10k,mode=700 tmpfs /mytmpfs'将在
0135 /mytmpfs上挂载tmpfs实例,分配只能由root用户访问的10GB RAM/SWAP,可以有10240个
0136 inode的实例。
0137 
0138 
0139 :作者:
0140    Christoph Rohland <cr@sap.com>, 1.12.01
0141 :更新:
0142    Hugh Dickins, 4 June 2007
0143 :更新:
0144    KOSAKI Motohiro, 16 Mar 2010
0145 :更新:
0146    Chris Down, 13 July 2020