Back to home page

OSCL-LXR

 
 

    


0001 .. include:: ../disclaimer-zh_CN.rst
0002 
0003 :Original: Documentation/core-api/memory-hotplug.rst
0004 
0005 :翻译:
0006 
0007  司延腾 Yanteng Si <siyanteng@loongson.cn>
0008 
0009 :校译:
0010 
0011  吴想成 Wu XiangCheng <bobwxc@email.cn>
0012 
0013 .. _cn_core-api_memory-hotplug:
0014 
0015 ==========
0016 内存热插拔
0017 ==========
0018 
0019 内存热拔插事件通知器
0020 ====================
0021 
0022 热插拔事件被发送到一个通知队列中。
0023 
0024 在 ``include/linux/memory.h`` 中定义了六种类型的通知:
0025 
0026 MEM_GOING_ONLINE
0027   在新内存可用之前生成,以便能够为子系统处理内存做准备。页面分配器仍然无法从新
0028   的内存中进行分配。
0029 
0030 MEM_CANCEL_ONLINE
0031   如果MEM_GOING_ONLINE失败,则生成。
0032 
0033 MEM_ONLINE
0034   当内存成功上线时产生。回调可以从新的内存中分配页面。
0035 
0036 MEM_GOING_OFFLINE
0037   在开始对内存进行下线处理时生成。从内存中的分配不再可能,但是一些要下线的内存
0038   仍然在使用。回调可以用来释放一个子系统在指定内存块中已知的内存。
0039 
0040 MEM_CANCEL_OFFLINE
0041   如果MEM_GOING_OFFLINE失败,则生成。来自我们试图离线的内存块中的内存又可以使
0042   用了。
0043 
0044 MEM_OFFLINE
0045   在内存下线完成后生成。
0046 
0047 可以通过调用如下函数来注册一个回调程序:
0048 
0049   hotplug_memory_notifier(callback_func, priority)
0050 
0051 优先级数值较高的回调函数在数值较低的回调函数之前被调用。
0052 
0053 一个回调函数必须有以下原型::
0054 
0055   int callback_func(
0056     struct notifier_block *self, unsigned long action, void *arg);
0057 
0058 回调函数的第一个参数(self)是指向回调函数本身的通知器链块的一个指针。第二个参
0059 数(action)是上述的事件类型之一。第三个参数(arg)传递一个指向
0060 memory_notify结构体的指针::
0061 
0062         struct memory_notify {
0063                 unsigned long start_pfn;
0064                 unsigned long nr_pages;
0065                 int status_change_nid_normal;
0066                 int status_change_nid;
0067         }
0068 
0069 - start_pfn是在线/离线内存的start_pfn。
0070 
0071 - nr_pages是在线/离线内存的页数。
0072 
0073 - status_change_nid_normal是当nodemask的N_NORMAL_MEMORY被设置/清除时设置节
0074   点id,如果是-1,则nodemask状态不改变。
0075 
0076 - status_change_nid是当nodemask的N_MEMORY被(将)设置/清除时设置的节点id。这
0077   意味着一个新的(没上线的)节点通过联机获得新的内存,而一个节点失去了所有的内
0078   存。如果这个值为-1,那么nodemask的状态就不会改变。
0079 
0080   如果 status_changed_nid* >= 0,回调应该在必要时为节点创建/丢弃结构体。
0081 
0082 回调程序应返回 ``include/linux/notifier.h`` 中定义的NOTIFY_DONE, NOTIFY_OK,
0083 NOTIFY_BAD, NOTIFY_STOP中的一个值。
0084 
0085 NOTIFY_DONE和NOTIFY_OK对进一步处理没有影响。
0086 
0087 NOTIFY_BAD是作为对MEM_GOING_ONLINE、MEM_GOING_OFFLINE、MEM_ONLINE或MEM_OFFLINE
0088 动作的回应,用于取消热插拔。它停止对通知队列的进一步处理。
0089 
0090 NOTIFY_STOP停止对通知队列的进一步处理。
0091 
0092 内部锁
0093 ======
0094 
0095 当添加/删除使用内存块设备(即普通RAM)的内存时,device_hotplug_lock应该被保持
0096 为:
0097 
0098 - 针对在线/离线请求进行同步(例如,通过sysfs)。这样一来,内存块设备只有在内存
0099   被完全添加后才能被用户空间访问(.online/.state属性)。而在删除内存时,我们知
0100   道没有人在临界区。
0101 
0102 - 与CPU热拔插或类似操作同步(例如ACPI和PPC相关操作)
0103 
0104 特别是,在添加内存和用户空间试图以比预期更快的速度上线该内存时,有可能出现锁反转,
0105 使用device_hotplug_lock可以避免此情况:
0106 
0107 - device_online()将首先接受device_lock(),然后是mem_hotplug_lock。
0108 
0109 - add_memory_resource()将首先使用mem_hotplug_lock,然后是device_lock()(在创
0110   建设备时,在bus_add_device()期间)。
0111 
0112 由于在使用device_lock()之前,设备对用户空间是可见的,这可能导致锁的反转。
0113 
0114 内存的上线/下线应该通过device_online()/device_offline()完成————确保它与通过
0115 sysfs进行的操作正确同步。建议持有device_hotplug_lock(例如,保护online_type)。
0116 
0117 当添加/删除/上线/下线内存或者添加/删除异构或设备内存时,我们应该始终持有写模式的
0118 mem_hotplug_lock,以序列化内存热插拔(例如访问全局/区域变量)。
0119 
0120 此外,mem_hotplug_lock(与device_hotplug_lock相反)在读取模式下允许一个相当
0121 有效的get_online_mems/put_online_mems实现,所以访问内存的代码可以防止该内存
0122 消失。