Back to home page

OSCL-LXR

 
 

    


0001 .. SPDX-License-Identifier: GPL-2.0
0002 .. include:: ../disclaimer-zh_CN.rst
0003 
0004 :Original: Documentation/power/energy-model.rst
0005 
0006 :翻译:
0007 
0008   唐艺舟 Tang Yizhou <tangyeechou@gmail.com>
0009 
0010 ============
0011 设备能量模型
0012 ============
0013 
0014 1. 概述
0015 -------
0016 
0017 能量模型(EM)框架是一种驱动程序与内核子系统之间的接口。其中驱动程序了解不同
0018 性能层级的设备所消耗的功率,而内核子系统愿意使用该信息做出能量感知决策。
0019 
0020 设备所消耗的功率的信息来源在不同的平台上可能有很大的不同。这些功率成本在某些
0021 情况下可以使用设备树数据来估算。在其它情况下,固件会更清楚。或者,用户空间可能
0022 是最清楚的。以此类推。为了避免每一个客户端子系统对每一种可能的信息源自己重新
0023 实现支持,EM框架作为一个抽象层介入,它在内核中对功率成本表的格式进行标准化,
0024 因此能够避免多余的工作。
0025 
0026 功率值可以用毫瓦或“抽象刻度”表示。多个子系统可能使用EM,由系统集成商来检查
0027 功率值刻度类型的要求是否满足。可以在能量感知调度器的文档中找到一个例子
0028 Documentation/scheduler/sched-energy.rst。对于一些子系统,比如热能或
0029 powercap,用“抽象刻度”描述功率值可能会导致问题。这些子系统对过去使用的功率的
0030 估算值更感兴趣,因此可能需要真实的毫瓦。这些要求的一个例子可以在智能功率分配
0031 Documentation/driver-api/thermal/power_allocator.rst文档中找到。
0032 
0033 内核子系统可能(基于EM内部标志位)实现了对EM注册设备是否具有不一致刻度的自动
0034 检查。要记住的重要事情是,当功率值以“抽象刻度”表示时,从中推导以毫焦耳为单位
0035 的真实能量消耗是不可能的。
0036 
0037 下图描述了一个驱动的例子(这里是针对Arm的,但该方法适用于任何体系结构),它
0038 向EM框架提供了功率成本,感兴趣的客户端可从中读取数据::
0039 
0040        +---------------+  +-----------------+  +---------------+
0041        | Thermal (IPA) |  | Scheduler (EAS) |  |     Other     |
0042        +---------------+  +-----------------+  +---------------+
0043                |                   | em_cpu_energy()   |
0044                |                   | em_cpu_get()      |
0045                +---------+         |         +---------+
0046                          |         |         |
0047                          v         v         v
0048                         +---------------------+
0049                         |    Energy Model     |
0050                         |     Framework       |
0051                         +---------------------+
0052                            ^       ^       ^
0053                            |       |       | em_dev_register_perf_domain()
0054                 +----------+       |       +---------+
0055                 |                  |                 |
0056         +---------------+  +---------------+  +--------------+
0057         |  cpufreq-dt   |  |   arm_scmi    |  |    Other     |
0058         +---------------+  +---------------+  +--------------+
0059                 ^                  ^                 ^
0060                 |                  |                 |
0061         +--------------+   +---------------+  +--------------+
0062         | Device Tree  |   |   Firmware    |  |      ?       |
0063         +--------------+   +---------------+  +--------------+
0064 
0065 对于CPU设备,EM框架管理着系统中每个“性能域”的功率成本表。一个性能域是一组
0066 性能一起伸缩的CPU。性能域通常与CPUFreq策略具有1对1映射。一个性能域中的
0067 所有CPU要求具有相同的微架构。不同性能域中的CPU可以有不同的微架构。
0068 
0069 
0070 2. 核心API
0071 ----------
0072 
0073 2.1 配置选项
0074 ^^^^^^^^^^^^
0075 
0076 必须使能CONFIG_ENERGY_MODEL才能使用EM框架。
0077 
0078 
0079 2.2 性能域的注册
0080 ^^^^^^^^^^^^^^^^
0081 
0082 “高级”EM的注册
0083 ~~~~~~~~~~~~~~~~
0084 
0085 “高级”EM因它允许驱动提供更精确的功率模型而得名。它并不受限于框架中的一些已
0086 实现的数学公式(就像“简单”EM那样)。它可以更好地反映每个性能状态的实际功率
0087 测量。因此,在EM静态功率(漏电流功率)是重要的情况下,应该首选这种注册方式。
0088 
0089 驱动程序应通过以下API将性能域注册到EM框架中::
0090 
0091   int em_dev_register_perf_domain(struct device *dev, unsigned int nr_states,
0092                 struct em_data_callback *cb, cpumask_t *cpus, bool milliwatts);
0093 
0094 驱动程序必须提供一个回调函数,为每个性能状态返回<频率,功率>元组。驱动程序
0095 提供的回调函数可以自由地从任何相关位置(DT、固件......)以及以任何被认为是
0096 必要的方式获取数据。只有对于CPU设备,驱动程序必须使用cpumask指定性能域的CPU。
0097 对于CPU以外的其他设备,最后一个参数必须被设置为NULL。
0098 
0099 最后一个参数“milliwatts”(毫瓦)设置成正确的值是很重要的,使用EM的内核
0100 子系统可能会依赖这个标志来检查所有的EM设备是否使用相同的刻度。如果有不同的
0101 刻度,这些子系统可能决定:返回警告/错误,停止工作或崩溃(panic)。
0102 
0103 关于实现这个回调函数的驱动程序的例子,参见第3节。或者在第2.4节阅读这个API
0104 的更多文档。
0105 
0106 
0107 “简单”EM的注册
0108 ~~~~~~~~~~~~~~~~
0109 
0110 “简单”EM是用框架的辅助函数cpufreq_register_em_with_opp()注册的。它实现了
0111 一个和以下数学公式紧密相关的功率模型::
0112 
0113         Power = C * V^2 * f
0114 
0115 使用这种方法注册的EM可能无法正确反映真实设备的物理特性,例如当静态功率
0116 (漏电流功率)很重要时。
0117 
0118 
0119 2.3 访问性能域
0120 ^^^^^^^^^^^^^^
0121 
0122 有两个API函数提供对能量模型的访问。em_cpu_get()以CPU id为参数,em_pd_get()
0123 以设备指针为参数。使用哪个接口取决于子系统,但对于CPU设备来说,这两个函数都返
0124 回相同的性能域。
0125 
0126 对CPU的能量模型感兴趣的子系统可以通过em_cpu_get() API检索它。在创建性能域时
0127 分配一次能量模型表,它保存在内存中不被修改。
0128 
0129 一个性能域所消耗的能量可以使用em_cpu_energy() API来估算。该估算假定CPU设备
0130 使用的CPUfreq监管器是schedutil。当前该计算不能提供给其它类型的设备。
0131 
0132 关于上述API的更多细节可以在 ``<linux/energy_model.h>`` 或第2.4节中找到。
0133 
0134 
0135 2.4 API的细节描述
0136 ^^^^^^^^^^^^^^^^^
0137 参见 include/linux/energy_model.h 和 kernel/power/energy_model.c 的kernel doc。
0138 
0139 3. 驱动示例
0140 -----------
0141 
0142 CPUFreq框架支持专用的回调函数,用于为指定的CPU(们)注册EM:
0143 cpufreq_driver::register_em()。这个回调必须为每个特定的驱动程序正确实现,
0144 因为框架会在设置过程中适时地调用它。本节提供了一个简单的例子,展示CPUFreq驱动
0145 在能量模型框架中使用(假的)“foo”协议注册性能域。该驱动实现了一个est_power()
0146 函数提供给EM框架::
0147 
0148   -> drivers/cpufreq/foo_cpufreq.c
0149 
0150   01    static int est_power(unsigned long *mW, unsigned long *KHz,
0151   02                    struct device *dev)
0152   03    {
0153   04            long freq, power;
0154   05
0155   06            /* 使用“foo”协议设置频率上限 */
0156   07            freq = foo_get_freq_ceil(dev, *KHz);
0157   08            if (freq < 0);
0158   09                    return freq;
0159   10
0160   11            /* 估算相关频率下设备的功率成本 */
0161   12            power = foo_estimate_power(dev, freq);
0162   13            if (power < 0);
0163   14                    return power;
0164   15
0165   16            /* 将这些值返回给EM框架 */
0166   17            *mW = power;
0167   18            *KHz = freq;
0168   19
0169   20            return 0;
0170   21    }
0171   22
0172   23    static void foo_cpufreq_register_em(struct cpufreq_policy *policy)
0173   24    {
0174   25            struct em_data_callback em_cb = EM_DATA_CB(est_power);
0175   26            struct device *cpu_dev;
0176   27            int nr_opp;
0177   28
0178   29            cpu_dev = get_cpu_device(cpumask_first(policy->cpus));
0179   30
0180   31            /* 查找该策略支持的OPP数量 */
0181   32            nr_opp = foo_get_nr_opp(policy);
0182   33
0183   34            /* 并注册新的性能域 */
0184   35            em_dev_register_perf_domain(cpu_dev, nr_opp, &em_cb, policy->cpus,
0185   36                                        true);
0186   37    }
0187   38
0188   39    static struct cpufreq_driver foo_cpufreq_driver = {
0189   40            .register_em = foo_cpufreq_register_em,
0190   41    };