0001 ========
0002 CPU 负载
0003 ========
0004
0005 Linux通过``/proc/stat``和``/proc/uptime``导出各种信息,用户空间工具
0006 如top(1)使用这些信息计算系统花费在某个特定状态的平均时间。
0007 例如:
0008
0009 $ iostat
0010 Linux 2.6.18.3-exp (linmac) 02/20/2007
0011
0012 avg-cpu: %user %nice %system %iowait %steal %idle
0013 10.01 0.00 2.92 5.44 0.00 81.63
0014
0015 ...
0016
0017 这里系统认为在默认采样周期內有10.01%的时间工作在用户空间,2.92%的时
0018 间用在系统空间,总体上有81.63%的时间是空闲的。
0019
0020 大多数情况下``/proc/stat``的信息几乎真实反映了系统信息,然而,由于内
0021 核采集这些数据的方式/时间的特点,有时这些信息根本不可靠。
0022
0023 那么这些信息是如何被搜集的呢?每当时间中断触发时,内核查看此刻运行的
0024 进程类型,并增加与此类型/状态进程对应的计数器的值。这种方法的问题是
0025 在两次时间中断之间系统(进程)能够在多种状态之间切换多次,而计数器只
0026 增加最后一种状态下的计数。
0027
0028 举例
0029 ---
0030
0031 假设系统有一个进程以如下方式周期性地占用cpu::
0032
0033 两个时钟中断之间的时间线
0034 |-----------------------|
0035 ^ ^
0036 |_ 开始运行 |
0037 |_ 开始睡眠
0038 (很快会被唤醒)
0039
0040 在上面的情况下,根据``/proc/stat``的信息(由于当系统处于空闲状态时,
0041 时间中断经常会发生)系统的负载将会是0
0042
0043 大家能够想象内核的这种行为会发生在许多情况下,这将导致``/proc/stat``
0044 中存在相当古怪的信息::
0045
0046 /* gcc -o hog smallhog.c */
0047 #include <time.h>
0048 #include <limits.h>
0049 #include <signal.h>
0050 #include <sys/time.h>
0051 #define HIST 10
0052
0053 static volatile sig_atomic_t stop;
0054
0055 static void sighandler (int signr)
0056 {
0057 (void) signr;
0058 stop = 1;
0059 }
0060 static unsigned long hog (unsigned long niters)
0061 {
0062 stop = 0;
0063 while (!stop && --niters);
0064 return niters;
0065 }
0066 int main (void)
0067 {
0068 int i;
0069 struct itimerval it = { .it_interval = { .tv_sec = 0, .tv_usec = 1 },
0070 .it_value = { .tv_sec = 0, .tv_usec = 1 } };
0071 sigset_t set;
0072 unsigned long v[HIST];
0073 double tmp = 0.0;
0074 unsigned long n;
0075 signal (SIGALRM, &sighandler);
0076 setitimer (ITIMER_REAL, &it, NULL);
0077
0078 hog (ULONG_MAX);
0079 for (i = 0; i < HIST; ++i) v[i] = ULONG_MAX - hog (ULONG_MAX);
0080 for (i = 0; i < HIST; ++i) tmp += v[i];
0081 tmp /= HIST;
0082 n = tmp - (tmp / 3.0);
0083
0084 sigemptyset (&set);
0085 sigaddset (&set, SIGALRM);
0086
0087 for (;;) {
0088 hog (n);
0089 sigwait (&set, &i);
0090 }
0091 return 0;
0092 }
0093
0094
0095 参考
0096 ---
0097
0098 - https://lore.kernel.org/r/loom.20070212T063225-663@post.gmane.org
0099 - Documentation/filesystems/proc.rst (1.8)
0100
0101
0102 谢谢
0103 ---
0104
0105 Con Kolivas, Pavel Machek