luxuabc 发表于 2007-11-13 20:53:23

Linux性能监控之CPU篇(1)

<P>在这篇文章中,主要介绍CPU的一些基础知识.<BR>首先介绍一下Linux kernel中的调度器(scheduler),调度器负责调度系统中的两种资源,一是线程,二是中断</P>
<P>。调度器给不同资源不同的优先级。从高到低为:<BR>1. 硬件中断(Hardware Interrupts)--这些请求由硬件触发,比如磁盘已经完成了读写任务或是网卡受到了</P>
<P>新的数据包。<BR>2. 软件中断(Software Interrupts)--这里指的是维护内核运行的内核态软件中断。比如内核的时钟管理进</P>
<P>程。<BR>3. 实时进程(Real time threads)--实时进程比内核本身具备更高的优先级,它可以抢占内核的CPU时间片,</P>
<P>在2.4内核是一个不可抢占的内核,它中不支持实时程序。<BR>4. 内核进程(Kernel threads)--包括所以的内核程序。<BR>5. 用户进程(User threads)-- 所有运行在用户态的进程。<BR>&nbsp;<BR>关于CPU,有3个重要的概念:上下文切换(context switchs),运行队列(Run queue)和使用率</P>
<P>(utilization)。<BR>上下文切换:<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 目前流行的CPU在同一时间内只能运行一个线程,超线程的处理器可以在同一时间运行多个线程(包括多</P>
<P>核CPU),Linux内核会把多核的处理器当作多个单独的CPU来识别。<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 一个标准的Linux内核何以支持运行50~50000个进程运行,对于普通的CPU,内核会调度和执行这些进</P>
<P>程。每个进程都会分到CPU的时间片来运行,当一个进程用完时间片或者被更高优先级的进程抢占后,它会备份</P>
<P>到CPU的运行队列中,同时其他进程在CPU上运行。这个进程切换的过程被称作上下文切换。过多的上下文切换</P>
<P>会造成系统很大的开销。<BR>&nbsp;<BR>运行队列:<BR>&nbsp;每个CPU都会维持一个运行队列,理想情况下,调度器会不断让队列中的进程运行。进程不是处在</P>
<P>sleep状态就是run able状态。 如果CPU过载,就会出现调度器跟不上系统的要求,导致可运行的进程会填满队</P>
<P>列。队列愈大,程序执行时间就愈长。“load”用来表示运行队列,用top命令我们可以看到CPU一分钟,5分钟</P>
<P>和15分钟内的运行队列的大小。这个值越大表明系统负荷越大。</P>
<P>CPU使用率:<BR>&nbsp;CPU使用率可分为一下几个部分<BR>&nbsp;User Time—执行用户进程的时间百分比;<BR>&nbsp;System Time—执行内核进程和中断的时间百分比;<BR>&nbsp;Wait IO—因为IO等待而使CPU处于idle状态的时间百分比;<BR>&nbsp;Idle—CPU处于Idle状态的时间百分比。</P>
<P>关于时间片和动态优先级:<BR>时间片对于CPU来说是很关键的参数,如果时间片太长,就会使系统的交互性能变差,用户感觉不到并行。如果</P>
<P>太短,又会造成系统频繁的上下文切换,使性能下降。对于IO Bound的系统来讲并不需要太长的时间片,因为</P>
<P>系统主要是IO操作;而对于CPU Bound的系统来说需要长的时间片以保持cache的有效性。<BR>每一个进程启动的时候系统都会给出一个默认的优先级,但在运行过程中,系统会根据进程的运行状况不断调整</P>
<P>优先级,内核会升高或降低进程的优先级(每次增加或降低5),判断标准是根据进程处于sleep状态的时间。</P>
<P>IO Bound进程大部分时间在sleep状态,所以内核会调高它的优先级,CPU Bound进程会被内核惩罚降低优先级</P>
<P>。因此,如果一个系统上即运行IO Bound进程,又运行CPU Bound进程,我们会发现,IO Bound进程的性能不</P>
<P>会下降,而CPU Bound进程性能会不断下降。<BR>我们运行一个CPU Bound的程序:cpu-hog。用ps命令可以看出它的优先级在不断下降。<BR>term1# ./cpu-hog<BR>term2# while :; do ps -eo pid,ni,pri,pcpu,comm | egrep<BR>'hog|PRI'; sleep 1; done<BR>PID NI PRI %CPU COMMAND<BR>22855 0 20 84.5 cpu-hog<BR>PID NI PRI %CPU COMMAND<BR>22855 0 18 89.6 cpu-hog<BR>PID NI PRI %CPU COMMAND<BR>22855 0 15 92.2 cpu-hog<BR>PID NI PRI %CPU COMMAND<BR>22855 0 15 93.8 cpu-hog<BR>&nbsp;我们运行find命令,是一个IO Bound的程序,可以观察到它的优先级不断提高。<BR>term1# find /<BR>term2# while :; do ps -eo pid,ni,pri,pcpu,comm | egrep<BR>'find|PRI'; sleep 1; done<BR>PID NI PRI %CPU COMMAND<BR>23101 0 20 0.0 find<BR>PID NI PRI %CPU COMMAND<BR>23101 0 21 4.0 find<BR>PID NI PRI %CPU COMMAND<BR>23101 0 23 3.5 find<BR>PID NI PRI %CPU COMMAND<BR>23101 0 23 4.3 find<BR>PID NI PRI %CPU COMMAND<BR>23101 0 23 4.2 find<BR>PID NI PRI %CPU COMMAND<BR>23101 0 23 4.4 find<BR>&nbsp;如果同时运行2个程序就可看出明显的变化<BR># while :; do ps -eo pid,ni,pri,pcpu,comm | egrep 'find|hog';<BR>sleep 1; done<BR>23675 0 20 70.9 cpu-hog<BR>23676 0 20 5.6 find<BR>23675 0 20 69.9 cpu-hog<BR>23676 0 21 5.6 find<BR>23675 0 20 70.6 cpu-hog<BR>23676 0 23 5.8 find<BR>23675 0 19 71.2 cpu-hog<BR>23676 0 23 6.0 find<BR>23675 0 19 71.8 cpu-hog<BR>23676 0 23 6.1 find<BR>23675 0 18 72.8 cpu-hog<BR>23676 0 23 6.2 find<BR>23675 0 16 73.2 cpu-hog<BR>23676 0 23 6.6 find<BR>23675 0 14 73.9 cpu-hog</P>
<P><BR>&nbsp;</P>
页: [1]
查看完整版本: Linux性能监控之CPU篇(1)