在Xenserver Dom0通过iostat监测SR IO状态

Citrix XenServer的Dom0是一个32位的CentOS,它为所有的DomU IO提供转发通道。当虚拟机系统出现了性能问题,一般我们可以在Dom0通过top、iostat、free、vmstat等命令来查看Dom0状态,初步定位是否在Dom0出现IO瓶颈。上述这些命令中iostat可以给我们提供丰富的IO状态数据。

基本使用

$iostat -d -k 1 10
参数 -d 表示,显示设备(磁盘)使用状态;-k某些使用block为单位的列强制使用Kilobytes为单位;1 10表示,数据显示每隔1秒刷新一次,共显示10次。

Xenserver Dom0通过iostat监测SR IO状态

tps:该设备每秒的传输次数(Indicate the number of transfers per second that were issued to the device.)。“一次传输”意思是“一次I/O请求”。多个逻辑请求可能会被合并为“一次I/O请求”。“一次传输”请求的大小是未知的。

kB_read/s:每秒从设备(drive expressed)读取的数据量;kB_wrtn/s:每秒向设备(drive expressed)写入的数据量;kB_read:读取的总数据量;kB_wrtn:写入 的总数量数据量;这些单位都为Kilobytes。

上面的例子中,我们可以看到磁盘sda以及它的各个分区的统计数据,当时统计的磁盘总TPS是39.29,下面是各个分区的TPS。(因为是瞬间 值,所以总TPS并不严格等于各个分区TPS的总和)

-x 参数

使用-x参数我们可以获得更多统计信息。

-x 参数

rrqm/s:每秒这个设备相关的读取请求有多少被Merge了(当系统调用需要读取数据的 时候,VFS将请求发到各个FS,如果FS发现不同的读取请求读取的是相同Block的数据,FS会将这个请求合并Merge);wrqm/s:每秒这个 设备相关的写入请求有多少被Merge了。

rsec/s:每秒读取的扇区数;wsec/: 每秒写入的扇区数。r/s:The number of read requests that were issued to the device per second;w/s:The number of write requests that were issued to the device per second;

await:每一个IO请求的处理的平均时间(单位是微秒)。这里可以理解为IO的响应时 间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。

%util:在统计时间内所有处理IO时间,除以总共统计时间。例如,如果统计间隔1秒,该 设备有0.8秒在处理IO,而0.2秒闲置,那么该设备的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因 为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。

-c 参数

iostat还可以用来获取cpu部分状态值:

iostat还可以用来获取cpu部分状态值

常见用法

$iostat -d -k 1 10       #查看TPS和吞吐量信息
iostat -d -x -k 1 10    #查看设备使用率(%util)、响应时间(await)
iostat -c 1 10               #查看cpu状态

实例分析

Xenserver Dom0通过iostat监测SR IO状态 实例分析

上面看到,磁盘每秒传输次数平均约400;每秒磁盘读取约5MB,写入约1MB。

Xenserver Dom0通过iostat监测SR IO状态 实例分析

可以看到磁盘的平均响应时间<5ms,磁盘使用率>80。磁盘响应正常,但是已经很繁忙了。

综上所述,我们通过await, %util, %iowait这三个参数,对于我们判断XenServer的各个SR的IO情况,是非常有帮助的。(文:小猪欢迎我)