來源:51cto.技術(shù)博客 Dell服務(wù)器RAID卡介紹及監(jiān)控
一、Dell服務(wù)器 RAID卡介紹
以下在系統(tǒng)下使用相關(guān)命令得到的數(shù)據(jù),dell支持的各種RAID卡的詳細(xì)參數(shù)參見本文第五部分。
1、內(nèi)部RAID控制器
使用megacli命令查看得到的RAID卡數(shù)據(jù):
SAS 6/iR :只支持2塊硬盤做 raid0,或者raid1,或者不做陣列卡 (Dell硬件聊天室獲得)
PERC 6/i Integrated
Memory Size: 256MB
RAID Level Supported: RAID0, RAID1, RAID5, RAID6, RAID10, RAID50, RAID60, PRL 11, PRL 11 with spanning, SRL 3 supported
Supported Drives: SAS, SATA
Min Stripe Size: 8 KB
Max Stripe Size: 1.0 MB
接口速度Link Speed: 3.0Gb/s
PERC H700 Integrated
Memory Size: 512MB
RAID Level Supported: RAID0, RAID1, RAID5, RAID6, RAID10, RAID50, RAID60, PRL 11, PRL 11 with spanning
Supported Drives: SAS, SATA
Min Stripe Size: 8 KB
Max Stripe Size: 1.0 MB
接口速度Link Speed: 6.0Gb/s
官方資料:
PERC H200(6 Gb/秒)
PERC H700(6Gb /秒),配備512 MB非易失性高速緩存
PERC H700(6 Gb/秒),配備512 MB電池后備高速緩存;512 MB、1 G非易失性電池后備高速緩存
PERC 6/i,配備256 MB電池后備高速緩存
2、外部RAID控制器
官方資料:
PERC H800(6Gb/秒),配備512 MB非易失性高速緩存
PERC H800(6Gb/秒),配備512 MB電池后備高速緩存;512 MB、1 G非易失性電池后備高速緩存
PERC 6/E,配備256 MB或512 MB電池后備高速緩存
二、陣列卡的Stripe size介紹
Stripe size 默認(rèn)64KB。
1、Stripe size百科介紹
在每個(gè)磁盤上連續(xù)寫入數(shù)據(jù)的總量,也稱作“條帶深度”。你可以指定每個(gè)邏輯驅(qū)動(dòng)器的條帶容量從2KB,4KB,8KB一直到128KB。為了獲得更高的性能,要選擇條帶的容量等于或小于操作系統(tǒng)的簇的大小。大容量的條帶會(huì)產(chǎn)生更高的讀取性能,尤其在讀取連續(xù)數(shù)據(jù)的時(shí)候。而讀取隨機(jī)數(shù)據(jù)的時(shí)候,******設(shè)定條帶的容量小一點(diǎn)。如果指定128KB的條帶將需要8MB內(nèi)存。
不同Stripe size的選擇直接影響性能,如IOPS和吞吐量。
Stripe size值小,通過多塊磁盤響應(yīng)多個(gè)I/O請(qǐng)求,可以增加I/O訪問速率(IOPS)
Stripe size值大,通過多塊磁盤響應(yīng)一個(gè)I/O請(qǐng)求,可以增加數(shù)據(jù)傳輸速率(Mbps)
我們知道順序和隨機(jī)對(duì)于帶寬和iops的需求成反比,即順序的讀寫比較消耗帶寬,隨機(jī)的讀寫比較消耗iops;
2、Stripe size一般設(shè)置
通常,小Stripe size適用于數(shù)據(jù)庫,一般Stripe size適用于文件服務(wù)器,大Stripe size適用于多煤體應(yīng)用。實(shí)際應(yīng)用stripe size大小應(yīng)在效率測(cè)試后具體設(shè)置。
數(shù)據(jù)庫一般4-16KB
web服務(wù)器默認(rèn)即可,16-64KB
流媒體等大文件建議128KB以上
三、megacli介紹、安裝、使用、crontab監(jiān)控腳本
查看RAID信息的工具有mpt-status、megarc、dell OpenManage。經(jīng)測(cè)試只有megacli可以實(shí)現(xiàn)目標(biāo),dell OpenManage由于較大90M左右沒有安裝。
megacli工具非常強(qiáng)大,不僅能查看RAID卡信息,而且還能設(shè)置RAID卡,但是不支持SAS 6/iR的RAID卡,不推薦采用megacli在線設(shè)置RAID卡,本文也僅用于監(jiān)控掛接在RAID上的硬盤狀態(tài)。
1、查看raid卡的型號(hào):
root@3:~# lspci |grep RAID H700
02:00.0 RAID bus controller: LSI Logic / Symbios Logic Device 0079 (rev 04)
root@3:~# lspci |grep RAID PERC 6/i
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 1078 (rev 04)
root@k:~# lspci|grep SAS SAS 6/iR
03:00.0 SCSI storage controller: LSI Logic / Symbios Logic SAS1068E PCI-Express Fusion-MPT SAS (rev 08)
2、安裝megacli
root@3:~# more /etc/apt/sources.list
增加如下源:
##add monitor dell perc 6/i raidcontroller's source
deb http://hwraid.le-vert.net/debian lenny main
root@3:~# apt-get update
root@3:~# apt-get install megacli
3、使用megacli查看RAID卡信息
術(shù)語:BBU 電池備份單元(Battery Backup Unit)
常用查看命令:
megacli -LDInfo -Lall -aALL 查raid級(jí)別
megacli -AdpAllInfo -aALL 查raid卡信息
megacli -PDList -aALL 查看硬盤信息
megacli -AdpBbuCmd -aAll 查看電池信息
megacli -FwTermLog -Dsply -aALL 查看raid卡日志
megacli -adpCount 顯示適配器個(gè)數(shù)
megacli -AdpGetTime –aALL 顯示適配器時(shí)間
megacli -AdpAllInfo -aAll 顯示所有適配器信息
megacli -LDInfo -LALL -aAll 顯示所有邏輯磁盤組信息
megacli -PDList -aAll 顯示所有的物理信息
megacli -AdpBbuCmd -GetBbuStatus -aALL |grep ‘Charger Status’ 查看充電狀態(tài)
megacli -AdpBbuCmd -GetBbuStatus -aALL 顯示BBU狀態(tài)信息
megacli -AdpBbuCmd -GetBbuCapacityInfo -aALL 顯示BBU容量信息
megacli -AdpBbuCmd -GetBbuDesignInfo -aALL 顯示BBU設(shè)計(jì)參數(shù)
megacli -AdpBbuCmd -GetBbuProperties -aALL 顯示當(dāng)前BBU屬性
megacli -cfgdsply -aALL 顯示Raid卡型號(hào),Raid設(shè)置,Disk相關(guān)信息
4、使用crontab定時(shí)監(jiān)控硬盤狀態(tài)的小腳本
該腳本實(shí)現(xiàn)在監(jiān)控到硬盤故障時(shí)發(fā)出報(bào)警郵件,并關(guān)聯(lián)到手機(jī)短信,以便通知運(yùn)維人員及時(shí)處理。
root@3:~# more /backup/autobackup/autoshell/check_raid_disk_health
#!/bin/sh
log_dir=/backup/autobackup/logsum/
log_name=_raid_disk_monitor
logtime=$(date +%Y%m%d --date='1 days ago')
fix=.log
host=_`hostname`
STATUS=0
echo "Checking RAID status on $host" >$log_dir$logtime$log_name$host$fix
RAID_Contrller=`megacli -AdpAllInfo -aALL |grep "Product Name" | cut -d: -f2`
echo "Controller : $RAID_Contrller" >>$log_dir$logtime$log_name$host$fix
Online_disk_num=`megacli -PDList -aALL | grep Online | wc -l`
echo "Totall number of Physical disks online : $Online_disk_num" >>$log_dir$logtime$log_name$host$fix
Degrade_disk=`megacli -AdpAllInfo -a0 |grep "Degrade"`
echo $Degrade_disk >>$log_dir$logtime$log_name$host$fix
Degrade_disk_num=`echo $Degrade_disk |cut -d" " -f3`
Failed_disk=`megacli -AdpAllInfo -a0 |grep "Failed Disks"`
echo $Failed_disk >>$log_dir$logtime$log_name$host$fix
Failed_disk_num=`echo $Failed_disk |cut -d" " -f4`
##將raid_disk_monitor.log scp到mail上
scp -P120 $log_dir$logtime$log_name$host$fix lai@60.*.*.*:/data/autobackup/logsum
ssh -p120 lai@60.1.1.1 "cat /data/autobackup/logsum//$(date +%Y%m%d --date='1 days ago')_raid*| mail -s "`echo "
/$(date +%Y'年'%m'月'%d'日' --date='1 days ago')ERROR:tv3_RAID卡硬盤報(bào)警"|iconv -f utf-8 -t gbk`" postmaster@126.co
m,186053135**@wo.com.cn -- -f www@xp.com"
[ "$Degrade_disk_num" -ne 0 ] && STATUS=1
[ "$Failed_disk_num" -ne 0 ] && STATUS=1
exit $STATUS