來源:51cto.技術博客 Dell服務器RAID卡介紹及監控
一、Dell服務器 RAID卡介紹
以下在系統下使用相關命令得到的數據,dell支持的各種RAID卡的詳細參數參見本文第五部分。
1、內部RAID控制器
使用megacli命令查看得到的RAID卡數據:
SAS 6/iR :只支持2塊硬盤做 raid0,或者raid1,或者不做陣列卡 (Dell硬件聊天室獲得)
PERC 6/i Integrated
Memory Size: 256MB
RAID Level Supported: RAID0, RAID1, RAID5, RAID6, RAID10, RAID50, RAID60, PRL 11, PRL 11 with spanning, SRL 3 supported
Supported Drives: SAS, SATA
Min Stripe Size: 8 KB
Max Stripe Size: 1.0 MB
接口速度Link Speed: 3.0Gb/s
PERC H700 Integrated
Memory Size: 512MB
RAID Level Supported: RAID0, RAID1, RAID5, RAID6, RAID10, RAID50, RAID60, PRL 11, PRL 11 with spanning
Supported Drives: SAS, SATA
Min Stripe Size: 8 KB
Max Stripe Size: 1.0 MB
接口速度Link Speed: 6.0Gb/s
官方資料:
PERC H200(6 Gb/秒)
PERC H700(6Gb /秒),配備512 MB非易失性高速緩存
PERC H700(6 Gb/秒),配備512 MB電池后備高速緩存;512 MB、1 G非易失性電池后備高速緩存
PERC 6/i,配備256 MB電池后備高速緩存
2、外部RAID控制器
官方資料:
PERC H800(6Gb/秒),配備512 MB非易失性高速緩存
PERC H800(6Gb/秒),配備512 MB電池后備高速緩存;512 MB、1 G非易失性電池后備高速緩存
PERC 6/E,配備256 MB或512 MB電池后備高速緩存
二、陣列卡的Stripe size介紹
Stripe size 默認64KB。
1、Stripe size百科介紹
在每個磁盤上連續寫入數據的總量,也稱作“條帶深度”。你可以指定每個邏輯驅動器的條帶容量從2KB,4KB,8KB一直到128KB。為了獲得更高的性能,要選擇條帶的容量等于或小于操作系統的簇的大小。大容量的條帶會產生更高的讀取性能,尤其在讀取連續數據的時候。而讀取隨機數據的時候,******設定條帶的容量小一點。如果指定128KB的條帶將需要8MB內存。
不同Stripe size的選擇直接影響性能,如IOPS和吞吐量。
Stripe size值小,通過多塊磁盤響應多個I/O請求,可以增加I/O訪問速率(IOPS)
Stripe size值大,通過多塊磁盤響應一個I/O請求,可以增加數據傳輸速率(Mbps)
我們知道順序和隨機對于帶寬和iops的需求成反比,即順序的讀寫比較消耗帶寬,隨機的讀寫比較消耗iops;
2、Stripe size一般設置
通常,小Stripe size適用于數據庫,一般Stripe size適用于文件服務器,大Stripe size適用于多煤體應用。實際應用stripe size大小應在效率測試后具體設置。
數據庫一般4-16KB
web服務器默認即可,16-64KB
流媒體等大文件建議128KB以上
三、megacli介紹、安裝、使用、crontab監控腳本
查看RAID信息的工具有mpt-status、megarc、dell OpenManage。經測試只有megacli可以實現目標,dell OpenManage由于較大90M左右沒有安裝。
megacli工具非常強大,不僅能查看RAID卡信息,而且還能設置RAID卡,但是不支持SAS 6/iR的RAID卡,不推薦采用megacli在線設置RAID卡,本文也僅用于監控掛接在RAID上的硬盤狀態。
1、查看raid卡的型號:
root@3:~# lspci |grep RAID H700
02:00.0 RAID bus controller: LSI Logic / Symbios Logic Device 0079 (rev 04)
root@3:~# lspci |grep RAID PERC 6/i
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 1078 (rev 04)
root@k:~# lspci|grep SAS SAS 6/iR
03:00.0 SCSI storage controller: LSI Logic / Symbios Logic SAS1068E PCI-Express Fusion-MPT SAS (rev 08)
2、安裝megacli
root@3:~# more /etc/apt/sources.list
增加如下源:
##add monitor dell perc 6/i raidcontroller's source
deb http://hwraid.le-vert.net/debian lenny main
root@3:~# apt-get update
root@3:~# apt-get install megacli
3、使用megacli查看RAID卡信息
術語:BBU 電池備份單元(Battery Backup Unit)
常用查看命令:
megacli -LDInfo -Lall -aALL 查raid級別
megacli -AdpAllInfo -aALL 查raid卡信息
megacli -PDList -aALL 查看硬盤信息
megacli -AdpBbuCmd -aAll 查看電池信息
megacli -FwTermLog -Dsply -aALL 查看raid卡日志
megacli -adpCount 顯示適配器個數
megacli -AdpGetTime –aALL 顯示適配器時間
megacli -AdpAllInfo -aAll 顯示所有適配器信息
megacli -LDInfo -LALL -aAll 顯示所有邏輯磁盤組信息
megacli -PDList -aAll 顯示所有的物理信息
megacli -AdpBbuCmd -GetBbuStatus -aALL |grep ‘Charger Status’ 查看充電狀態
megacli -AdpBbuCmd -GetBbuStatus -aALL 顯示BBU狀態信息
megacli -AdpBbuCmd -GetBbuCapacityInfo -aALL 顯示BBU容量信息
megacli -AdpBbuCmd -GetBbuDesignInfo -aALL 顯示BBU設計參數
megacli -AdpBbuCmd -GetBbuProperties -aALL 顯示當前BBU屬性
megacli -cfgdsply -aALL 顯示Raid卡型號,Raid設置,Disk相關信息
4、使用crontab定時監控硬盤狀態的小腳本
該腳本實現在監控到硬盤故障時發出報警郵件,并關聯到手機短信,以便通知運維人員及時處理。
root@3:~# more /backup/autobackup/autoshell/check_raid_disk_health
#!/bin/sh
log_dir=/backup/autobackup/logsum/
log_name=_raid_disk_monitor
logtime=$(date +%Y%m%d --date='1 days ago')
fix=.log
host=_`hostname`
STATUS=0
echo "Checking RAID status on $host" >$log_dir$logtime$log_name$host$fix
RAID_Contrller=`megacli -AdpAllInfo -aALL |grep "Product Name" | cut -d: -f2`
echo "Controller : $RAID_Contrller" >>$log_dir$logtime$log_name$host$fix
Online_disk_num=`megacli -PDList -aALL | grep Online | wc -l`
echo "Totall number of Physical disks online : $Online_disk_num" >>$log_dir$logtime$log_name$host$fix
Degrade_disk=`megacli -AdpAllInfo -a0 |grep "Degrade"`
echo $Degrade_disk >>$log_dir$logtime$log_name$host$fix
Degrade_disk_num=`echo $Degrade_disk |cut -d" " -f3`
Failed_disk=`megacli -AdpAllInfo -a0 |grep "Failed Disks"`
echo $Failed_disk >>$log_dir$logtime$log_name$host$fix
Failed_disk_num=`echo $Failed_disk |cut -d" " -f4`
##將raid_disk_monitor.log scp到mail上
scp -P120 $log_dir$logtime$log_name$host$fix lai@60.*.*.*:/data/autobackup/logsum
ssh -p120 lai@60.1.1.1 "cat /data/autobackup/logsum//$(date +%Y%m%d --date='1 days ago')_raid*| mail -s "`echo "
/$(date +%Y'年'%m'月'%d'日' --date='1 days ago')ERROR:tv3_RAID卡硬盤報警"|iconv -f utf-8 -t gbk`" postmaster@126.co
m,186053135**@wo.com.cn -- -f www@xp.com"
[ "$Degrade_disk_num" -ne 0 ] && STATUS=1
[ "$Failed_disk_num" -ne 0 ] && STATUS=1
exit $STATUS