2013/11/21

監控主機資訊 - zabbix的告警與圖表

把監控網站架好<<整合系統監控 - Zabbix>>,有了監控資料<<超方便”提供”監控主機資訊 - zabbix agent>>, 其實zabbix就已經在做事了,點選Configuration>Hosts>某一台主機的Tiggers,這些條件觸發是在加入 templates時自動產生的,當被監控主機的值超過建議閥值時,便會有告警訊息,如果有不需要的就可手動將指定的trigger做disable,以 免出現滿滿的warning,導致管理者看不到真正應該要處理的問題。

描述: https://lh4.googleusercontent.com/LxzkfreV1RJQx7y4XBRMNzVYHv8bK2KTYRhvHqSjhIciGHrcP8Rye0qItJHLLkGDmMLXHPGXKotcZanKy0xzAHJLVOaxVlG-FZyB8iHiic45ap2GZHlU8YG-
▲ 圖一、Trigger監控系統的值是否超過規範。

more...

2013/11/12

超方便”提供”監控主機資訊 - zabbix agent

做完了zabbix伺服端的安裝與基礎設定,如同<<整合系統監控 - Zabbix>>,就可以收工了嗎?不不不!真正的工程現在才要開始,店面開張了,但是裡面還沒放上什麼好料,我們一起來添柴加瓦吧。

zabbix伺服器要怎麼收到被監控主機的資料呢?基本的方法如<<圖一>>所示,有Agent、SNMP、JMX、IPMI收 取資料,如果被監控的主機是網路設備,那沒得選,應該就是SNMP,如果它也是一台伺服器,那下面要介紹的zabbix agent絕對是個方便好用的工具。
描述: https://lh5.googleusercontent.com/kjk48n3JhaDbx0Y81j49SKkAOKiTaGdhNL2ghXLuqfp8Z6BiJWI8JrWa0IJdYEe1J03bdJmCi2Y-xsSTbsxlwtEvJqEbeEI0Uwpkdyx2Jp96kNrHBFqPlOUP
▲ 圖一、zabbix可透過agent、SNMP、JMX、IPM收取資料

more...

2013/11/05

整合系統監控 - Zabbix

在我的環境中,本來是用nagios做伺服器監控,nagios用來檢測伺服器是不是還活著(host有回應ping),檢查服務是不是健在 (service tcp port有回應)方面算是簡單有好用,如果再加上nagios agent 還可以看磁碟空間等其它有趣的訊息,這個部份可以參考之前做的<<回報伺服器掛了沒 -- nagios>>系列文章,可是有些東西要看的到圖型比較有意思,所以再用cacti看網路流量圖,參考<<網路流量報表 - cacti>>,一樣是snmp,也試用輕量的mrtg看系統資源的使用,參考<<輕量系統資源監看 – snmpd、lighttpd與mrtg>>。 做多了,再回頭一看,怎麼做一個監控的事,怎麼要搞到這麼多東西?本來的需求是很簡單的,所以用上述的軟體來完成,時間經過了,需求變了樣或者變得更多 了,就又找了其它方案,可這樣下來管理工作做不好做了,我們來把它整理整理,這邊用zabbix一統江山吧!


▲ 圖一、zabbix收整不同來源的監控資料

more...

2013/11/02

Linux服務心跳監測 – heartbeat

使用<<自動同步的儲存空間 - DRBD >>資料會自動備份到不同的儲存空間,在儲存主設備有問題時(掛點),只要切換到第二台的備援機就好,操作起來也不太難(心虛),首先把第二台設成儲存主設備(sudo drbdadm primary r0),再把資料夾mount起來供使用(sudo mount /dev/drbd0 /srv),如果有服務要在上面,也要記得把服務啟用,然後把連接服務的用戶端重新連到備援機的IP上,果然有想像是美好的,但現實是殘忍的問題,原本希望強固儲存空間的可用性,但是執行備援方案看來是討人厭的麻煩,剛才提到的操作動作,應該要由伺服器自動完成才是,於是heattbeat浮出來了。
 
Heartbeatlinux 叢集解決方案之一,使用heartbeat後,我們將會有一個提供服務的虛擬IP,自動掛載的磁碟與自動啟用的服務。
 
測試的環境同<<自動同步的儲存空間 - DRBD>>,在上面還要多加一個nfs服務,並透過虛擬IP來提供服務。

圖一、heartbeat的測試架構