2013/11/21

監控主機資訊 - zabbix的告警與圖表

把監控網站架好<<整合系統監控 - Zabbix>>,有了監控資料<<超方便”提供”監控主機資訊 - zabbix agent>>, 其實zabbix就已經在做事了,點選Configuration>Hosts>某一台主機的Tiggers,這些條件觸發是在加入 templates時自動產生的,當被監控主機的值超過建議閥值時,便會有告警訊息,如果有不需要的就可手動將指定的trigger做disable,以 免出現滿滿的warning,導致管理者看不到真正應該要處理的問題。

描述: https://lh4.googleusercontent.com/LxzkfreV1RJQx7y4XBRMNzVYHv8bK2KTYRhvHqSjhIciGHrcP8Rye0qItJHLLkGDmMLXHPGXKotcZanKy0xzAHJLVOaxVlG-FZyB8iHiic45ap2GZHlU8YG-
▲ 圖一、Trigger監控系統的值是否超過規範。

more...

2013/11/12

超方便”提供”監控主機資訊 - zabbix agent

做完了zabbix伺服端的安裝與基礎設定,如同<<整合系統監控 - Zabbix>>,就可以收工了嗎?不不不!真正的工程現在才要開始,店面開張了,但是裡面還沒放上什麼好料,我們一起來添柴加瓦吧。

zabbix伺服器要怎麼收到被監控主機的資料呢?基本的方法如<<圖一>>所示,有Agent、SNMP、JMX、IPMI收 取資料,如果被監控的主機是網路設備,那沒得選,應該就是SNMP,如果它也是一台伺服器,那下面要介紹的zabbix agent絕對是個方便好用的工具。
描述: https://lh5.googleusercontent.com/kjk48n3JhaDbx0Y81j49SKkAOKiTaGdhNL2ghXLuqfp8Z6BiJWI8JrWa0IJdYEe1J03bdJmCi2Y-xsSTbsxlwtEvJqEbeEI0Uwpkdyx2Jp96kNrHBFqPlOUP
▲ 圖一、zabbix可透過agent、SNMP、JMX、IPM收取資料

more...

2013/11/05

整合系統監控 - Zabbix

在我的環境中,本來是用nagios做伺服器監控,nagios用來檢測伺服器是不是還活著(host有回應ping),檢查服務是不是健在 (service tcp port有回應)方面算是簡單有好用,如果再加上nagios agent 還可以看磁碟空間等其它有趣的訊息,這個部份可以參考之前做的<<回報伺服器掛了沒 -- nagios>>系列文章,可是有些東西要看的到圖型比較有意思,所以再用cacti看網路流量圖,參考<<網路流量報表 - cacti>>,一樣是snmp,也試用輕量的mrtg看系統資源的使用,參考<<輕量系統資源監看 – snmpd、lighttpd與mrtg>>。 做多了,再回頭一看,怎麼做一個監控的事,怎麼要搞到這麼多東西?本來的需求是很簡單的,所以用上述的軟體來完成,時間經過了,需求變了樣或者變得更多 了,就又找了其它方案,可這樣下來管理工作做不好做了,我們來把它整理整理,這邊用zabbix一統江山吧!


▲ 圖一、zabbix收整不同來源的監控資料

more...

2013/11/02

Linux服務心跳監測 – heartbeat

使用<<自動同步的儲存空間 - DRBD >>資料會自動備份到不同的儲存空間,在儲存主設備有問題時(掛點),只要切換到第二台的備援機就好,操作起來也不太難(心虛),首先把第二台設成儲存主設備(sudo drbdadm primary r0),再把資料夾mount起來供使用(sudo mount /dev/drbd0 /srv),如果有服務要在上面,也要記得把服務啟用,然後把連接服務的用戶端重新連到備援機的IP上,果然有想像是美好的,但現實是殘忍的問題,原本希望強固儲存空間的可用性,但是執行備援方案看來是討人厭的麻煩,剛才提到的操作動作,應該要由伺服器自動完成才是,於是heattbeat浮出來了。
 
Heartbeatlinux 叢集解決方案之一,使用heartbeat後,我們將會有一個提供服務的虛擬IP,自動掛載的磁碟與自動啟用的服務。
 
測試的環境同<<自動同步的儲存空間 - DRBD>>,在上面還要多加一個nfs服務,並透過虛擬IP來提供服務。

圖一、heartbeat的測試架構

2013/10/18

自動同步的儲存空間 - DRBD

資料量越來越大,越來越多的現在,可信賴的資料儲存空間就變的十分的重要,如果有做可移轉的VM環境,通常會有個共用磁碟,這時的這個儲存空間,就好像存放全部雞蛋的籃子,籃子生則天下太平,籃子死則IT...。

一般在強固儲存空間的可用性,我們會用raid技術,raid 5 可以在系統損壞1顆硬碟時,不影響系統運作,raid 6 可以允許同時壞2顆硬碟,同時壞多顆硬碟的機率很小,但是不能說沒有,其它還有可能raid card故障,storage的其它部份故障,這些其它小機率的問題,沒發生沒事,一但有了萬一,也可能造成整個儲存空間的損壞。如果說,還有多的一些預算在儲存空間上,那試試DRBD來把籃子(誤)儲存資料變兩份吧。


▲ 圖一、透過drbd把儲存資料變成兩份
more...

2013/09/16

機櫃與伺服器的網頁記錄 - RackTables 0.20.5設定篇

在享受甜美的成果之前,真的是需要花些功夫栽種的,racktables的設定其實是有點小複雜的,在機櫃方面,要先設定機房的位置 (location) 在那裡,機櫃行的名字 (row),再來還有機櫃 (racks) 的名字,這樣才完成機櫃的設定,往下我們細看它設定的方法。
註:racktables安裝可以參考這裡

 圖一、racktables所需要的機櫃資訊。
more...

2013/09/14

機櫃與伺服器的網頁記錄 - RackTables 0.20.5安裝篇

如果伺服器不是很多,管理者也少少的,那隨便用什麼來記錄機櫃與伺服器資訊都好,常見可能是 txt/excel 或其它程式來記錄,記錄設備放在那一個櫃上, 什麼時候買的,保固到什麼時候,設備中設定的網路/帳號/財產資訊,設備的元件損壞更換記錄,如果伺服器與管理者多呢? txt/excel 當然還是管理者的好朋友,但是讓老闆看的到又還算美的 -- 網頁式 racktables ,也許也是個可以考量的方案。或者換個角度看,就當是玩玩也好,裝個 racktables 來看看別人在伺服器管理時,會做那些資料的記錄,很可能會給使用 txt/excel 記錄的管理者一些不同的想法(可能會覺得記錄很多資料,記起來很辛苦,還是用原本的方法就好 XD)。

 圖一、使用 racktables 記錄機房資訊。
more...

2013/08/15

系統弱點掃描 -- OpenVAS 6 DEMO

  歲月的長河一直不斷的向前流動著,軟體也一直出新版,現在OpenVAS 6 DEMO出來了,有新版並不是說之前的「作業系統弱點掃描 -- OpenVAS 5 DEMO」就不能用了,事實上,我測過最新的OpenVAS 5的NVT更新仍是正常的,所以不一定要用新版,但是既然新版本都出了,沒有用用看就好像心癢癢的(大誤),就看看新版本有什麼不一樣的新功能,加上以虛擬機的方式做匯入也是簡單又方便,不會耗太多的工時的。


▲ 圖一、透過openvas檢查伺服器與設備中的弱點。

如同OpenVAS 5 DEMO,還是一樣在官網上下載ova檔案,官網最近有補上debian的obs與centos/redhat/fedora的atomic安裝步驟,有興趣手動安裝的朋友可以試試,要匯入ova的動作說明,可以參考「安裝測試不麻煩匯入虛擬電腦 – VirtualBox」,除了看新功能,我還給自己規定一個限制的情境,就是在環境中沒有多餘的IP可供匯入的虛擬機使用,我們接著往下看。

註:如果您的IP夠,不需要實做這一部份,可以bypass下面三段,直接使用固定IP,或是dhcp提供的IP進行連線。
more...

2013/07/17

bare-metal企業級開源虛擬化軟體 - XenServer 6.2

  照說寫軟體時,不用特別提到版本號才是,不過 XenServer 有點特別,它在 6.2 之前的版本,是有再細分為免費版、進階版、企業版、白金版等不同的功能版別,比較高貴的版本中,就提供更多的進階管理和自動化的功能,版本差異的詳情可以 參考Citrix網站 (直接連結點這裡), 不過這一切在6月底的時候改變了,Citrix 現已將 XenServer 開源,並有新的官網 http://www.xenserver.org 提供程式與程式碼下載,所以才說現在 XenServer 6.2 的版本,是 bare-metal 企業級”開源”虛擬化軟體。

▲ 圖一、安裝 xenserver host 後,在其中可以安裝多台虛擬機 (vm guests)

雖然現在的免費版就有全部的功能了,但是環境不夠大,其實也不會用到全部的功能,這邊做一些基本功能的介紹。

先來下載軟體吧,先到 xenserver.org 中的 SOFTWARE>DOWNLOAD,下載 ISO 檔與管理工具

♦   Installation ISO
♦   XenCenter Windows Management Console
more...

2013/06/17

常用片語、程式呼叫器 - autokey

    我一直認為IT是組织中的血脈,傳送需要的資訊,為工作與決策提供快速有效完成的可能,在個人的電腦,當然也可以透過IT工具來增進效率,autokey 正是一個這樣的工具,他提供phrases(片語)轉換、熱鍵呼叫功能,也能以scripts的編寫簡化工作,下面就讓我們簡單的來看一看autokey 吧。

首先是安裝,到好朋友Ubuntu Software Center中,輸入autokey,點install進行安裝。

▲ 圖一、安裝autokey。


執行autokey後,autokey的主畫面長的如<<圖二>>如示,左邊有資料夾區,可以依功能收納編寫出來的 phrases與scripts,在這一區按滑鼠右鍵可以新增資料夾、phrases、scripts,不需要的部份則可以點delete做刪除。
more...

2013/05/06

魔術大空間 - glusterfs

   現在資料越長越大、越長越多,老是覺得儲存的空間不夠用,只好花錢買新的設備,用新的硬碟,現在一個硬碟最大4TB,多個硬碟合在一起做raid,就是n 多TB了,可要是沒有錢,想用舊設備來做?行,這就是伺服器管理有趣的地方,找一些軟體方案解決問題,回到主題,我們接下來要介紹glusterfs,透 過glusterfs就可以把多台舊設備中的空間,合併成一個大空間,供管理者使用。

▲ 圖一、透過glusterfs可以合併多個伺服器中的儲存空間

glusterfs 是開源的分佈式檔案系統,詳細的資料可以看官網, 在使用舊設備來做儲存空間前,我會建議系統要重新規劃,一是本機的磁碟容錯還是要做,例如以raid 5組成磁碟陣列,避免本機硬碟故障而遺失資料,這是因為下面我示範的是Distributed volumes(註),這種volume type只是把檔案分散到不同台的glusterfs伺服器中,藉此達到儲存空間,等於所有glusterfs伺服器分享空間的總合,缺點就是沒有備份, 有一個伺服器壞掉時,那原本被分佈到儲存裡面的檔案就會不見;二是將磁碟分為兩部份,一個給作業系統(os)用,一個給分享的儲存空間(storage) 用,兩者要是混在一起時,可能會發生儲存空間檔案用太多,導致root沒有空間可用的問題。

註:要有備份可以選用Replicated Volumes。

more...

2013/04/26

輕量系統資源監看 - snmpd、lighttpd與mrtg

  要很簡單的安裝好一個監看軟體,可以參考「網路流量報表 - cacti」 (我個人覺得cacti真的是很好裝,但他的設定比較難搞),如果只要簡單的事後回查資訊,那用script加在crontab的方式,把一些系統資訊寫 到檔案中,事後再以cat的方式列出就行了。剛好我有一些需求,希望有圖型介面看系統資源的使用,但是又不要花大多資源安裝php/mysql等,最後選 用snmpd+lighttpd+mrtg。


▲ 圖一、以mrtg監控設備的CPU使用量


snmpd提供網路查詢系統資訊的功能,lighttpd是一個輕量化的網頁伺服器,mrtg則是收集snmpd的數值,在轉畫成圖型的工具,三個加起來就可以呈現如圖一的圖型化報表效果,安裝指令一貫的簡單,如下所示

more...

2013/04/22

nmap的gui界面 - zenmap

  透過nmap,我們可以很簡單的知道現在網路上IP位址的使用情形,也可以查詢某一個特定設備所開放的通訊埠,指令模式也還算是簡單方便又好用,可以參考看看我這一篇文章「網路掃描工具 - nmap」,不過文字模式也是有些缺憾,要是查詢的IP住址範圍比較大時,或是回傳的資訊比較多,文字模式會回應一大堆的字在螢幕上的結果,可能就不是那麼的令人滿意了,這個時候可以試用gui界面下的zenmap。

▲ 圖一、zenmap透過nmap做網路的掃描動作。

Ubuntu desktop下安裝zenmap非常的簡單,首先請出我們安裝時會用到的好朋友「Ubuntu Software Center」,以zenmap做關鍵字查詢,找到軟體後點Install進行安裝,過一會兒安裝就完成了。


▲ 圖二、使用Ubuntu Software Center做zenmap的安裝。
more...

2013/03/27

網路掃描工具 - nmap

  有的時候我們會想要找出網路上,設備/電腦的IP位址、開放埠(port)、作業系統等的資訊, 想知道自己的網段中,有多少台的電腦/設備正在連接網路的運作著,或者是舊的設備,例如網路基地台(AP)、列印伺服器等的設備做reset後,IP跑回 預設值,但是鬼才知道預設值是什麼,如果找的到手冊,知道預設值,那就直接用IP連線,如果不知道,那就需要土法練鋼一下,使用獨立使用HUB串接,再配 合掃描工具,來找看看是那個IP活著,這個動作在Windows的環境中,有很多ipscan的工具可用,在Ubuntu (unix-like)的作業環境可以參考下面要介紹的namp囉。






▲ 圖一、土法煉鋼找設備IP

more...

2013/02/22

作業系統自動安裝應答CD製做 - kickstart

   雖然透過Virtualbox的clone功能,要做一個多台主機的測試環境是簡單又快速,可是有的時候就是需要由CD來做安裝,安裝不是問題,一次兩次 也還OK,但是次數多了,總是回答要怎麼切硬碟,新使用者叫什麼名字,也會覺得很麻煩,透過下面介紹的kickstart,我們可以製做出一個應答檔案, 再配合原本安裝的光碟映象檔,重包出一個安裝光碟檔映象檔(iso),使用這個iso安裝的系統,將可選用一鍵安裝功能。

這次使用的環境是Ubuntu Desktop,所以指令會比較少~呵,首先透過Ubuntu Software Center,尋找kickstart,再點擊install進行安裝。


▲ 圖一、安裝kickstart的圖示。

more...

2013/02/08

儲存空間伺服器 – iscsi

  伺服器的硬碟空間不夠,那就是加個硬碟吧,然後就像在「儲存空間管理與動態擴充-LVM」提到的一樣,把新增加的硬碟空間納入原本的LVM中,伺服器的硬碟空間也就得以放大了,要是不能在實體上增加硬碟呢?那用「網路檔案系統 – NFS」mount一個NFS空間也是個不錯的選擇,如果是要給不同作業系統用(i.g. windows),或者是要用起來就像個本機的硬碟,那就是我們下面要聊到的主題 - iscsi。

▲ 圖一、透過iscsi,藉由網路連接擴展伺服器的硬碟空間。

要使用iscsi前,需要規畫一個提供儲存空間的伺服器,可能是一台2U,8個HD的伺服器,這8個HD可能是做成RAID 5+spare的硬碟容錯架構,做更高的raid6或raid10/raid50都可,就是依需求來規劃,然後切成兩個logical volume,一個給自已用,拿來安裝作業系統,另外一個就是預備要分給別的伺服器使用。


測試環境當然沒有這些東西,請容許我簡單的使用Virtualbox加一個80G的NewHardDisk2給系統,然後再使用另一台來掛載這一個空間吧。

more...

2013/01/31

伺服器中的排程工作 - crontab

  有一些工作,像是定期報表的產生、額外的log記錄、垃圾的刪除,或者是其它因為管理的需要,如「使用者上網行為的報表 -- SARG」或「同步備份伺服器 - rsync daemon」所提,我們會希望工作/指令,可以自動定期的執行,而不是管理者定時登入伺服器再手動執行工作,從而避免人員的疏漏的問題產生。

像這樣的排程工作是cron這個服務在管的,雖然cron這個字眼看起來就不是什麼排程執行的縮寫,不過man cron就可以看到cron - daemon to execute scheduled commands字樣,有排程、有執行指令,這正滿足我們剛提到的需求。

▲ 圖一、使用cron排程定期執行工作。

用cron是在指定時間執行指定的工作,時間的設定我們等等看crontab的檔案,工作就要我們依需求寫script,我下面做兩個需求當成示例:

  1. 一個是放在proxy上跑sarg報表,除了跑報表,還順便記錄每次執行所花費的時間,並將結果寫入/var/log/ruilung-sarg.log中。
    ● sudo mkdir /etc/ruilung  # 在/etc下做一個目錄,擺放自己寫的程式,管理者也可以依習慣放在不同的地方。
    ● sudo vi /etc/ruilung/ruilung-sarg.sh
more...

2013/01/25

同步備份伺服器 - rsync daemon


   備份有多重要呢?很難量化的說明,如果有辦法重安裝作業系統/軟體就搞定的伺服器,備份應該沒什麼重要,只要重灌的時間內使用者不要抱怨就可以了,如果在 伺服器上日積月累的設定或資料,那備份就真的很重要,非常重要,或者應該換個名詞,叫緊急應變或叫災難復原計畫,這樣老闆可能會比較願意支持。

要怎麼備份呢?古早古早的時候,磁碟空間小,系統通常會有2個以上的硬碟,要備份資料是把資料tar成一個壓縮整合包,然後放到不同硬碟中,以硬碟應該不 會同時故障的想法來保全資料;再後來一些,硬碟大多還是2個以上,不過為了效能通常會做成raid,所以系統最後看到的是一個邏輯磁碟,所以還是tar, 然後可能在遠端架ftp(不一定是ftp但是邏輯可能差不多),再寫script將資料上傳到ftp中,資料量小,檔案小時這個方案還可行,檔案多又大 時,打包備份要花時間,每次都要全部備一次,也很操硬碟,加上傳檔也要時間,所以換個方法,同步化備份是個好主意。


做同步備份(rsync)時,程式會在備份的過程中檢視資料,如果在遠端(目地端)已有”一樣”的資料,則此筆資料的備份動作就會被bypass過去,舉 例來說,如果伺服器中有一萬個檔案,第一次同步備份要久一點,等這一萬個檔案都複製完,第二次同步備份時,資料成長了,變成一萬零500個資料,那只要備 份新的500筆資料就好,速度當然比完整備份要快上許多。

More...

2013/01/20

帳號密碼集中管理 - NIS伺服器


   Ubuntu安裝的過程中,一般都是新建一個使用者,然後這個使用者可以使用sudo指令來進行管理動作,要是一般使用者或是第二號管理者要登入伺服器, 直覺的做法是useradd使用者與管理者帳號,管理者需要sudo權限,就加到sudo群組中,一台兩台還好,要是伺服器有一定數量時就麻煩了,再再加 上資安的需求,要求帳號要做密碼定期變更,那搞帳號密碼,真的是會辛苦與錯亂到不行,我們可以透過NIS(Network Information Service),來處理這個問題。
註:OpenLDAP也是個很好的解決方案,不過NIS比較簡單一些,我們先看NIS。

▲ 圖一、透過NIS Master的帳密,登入到NIS Client中


使用NIS的方案,會在NIS的伺服器(角色叫MASTER)上依帳密資訊建資料庫,白話的來說就是帳號在NIS MASTER中有,就可以登入到用戶端,改密碼也只要改MASTER段就可以了,聽起來很棒的,我們來實做如下:

More...

2013/01/08

文字模式遠端連線伺服器 - openssh


如果你在「好用ssh連線工具 - putty」, 發現自己的ubuntu伺服器無法被連線,那應該是在安裝的過程中,沒有啟用到OpenSSH server的功能(預設是沒有安裝),沒有啟用這個功能對管理者來說會有一些些不方便,變成所有的操作都需要跑到伺服器前進行,要是有些設定資料是由網 路上找來的,也不能利用putty直接貼上,可能要自己重敲或是透過nfs/ftp等轉檔案進伺服器中,這麼簡單又實用的功能,還是安裝一下的好,安裝的 方法可以透過apt-get install openssh-server來做,或者使用sudo tasksel,我個人喜歡後者的做法,所以擷圖示意如<<圖二>>所示。

More...

2013/01/02

blog部落格系統 - wordpress


  安裝好神奇的LAMP,就可以有動態網頁伺服器,現在還沒有的話也沒關係,可以看這裡「動態網頁伺服器 -- apache + mysq l+ php」,很簡單就可以安裝好,LAMP除了給一些服務使用,管理者可能也想要發佈一些資料,或者是留存一些資訊,這個時候簡單、好學、好用的部落格系統wordpress,就是個非常合用的工具。

▲ 圖一、簡單、好學、好用的部落格系統wordpress。


wordpress在Ubuntu中的安裝,老樣子非常的簡單,透過sudo apt-get install wordpress就可以完成,後續的設定看手冊寫來,其實也簡單,但是設定邏輯恕小弟一直無法理解,所以這次我們”不”透過apt-get install來安裝使用wordpress,而是直接到官網去下載最新版本,再到伺服器中手動進行安裝。

More...