信望愛站的硬體選擇與理由
文:TJM
因為最初信望愛站是由一群學生建立起來的,而且又要負擔許多人24小時不停 的使用,所以「低價高效能」一直是我們選擇硬體的準則。一開始選擇x86 PC為信望愛 站的主要硬體平台,其實跟經費不足有相當的關係。當然,參與建站的幾個技術人員也 都有使用工作站的經驗,所以才不會迷信工作站的穩定性與速度,我們深知只要對軟硬 體掌握度夠,PC還是可以負擔伺服器的工作。雖然一般說起來工作站的速度會比PC高, 不過PC的功能隨著摩爾定律而越來越強大,而信望愛站的硬體需求從來沒有追得上PC硬 體進步的速度,因此我們也就樂於使用這種便宜又熟悉的硬體平台。

即便我們一開始就選定PC為信望愛站的主要硬體平台,但「穩定」仍然是我們 配置硬體的最優先考慮。在幾次失敗的經驗中,我們學會「熱量」是伺服器最大的殺手 ,因此適當的選定機殼,配置足夠的優質散熱風扇,是建構穩定系統的第一步。

再者,我們發現使用「馬達」的零件是整個系統中最快損壞的部分,因此我們 選購伺服器時,對於CPU的散熱風扇、硬碟等等,都會盡力購買比較高級的產品,以免 為了小小的零件損壞而必須停機檢修。一般說來,台製的CPU風扇很少是品質優良、經 久耐用的產品,一般我們會盡量購買盒裝CPU來獲取其內附的風扇,這種盒裝的CPU所附 的風扇一般會有比較長的壽命。而硬碟部分到目前我們也沒有什麼很有效的解決方案, 早期我們使用的都是Quantum和Segate的硬碟,一般壽命都不超過兩年。而且通常我們 購買的產品都是新出來的機種(硬碟的淘汰速度很快),很難問到長期使用的口碑, 因此有時候甚至安裝幾個月就出現問題,得要找經銷商更換。目前我們改使用IBM的SCSI 硬碟,目前使用的狀況不錯(1999年7月開始使用),還沒有壞掉的紀錄。

台灣是主機板生產大國,不過產品卻是良莠不齊,或者有人為求穩定,購買 所謂「有品牌」的大廠產品。不過我們卻認為即使採購有品牌的PC,簽訂維護合約, 都還不如自己掌握機器硬體狀況的穩當,因為即使硬體臨時損壞,也可以依賴拆下比較 不重要機器的零件來作緊急維修,遠比等待維修人員到達判定問題所在並調來正廠零 件更換來的迅速有效。並且目前台灣熟悉Linux系統的人並不多,恐怕出問題時難以 區分到底是OS的問題還是硬體問題。因此信望愛站的硬體都是採用拼裝的PC,選定 優良的主機板與介面卡大廠出品的硬體,依賴自己或者熟悉的電腦公司拼裝起來,並 且絕對不over clock以維護系統的穩定。

我們一般會避開剛剛新推出來的硬體,以免把伺服器當成廠商實驗的白老鼠, 並且會選購正廠零件,因為我們深知多用一點點錢買下伺服器的「穩定」是絕對值得的 。在硬碟介面卡部分,我們選用的都是SCSI的介面卡,以應付多工環境的需要。而在顯 示卡方面,則因為伺服器並不依賴優良、快速的顯示卡,所以就以便宜穩定為準。而在 記憶體方面,因為影響整個系統的效能甚巨,雖然以目前信望愛站的工作需求來說, 64M就已經足以勝任,但我們還是決定裝設128M 以上PC-100 SDRAM, 以做為未來擴充之用。

在網路卡方面,目前我們全部都採用3 COM的10/100 網路卡,起先我們使用 Accton公司的10/100 Hub,最近新加入一台NWAY Switch公司的10/100 Switch,主要 的原因也是為了穩定的考慮。採用100M的網路卡與Switch Hub是為了希望 透過網路備份時可以有最好的效率,以減少網路備份對整個系統效能的影響。

UPS是架設伺服器不可或缺的重要設備,但是良好的UPS價格高昂,在考慮價格 與需求的平衡之下,我們購買的是1KVA,可外加電池的智慧型UPS(off-line,不過有 微處理機隨時監督電壓狀況,切換速度也比一般的off-line UPS快),在系統滿載的測 試下,大約可以支撐五個小時。至於UPS與PC之間的通信硬體與軟體,因為Linux上面 已經有現成的軟體,所以我們會自行裝置相關的RS-232連線(我發現到了2000年2月 這條線還沒有裝,大概是因為高雄地區的供電非常穩定,全省大停電與大地震都沒有 真正影響到高雄地區的供電)。

最後要談一談的就是目前主機板與CPU之間有所謂Socket-7與Slot-1的規格之 爭,亦即購買PC時必須決定要使用AMD-K6這一系列還是Intel PII這一系列。前者比較 便宜但浮點運算較慢、硬體架構也略差,而後者是Intel全新的設計,價格較高而浮點 運算速度、硬體架構都較佳。在幾經考慮與分析後,我們發現在幾年內信望愛站的效率 主要是受限專線速度,而且目前網路的應用軟體很少用到浮點運算,因此我們就毅然投 入Socket-7的陣營,採用AMD-K6的CPU當信望愛站的心臟。

目前信望愛站有三台技術人員親手拼裝起來的伺服器,每一台的硬體配備都很 接近,目的就是希望緊急時零件可以彼此替換,維修起來也不容易搞混。現在這三台伺 服器的硬體穩定度都相當良好,已經有開機七十幾天不停的紀錄了,這一年多來除了一 個機器外面散熱用的電風扇因為軸承故障被替換下來之外,並無任何硬體故障發生,算 是相當良好的紀錄了。


TJM記於1998.11.19,2000.2.19修訂