因為這世界上還有一個工種叫運維。
服務器是非常容易壞的。雖然單體損壞的可能性非常低,這是由服務器的冗余性設計來保障的。但是當成百上千的基數乘以這個概率的時候.....就天天忙到死了。
我幫忙維護過一個30多臺的小機房。企業內部自用,條件很一般。
破空調壞了,萬幸是冬天,直接開窗進冷風。平時保持在27度的服務器降到21左右。壯哉我大東北。
每次設備清灰都覺得自己會得塵肺阿....黑色非常細的靜電灰。
每次設備維護和調整都要選盡量晚阿。我們即使企業內部自用的。也得等公司所有人下班了才能開始操作,而且遇到加班的要繼續等。
所有操作前第一個想法是備份備份備份。我錯刪過VP兩個虛擬機我說什么了。。帶我的組長獨自恢復一陣列硬盤100+個虛擬機的數據說什么了.....
向不明真相的小伙伴解釋為啥服務器會壞?還是想辦法做熱備份更容易吧。
也別嘲笑我待的環境差我們技術差。每一個運維都在努力讓自己的設備達到各種6個9乃至9個9的可靠性。只能說我們盡力了。
服務器在設計的時候做了大量的備份冗余,在使用的時候運維在不停排除故障。在軟件層面大家一起努力設計了hadoop,hdfs,lvs等等一系列的維護系統和災后修復策略。
這一切最終在用戶看起來就是“服務器為什么不會壞”,因為我們100%確定服務器一定會在不久的將來壞掉。
?