- 工信部備案號 滇ICP備05000110號-1
- 滇公安備案 滇53010302000111
- 增值電信業(yè)務經(jīng)營許可證 B1.B2-20181647、滇B1.B2-20190004
- 云南互聯(lián)網(wǎng)協(xié)會理事單位
- 安全聯(lián)盟認證網(wǎng)站身份V標記
- 域名注冊服務機構(gòu)許可:滇D3-20230001
- 代理域名注冊服務機構(gòu):新網(wǎng)數(shù)碼
作為系統(tǒng)管理員,不僅僅是要知道怎么建立維護服務器和理解系統(tǒng)命令是怎么工作的就可以讓你成為一個好的系統(tǒng)管理員——甚至也不是要知道當系統(tǒng)宕掉時怎么去修復,怎么去監(jiān)控系能,怎么去管理備份或者怎么可以寫出漂亮的腳本。而是除此之外還要為自己制定一套能讓系統(tǒng)良好運行以及讓你用戶高興的規(guī)則。
可能其中很多你已經(jīng)聽過無數(shù)次,也可能有些是你遇到問題時吸取的經(jīng)驗教訓。這些規(guī)則在過去幾十年的系統(tǒng)管理中都已經(jīng)證明了它們的價值并且能夠幫助我們在腦子發(fā)熱時冷靜下來。
1. 禁止做任何不能回滾的操作
除了一些最簡單的修改,你應該備有回滾方案。當你進行改動時想好了回滾方案嗎?有很多辦法可以在修改的途徑中留下技術(shù)上的“面包屑”,這能夠讓你隨時回到你開始的原點。備份你需要編輯的文件,可能是你記不住的一些復雜的配置文件。記錄下你遇到的問題。在進行生產(chǎn)環(huán)境之前先在測試環(huán)境下測試,在你繼續(xù)之前確保所有的修改都是合理的。
提前計劃好需要改動的地方,最好能夠采取同行評審的方式。另外一雙眼睛可能可以看到你沒有考慮到的問題。
2. 凡事弄清楚根本原因
去挖掘你所碰到問題的根本原因。當懷疑的時候,用“五個為什么”原則。我的服務器宕了,為什么?是因為內(nèi)存不夠。為什么不夠?因為其中一個進程“瘋了”。為什么“瘋了”?因為它進入到循環(huán)中。為什么進入?因為配置文件中有錯誤。為什么有錯誤?因為我在周五晚上離開之前修改了文件,但是忘了測試確保所有一切都可以正常工作。
3. 定期實踐災備方案,確保備份數(shù)據(jù)可用
實踐災備方案在必要的時候能夠順手使用。如果你不實踐,有兩種可能會發(fā)生。第一,你沒有信心你的方案是否有用,第二,你可能會不確定你所要采取的措施。比如說,你需要遷移數(shù)據(jù)庫到一個遠程站點。你是否知道你要運行的命令?準備好數(shù)據(jù)備份了嗎?還是需要去創(chuàng)建備份?你是否知道遷移文件需要多久?你是否會準備好遠程啟動數(shù)據(jù)庫?你是否有一套測試來檢驗其能夠很好地運行?
4. 不要依賴沒有完整測試過的腳本
這很容易犯錯的。即使你已經(jīng)寫了幾十年的腳本也要去測試,特別是可能別人在某天會運行這些腳本。帶參數(shù)測試和不帶參數(shù)測試。模擬其他人可能會犯的錯誤??傊仨氁獪y試腳本。
5. 三次以上的重復和復雜的操作,必須自動化
在別名、函數(shù)和腳本中使用你最熟練的命令并且賦予它們有意義的命名。將那些復雜的過程寫進到腳本中,你就無需每次都要去想那些必要的步驟和復雜的命令。這樣你會在費時費力的工作中節(jié)省很多的時間和精力,并且在需要其他人為你工作時,讓你有更多的輕松時間。
6. 記錄你的工作,并建立文檔沉淀下來
用文檔記錄下你的日常工作。你做的事里面有哪些對別人來說不好理解?可能你要跑個腳本在日志文件中查找磁盤吃緊或者數(shù)據(jù)中心濕度太高的警告。
往腳本中添加注釋。你可能會覺得你用的那些命令很顯而易見,但是當你隔了一兩年沒?再回去用的時候就不會那么顯而易見了。不要為了簡潔而犧牲了可讀性。別人可能會要讀你的代碼。完整地寫下你所做的一切,別人能夠在你決定跳槽時候很好地接手你的工作。
7. 重視你犯過的錯誤,并找到避免再犯的方案
用你自己的方式去理解錯誤是避免再犯的唯一方法。重視你所做錯的并且注意那些多次犯錯的類型
可能是你忘了修改默認密碼從而密碼過期導致啟動的服務宕了;可能你沒有去驗證備份是否可用;也可能是當其他人離開公司時你忘了封鎖他們的賬號。不管什么問題,需要注意記錄你的疏忽并且找到一種可靠的方式來提醒自己容易忘記的事。
8. 跳出管理員角色思考問題
經(jīng)常問自己問題,比如“別人會不會誤用這個呢?”,“別人會不會弄壞這個呢?”,以及“這個服務會怎么收到攻擊?”給所有的腳本設(shè)置權(quán)限使除管理員以外其他人都無權(quán)查看。想一些防守措施能夠讓你減少很多痛苦。而且,對管理服務器來說,妄想癥是優(yōu)點。
9. 務必注意系統(tǒng)安全性
安全方面的投入是要與你所保護的數(shù)據(jù)成比例的。要知道你在保護什么,知道你所保護數(shù)據(jù)的“主人”。運用一些最佳的實踐方案,比如最小特權(quán)、定期補丁、監(jiān)控關(guān)鍵服務以及漏洞檢測。僅僅只運行你所需要的服務。時刻警惕任何強行闖入或者系統(tǒng)受損的跡象。準備好上報渠道能夠讓你知道什么時候以及向誰匯報這些系統(tǒng)受損現(xiàn)象。
10. 不要停止學習新技能
就像逆水行舟,不進則退。經(jīng)常找些新東西來學習。你將準備好承擔新的責任甚至可能在裁員中幸存。如果你沒有把握去學什么,那就去看心儀工作的職位介紹。?么讓自己符合標準?那些技術(shù)是高需求的嗎?你是否可以每天騰出一點點時間來學習新東西呢?
[摘自:運維派]
售前咨詢
售后咨詢
備案咨詢
二維碼
TOP