Linux系統常見的一些死機原因總結!在排除了硬件故障/firmware版本/BIOS等等問題之外, Linux死機通常可能碰到如下幾種情況 1, 如果你的Linux死機的時候控制臺上有亂七八糟的字符。恭喜你,這種情況叫做oops. 通常是Linux kernel認為自己發生了異常造成的。 可以通過oops消息查找出錯的地方。 2, 如果你的機器僵死,那么問題麻煩了。這種時候,通常是Kernel出現了死鎖。Kernel不會知道自己死鎖了,所以不會在屏幕上顯示任何咚咚。 如果運氣好,此時Kernel也許可能能夠響應中斷。不管怎樣,你都無法進一步操作了。 3, 嚴格來說,這第三種情況不算死機,現象如下:輸入命令回車之后命令不能返回任何結果, 但是控制臺對回車可能有相應。但是命令無法結束,也不會有輸出結果。 但是可以換到下一個控制臺, 而且還可以繼續輸入命令,但是輸入命令之后還是沒有輸出。這種情況會有很多可能。通常是應用程序的系統調用長時間沒有返回或者是滿足不了應用的要求。 以上三種情況,system log的作用都不大。通常日志都不會紀錄。所以只能使用Kernel的Debug工具。 不過Linus比較狠,人說Kernel不需要Debug工具。所以kernel.org中的代碼是沒有debug工具的。不過目前絕大多數發行版的kernel都帶了debug工具,而且工具都不一樣。 通常進行kernel debug都需要在出現故障的時候采集vmcore. 就是把故障發生的時memory dump出來。(還記得Windows 藍屏的時候會出現1%-100%跳動的一個數字和c盤dump.sys文件, 這回知道干什么的了吧? ) 然后進行分析。也許你會擔心Linux死機了,還怎么dump memory啊,這個不用擔心,Kernel還是留了好幾條路子。其中一個是NMI。 那么到底怎么dump memory呢? 這里用REDHAT為例,RHEL3,RHEL4中都使用了netdump作為采集工具,RHEL5使用kdump作為采集工具。 采集完畢就可以對vmcore進行分析,步驟就不細說了。可以參考如下文章:http://people.redhat.com/anderson/crash_whitepaper/ 但是對于管理員來說,任何一個debug工具都需要代碼開發的經歷才能順利使用。 最后說一句,最近在壇中看到有人看到死機就往應用程序上懷疑。這是很好的自我批評的精神,要大力發揚。 那么,腳本,應用程序會不會導致死機? 當然,但是問題還是出在Kernel上。就比如,應用程序寫文件,系統可能會掛起在kernel中的文件系統代碼上。 以上Linux系統常見的一些死機原因總結!就是小編為大家收集整理的全部內容了,希望對大家有所幫助。如果您喜歡這篇文章,可以收藏或分享給您的小伙伴們吧!歡迎持續關注我們的后續更新。 |
免責聲明:本站部分文章和圖片均來自用戶投稿和網絡收集,旨在傳播知識,文章和圖片版權歸原作者及原出處所有,僅供學習與參考,請勿用于商業用途,如果損害了您的權利,請聯系我們及時修正或刪除。謝謝!
始終以前瞻性的眼光聚焦站長、創業、互聯網等領域,為您提供最新最全的互聯網資訊,幫助站長轉型升級,為互聯網創業者提供更加優質的創業信息和品牌營銷服務,與站長一起進步!讓互聯網創業者不再孤獨!
掃一掃,關注站長網微信