学习啦 > 学习电脑 > 电脑故障 > 电脑故障现象 > 死机 >

Linux系统死机时解决方法

时间: 加城1195 分享

  宕机,指操作系统无法从一个严重系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重新启动计算机的现象。对于Linux系统,经常遇到的问题是系统可以正常运行一段时间,然后死机。如果不好再现问题,那么只有根据死机现场遗留的东西来进行分析了。

  方法步骤

  如果系统没有死干净,比如磁盘中断和文件系统是好的,那么也许能有日志信息保留在文件中,不过这样的好运气我是从来没有遇到过的。如果键盘中断还能响应 (按下Num Lock,可以看见键盘小灯亮灭),那么运气就算是足够好了,这时可以祭出 sysrq 大法,同时按下 Alt-Sysrq-T 获得进程系统堆栈信息,按下 Alt-Sysrq-M 获得内存分配信息,按下 Alt-Sysrq-W 获得当前寄存器信息。

  linux/Documentation/sysrq.txt。另外,最好关闭终端的自动 blank 功能,这样系统死的时候至少能从屏幕上看到一些信息。设置方法是:

  # echo 1 > /proc/sys/kernel/sysrq

  # setterm -blank

  这两个设置最好加到系统启动脚本中 (比如 /etc/rc.d/rc.local),保证每次启动都能得到运行。

  如果很不幸,键盘也死悄悄了,(更为不幸的是,这种情况很常见),那么也不是只有等死一个办法,这时可以用串口终端 (serial console)将系统信息发送

  到另一台系统上,这样可以通过对这些信息分析来定位问题。设置方法如下:

  准备工作

  1. 一台被监视的服务器,一台进行监视工作的PC。

  2. 一根串口直连线。

  配置

  1. 在服务器上,加入一个新的 grub 项目,增加核心参数 "console=ttyS0 console=tty1",如:

  kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root=LABEL=/1 console=ttyS0

  console=tty1

  2. 在服务器上,修改 /etc/sysconfig/syslog,加入 klogd 选项 "-c 7",保证更多内核信息得到输出。如:

  KLOGD_OPTIONS="-x -c 7"

  3. 重新启动服务器

  4. 用串口直连线连接两台机器,测试:

  1) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo hi > /dev/ttyS0",看在 PC 上是否有 "hi" 输出。

  2) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo w > /proc/sysrq-trigger",看 PC 上是否有相应内核信息输出。

  3) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "modprobe loop",看 PC 上是否有相应内核信息输出。

  5. 如果测试通过,那么在 PC 上运行:cat /dev/ttyS0 | tee /tmp/result

  另外,也可以用 Windows 超级终端获得串口信息。

  that's it.

  此外,一些核心支持 LKCD, netdump 等调试功能,也可以一试。

  剩下的,就只有靠经验和运气了,一般造成 Linux 系统死机的原因有:

  系统硬件问题 (SCSI 卡,主板,RAID 卡,网卡,硬盘...)

  外围硬件问题 (终端切换器,网络...)

  软件问题

  驱动 bug (去找更新的驱动试试)

  核心系统 bug (去 LKML 上看看,或换个核心试试)

  系统设置

  最后,google一把。有时候你可以直接输入 "Linux 系统死机怎么办?"

  PE6650 经常死机",看有没有人遇到过和你同样的问题。即使没有找到,也是一个有助于分析问题的信息,至少说明你的系统可能有和其他人不同之处。

  调查 Linux 系统死机问题,这既是科学又是艺术,牵扯到众多的硬件软件知识和经验,是一个不断学习的过程

  补充:预防死机的小技巧

  1、不要在同个硬盘安装多个操作系统

  2、不要一次性打开多个网页浏览

  3、在关闭电脑时,不要直接按电源按钮,否则会导致文件丢失,下次使用不能正常开机导致死机

  4、别让CPU、显卡超频,电脑温度过高

  5、及时清理机箱内的灰尘

  6、更换电脑硬件配置时,一定要插牢固

  7、不要使用来历不明的软件和光盘,以免传染病毒

  8、对系统文件或重要文件,最好使用隐含属性,以免因误操作而删除或覆盖这些文件

  9、在安装应用软件时,若提示是否覆盖当前文件,一定不要覆盖,通常当前的系统文件是最好的

  10、在运行大型应用软件时,不要在运行状态下退出以前运行的程序,否则会引起整个Windows崩溃

  相关阅读:死机宕机实例介绍

  自2015年3月11日下午5点起,据苹果用户反应AppStore、Mac AppStore、iTunesStore均为宕机状态,iTunes Connect无法登陆,iBooks商店没有响应。此外,iOS和Mac的应用商店也出现了大面积瘫痪。并显示为“所有用户不可用”。此次服务中断时间长达11个小时,甚为罕见。苹果公司在一份电子邮件声明中表示,服务中断是由于内部系统错误引起的。

  2014年1月21日,大量QQ用户反映,腾讯的第三方登录出现故障,不少第三方服务使用QQ都登录不上。不仅是第三方登录,QQ邮箱也无法正常使用。这次受影响范围很大,腾讯的第三方登录服务器出现了宕机。

  2010年6月30日消息,据国外媒体报道,亚马逊网站周二出现大范围宕机,持续时间超过3小时,在此期间用户只能浏览空白和部分产品页面。


Linux系统“死机”时解决方法相关文章:

1.Linux操作系统死机处理方法有哪些

2.电脑启动centos时就死机如何解决

3.linux shell退出命令

4.Mac虚拟机内存不足的解决办法

5.台式电脑启动不久后死机怎么办

4024301