Web服务器的急救措施 翁建元 2001年 38期 编者按:Web服务器一旦发生异常,任何一名网管都希望在最短的时间内解决问题,让我们来看看高手是如何做的,从中我们可以学到一些基本的技巧。   #11.服务器响应缓慢   如果服务器响应缓慢,需要做的第一件事情就是判断问题来自服务器还是网络,有一个工具就是Uptime软件。   Uptime会显示服务器的平均负载,如果最后的这个数字高于2或者3,问题的原因就是一些进程占用系统太多资源。如果这个数字不是很高,你就需要考虑网络的因素了。   负载过高时使用top命令来确定哪些进程在消耗系统资源。   top命令缺省显示10条进程,当然你可以使用top N来指定需要查看的进程数。   更加详细的进程列表可以使用ps -auxw命令。   比较Web进程的“硬”限制(Apache编译时的限制)和“软”限制(httpd.conf的限制),如果两者的数字接近,那么你就要考虑升级硬件或者重新编译Apache了。   #12.未授权登录   如果担心有非法用户闯入系统,最简单的办法就是用w命令来检查。   如果真的看到有非法用户在你的系统上,可以立即kill他的进程,例如用vipw命令把他的口令修改为“*”或者把shell改为/sbin/nologin。   #13.服务不能启动或者崩溃   如果Web服务器不能启动或者启动时崩溃,就需要使用apachectl命令来找原因。首先用apachectl configtest命令检查httpd.conf的合法性。但是apachectl并不是万能的。如果问题依然不能解决,我们就应该检查错误日志。另外,用apachectl检查/var/run/httpd.pid文件来找到原来的进程,如果进程号不同,则apachectl stop命令不会工作。在这种情况下就需要使用ps命令来kill对应的进程。   #14.网络检测   查找因为网络问题引起的原因时,第一个简单的命令就是ping。   如果ping的结果看起来很正常,或许就需要使用比较大的包来试一下,ping的缺省包大小为56字节,我们用-s指定包大小为2048字节来试一下。采用大的包之后,返回时间延长很正常,但是非常长的时间返回或者包丢失就显示网络有问题了。   #15.交叉信号   如果怀疑服务器和交换机之间的网络配置有问题,可以采用netstat -finet命令来显示打开的端口以及连机的外部服务。   如果你的服务器遭到攻击,就会显示内核的内存使用超常,可以采用netstat的-m参数来查看。   如果你发现httpd的负载不是很重,但是网络资源占用的内存还是很大的话,可以考虑关闭一些服务和端口。   #16.网络问题   如果网络发生了问题,就需要使用ifconfig命令来检查网卡是否正常。这个命令会显示网卡的IP地址、掩码、双工、速率等。   常见的问题是网卡的速率或者双工设置和交换机端口不一致。特别是设置了“autosense”选项,但是却没有成功,可以采用ifconfig down eth0 [options]来关闭。   #17.权限问题   有些稀奇古怪的问题很可能来自没有剩余空间。可以采用df命令来检查剩余的硬盘空间。一个简单的例子,就是PHP的session无效了,原因就是写入session的文件系统/tmp已经满了。   有些问题则是没有设置好权限,常见的问题是没有为CGI脚本设置x权限,没有为一些目录设置rx权限。   #18.常见的怀疑对象   如果有问题发生,其实第一件事就应该是检查系统日志/var/log/messages。   如果有些日志文件不能在/var/log/目录找到,可以查看/etc/syslog.conf的配置。   对于Apache来说,需要检查[apache_dir]/logs/error_log来确定不能启动的原因。   以上是笔者使用Web服务器应急措施的一些个人经验,希望能起到一些抛砖引玉的作用。