1.了解机器连接数问题:1.2.3.4sshd的监听端口为22,如何统计1.2.3.4sshd服务器的各种连接状态(TIME_TIME_WAIT/CLOSE_WAIT/ESTESTABLESTABLISHESTABLISHED)个数的连接。参考答案:netstat-n|grep1.2.3.4:22|awk'/^tcp/{++S[$NF]}END{for(ainS)printa,S[a]}'netstat-lnpta|grepssh|egrep"TIME_WAIT|CLOSE_WAIT|ESTABLISHED"说明:netstat是一种常用的网络连接问题追踪工具,与grep/awk配合使用。2.从备份的日志中查询数据:从备份的log.bz2日志文件中,找出有多少条日志包含关键字1.2.3.4。参考答案:bzcatlog.bz2|grep'1.2.3.4'|wc-lbzgrep'1.2.3.4'日志.bz2|wc-llesslog.bz2|grep'1.2.3.4'|wc-l说明:联机日志文件一般在bz2压缩后保留。使用bzcat和bzgrep读取。3、备份服务技巧:打包备份/opt/web/www/目录,排除目录下的logs目录,打包后的文件存放在/opt/backup目录下。参考答案:tar-zcvf/opt/backup/log.tar.gz\-exclude/opt/web/www/logs/opt/web/www说明:项目需要打包迁移时,往往需要exclude日志目录,exclude是一个需要掌握的参数。4、查询线程数:查询服务器上运行的线程总数。当机器线程数超过阈值时,可以快速查出相关的进程和线程信息。参考答案:ps-eLf|wc-lpstree-p|wc-l5.磁盘告警,清除最大文件问题:找出服务器上运行tomcat产生的大量异常日志,找出文件,释放空间。参考答案:第一步,找到文件find/-typef-name"log"|xargsls-lSh|更多du-a/|排序-rn|grep日志|morefind/-name'log'-size+1000M-execdu-h{};第二步是清除文件。假设找到的文件是a.log,正确的做法应该是:echo"">a.log,文件空间会立即释放。很多同学:rm-rfa.log,虽然文件被删除了,但是由于tomcat服务还在运行,空间不会马上释放,需要重启tomcat才能释放空间。6、显示文件和过滤注释问题:显示server.conf文件,屏蔽#开头的注释行。参考答案:sed-n'/^[#]/!p'server.confsed-e'/^#/d'server.confgrep-v"^#"server.conf7.磁盘IO异常检查问题:磁盘IO如何检查异常,比如写慢或者电流大,请找出导致磁盘IO异常高的进程IO。参考答案:第一步:iotop-o查看当前写入磁盘的所有进程ID信息。第二步:如果此时所有写指标都很低,基本没有大写操作,需要检查磁盘本身。可以查看系统dmesg或者cat/var/log/message看是否有相关的磁盘异常错误,同时可以在慢写磁盘上touch一个空文件,看磁盘故障是否使不可能写。相关文章:linux下在线问题排查常用命令awkSed入门指南
