自动监控Web服务进程的shell脚本

发表于:2013-01-04来源:ITEYE作者:gaozhonghui点击数: 标签:web测试
自动监控Web服务进程的shell脚本。我们在线上跑的服务,不知道为什么最近有几回运行的进程莫名其妙的就没有了,就特意写了这个监控脚本,让其自动扫描服务,把访问不正常的服务,自动启动或重启服务,并且导出当时的线程使用情况,方便定位问题。

  我们在线上跑的服务,不知道为什么最近有几回运行的进程莫名其妙的就没有了,就特意写了这个监控脚本,让其自动扫描服务,把访问不正常的服务,自动启动或重启服务,并且导出当时的线程使用情况,方便定位问题。

  步骤:

  1.修改web服务名称和端口

  monitorTcp.sh

  2.修改扫描时间

  monitorServer.sh

  3.启动守候进程

  /usr/bin/nohup /bin/sh /home/Gzh/shell/monitorServer.sh 2>&1 > /dev/null &

  monitorServer.sh

Shell代码
复制代码
收藏代码

  #!/bin/sh

  ###########################################################

  #desc:后台守候检查服务是否正常

  #author:gaozhonghui

  #mail:toptreegzh@163.com

  #date:20121210

  ###########################################################

  while true

  do

  /bin/sh /home/Gzh/shell/monitorTcp.sh > /dev/null 2>&1

  sleep 10

  done

  #!/bin/sh

  ###########################################################

  #desc:后台守候检查服务是否正常

  #author:gaozhonghui

  #mail:toptreegzh@163.com

  #date:20121210

  ###########################################################

  while true

  do

  /bin/sh /home/Gzh/shell/monitorTcp.sh > /dev/null 2>&1

  sleep 10

  done

  monitorTcp.sh

Shell代码
复制代码
收藏代码

  #!/bin/sh

  #####################################################

  #desc:扫描后台服务器的应用服务器,若不能正常访问则重启

  #author:gaozhonghui

  #mail:toptreegzh@163.com

  #date:20121127

  #######################################################

  year=`date -d "today" +"%Y"`

  monthday=`date -d "today" +"%m"`

  date=$(date -d "today" +"%Y%m%d")

  #被监控服务器、端口列表

  #str = web服务文件夹:端口号

  server_all_list=(

  'www.test2.com:9090'

  'www.test.com:8090'

  )

  #应用服务器基路径

  serverBasePath="/web/webserver/jboss/"

  #日志路径

  logBasePath="/web/webserver/logs/$year/$monthday/"

  #获得监控服务PID

  function_getPID(){

  local PID=`ps -ef|grep $1|grep java |awk '{print $2}'`

  echo $PID

  }

  #dump 线程详细信息方便定位问题

  function_jstackinfo(){

  PID=`function_getPID $1`

  if [ x$PID != x"" ] ;then

  if [ ! -d ${logBasePath} ];then

  mkdir -p ${logBasePath}

  fi

  jstack -l ${PID} >> ${logBasePath}"jstack_$1_${date}.log"

  fi

  }

  #关闭应用服务

  function_shutdown(){

  local shutdownSh=${serverBasePath}$1"/bin/shutdown.sh"

  if [ -f $shutdownSh ];then

  local PID=`function_getPID $1`

  if [ x$PID != x"" ] ;then

  sh $shutdownSh > /dev/null 2>&1

  sleep 2

  fi

  local PID2=`function_getPID $1`

  if [ x$PID2 != x"" ];then

  kill -9 $PID2

  fi

  fi

  }

  #启动应用服务

  function_startup(){

  local startupSh=${serverBasePath}$1"/bin/startup.sh"

  if [ -f $shutdownSh ];then

  sh $startupSh > /dev/null 2>&1

  fi

  }

  #重启应用服务

  function_restart(){

  function_shutdown $1

  sleep 5

  function_startup $1

  }

  #扫描监控服务

  for server in ${server_all_list[@]}; do

  server_ip=127.0.0.1

  server_name=$( echo ${server} | awk -F ':' '{print $1}')

  server_port=$( echo ${server} | awk -F ':' '{print $2}')

原文转自:http://www.ltesting.net