aix性能监控脚本

发布时间: 2022-05-20 12:16:27

① 在AIX7如何使用自带的nmon监控并记录下5分钟内的资源使用情况并生成.nmon文件

AIX7应该集成了nmon，可以在任何目录使用。
1、建立一个路径，如/backup/nmon
2、nmon -f -c -i -M -t -s10 -c100 -m /backup/nmon
-s 10 表示每10秒采集一次数据。

-c 120 表示采集120次。120*10=1200秒，总共就是20分钟。
-f 表示生成的数据文件名中有时间
-m 表示生成的数据文件的路径
3、将生成的文件导入nmon analyser，转换成excel文件即可。

② 如何做一个linux查看cpu使用率的脚本

Linux性能监控工具 - Nmon安装及简介

tar.gz安装包安装方式：
1）用root用户登录到系统中；
2）建目录：#mkdir /nmon，作为Nmon的安装目录；
3）把nmon_linux_14g.tar.gz用ftp 上传到/nmon，或者通过其他介质拷贝到/nmon目录中；
4）进入./nmon目录下，cd ./nmon；
5）解压缩上传的压缩包，tar -xf nmon_linux_14g.tar.gz；
6）执行以下命令进行安装：
6.1） cp nmon_linux_x86_64 nmon；
6.2） cp nmon /bin/nmon
6.3） cp nmon /usr/bin/nmon
6.4） cp nmon /usr/local/bin/nmon
7）此时安装目录下回出现nmon文件，执行授权命令：#chmod +x nmon，完成安装。

【简介】：
nmon是一种在AIX与各种Linux操作系统上广泛使用的监控与分析工具，相对于其它一些系统资源监控工具来说，nmon所记录的信息是比较全面的，它能在系统运行过程中实时地捕捉系统资源的使用情况，并且能输出结果到文件中，然后通过nmon_analyzer工具产生数据文件与图形化结果。
nmon所记录的数据包含以下一些方面（也是我们在寻找问题过程中所关注的资源点）：
cpu占用率
内存使用情况
磁盘I/O速度、传输和读写比率
文件系统的使用率
网络I/O速度、传输和读写比率、错误统计率与传输包的大小
消耗资源最多的进程
计算机详细信息和资源
页面空间和页面I/O速度
用户自定义的磁盘组
网络文件系统
另外在AIX操作系统上，nmon还能监控到其他的一些信息，如异步I/O等。

③ 如何写一个shell脚本，用来检测 AIX系统是否有java环境。

Java-version
if[$?=0];then
echo"javaisinstalled"
else
echo"javaisnotinstalled"
fi

④ 大家在用什么监控软件监控AIX系统内存

AIX性能监控topas命令的详细解析操作系统的最全面动态，而又查看方便的性能视图就是topas命令了，下面以topas输出为例，对AIX系统的性能监控做简要描述，供运维工程师和系统管理员们参考。另：1.操作系统报错信息errpt查看。2.磁盘空间使用率采用df查看。这里主要分析性能问题。执行topas命令后如图所示：#topas区域1：反映CPU使用率和工作状况。Kernel：说明：操作系统的内核占用的CPU时间比率。操作系统作为基础软件，为应用程序支持和服务的同时，本身的运行也需要一定的CPU和内存资源(顺便提到内存资源，后面不再阐述这个内容了)，特别是内存资源，系统负载越重，相应的内核占用的CPU和内存资源也会越多。一般来说，内核占用的CPU时间不会太多的。一般小于应用的CPU使用率。User：说明：用户进程占用的CPU时间比率。这个为CPU使用率的关键数值。该使用率反映了用户在操作系统基础上运行的各种软件占用的CPU时间比率的总和。一般来说，如果User+Kernel连续大于70%，即可以认为系统可能存在CPU上的严重性能问题。Wait说明：CPU处于等待状态占CPU时间的比率。CPU的等待一般都为等待IO的响应，众所周知，目前计算机的主要瓶颈都在IO。应用程序执行的时候，需要读写磁盘等外部存储的数据，进程就会发起IO请求后等待IO完成。这个等待的过程占用CPU时间就是wait。当这个值很高的时候，就说明IO来不及响应很多的IO请求，这个时候，就只能从IO层面想办法优化了。Idle：说明：CPU空闲时间比率，这个就不用说了吧。就是CPU多少时间比率在闲着。CPU占用率出问题的主要可能原因：数据库服务器执行某一个sql或者存储过程(存储过程就是封装起来的sql程序包而已)需要大量的运算(一般为软件设计不合理)。或者应用程序中存在异常的地方，比如死循环，或者其他写程序时的逻辑错误导致。一般程序出错会导致一个CPU被全部占用，比如上述的20%占用的原因就是一个交易程序长期占用一个CPU全部时间片(系统共计5个CPU)。区域2：反映网络使用率的状况。Netwok;列出了网卡接口，KBPS即每秒钟多少KB(千字节) I-Pack每秒钟输入的数据包个数， O-Pack 每秒钟输出的数据包个数 KB-In每秒钟输入的字节数 KB-Out每秒钟输出的字节数。当我们发现网络拥堵时(出现网卡传输失效的报错，即网卡发送数据包失败。或者网络响应明显变慢的时候，如果CPU没有问题，那么请检查网络流量)发现某一个网卡的KBPS持续大于四位数，甚至五位数时(这个值要是网卡千兆还是百兆而定)。就要看看这个网卡是什么网卡，在处理什么业务了。在命令行执行netstat –in 查看对应en*接口的ip地址，通过ip地址看看是带官网卡还是生产服务网卡流量高。然后通过netstat –v en* 看看网卡的详细工作状态，出现了多少错包，冲突包，crc校验错或者网络重置过等信息。上述信息请详细看netstat –v en*的输出.如果出现大量crc，错包的话，可能网线有问题或者接触不良。如果上述均正常，而网络反应慢，则有可能是交换机拥堵。网络出现问题的可能原因：通过百兆的带管网加载大量数据(以前出现过)，大量队列的长时间的ftp传输，或者网线，交换机问题等。区域3：反映磁盘使用率的状况。Disk Busy%磁盘繁忙的百分比，即磁盘能满足的最大IOPS(每秒IO操作数)和当前IO数量的比率。其他的参数不再解释。望文生义即可。一般主要看磁盘的Busy%,当磁盘的Busy%持续大于85%时，即认为磁盘相当繁忙，已经可能要出问题了。当然，自己知道已经确定要产生大量IO操作的内容则不必在意，等其完成即可。出现问题的原因：应用服务器上面写日志进程或者查询日志的进程大量读写日志，导致磁盘繁忙率高，或者其他程序频繁读写磁盘导致。系统中hdisk0，hdisk1一般为系统盘，内置SCSI磁盘的相对IOPS是较低的。很容易满负荷运行。区域4：反映进程信息的状况。Name：进程的名称，即进程被执行时启动的二进制文件的名称。PID，进程的ID，进程的ID在系统中唯一，是我们了解跟踪进程信息重要数值。跟踪进程的CPU使用，磁盘IO读写，进程的内存和pagingspace占用等等均需要使用。CPU%进程占用CPU时间的比率。PgSp，进程占用的pagingspace的空间大小。Owner进程的属主，即由哪个操作用户用户启动了这个进程。在topas中，默认是列出占用cpu最高的前几个的进程信息供参考，如果前面第一区域的的CPU使用率持续高，就要看看这里是那个进程占用了大量的CPU资源，看看是哪个用户的进程，如果自己执行的，则杀掉或者找项目组解决即可。区域5：反映内存页面和换页空间信息的状况。换页空间即磁盘上的空间，在AIX操作系统中用来做内存空间使用。具体的理论就不再阐述了，详细信息请参阅操作系统内容。磁盘空间的速度当然相比内存，慢了不止10倍。所以，只是内存页面的一个暂时存放地，存放的还是那些长期不怎么用到的内存页面而已。如果paging大量出现，这时候就有麻烦了，说明：内存不够用了!该区域主要关注PageIn，PageOut如果这两个数值均大于三位数，并且长期大于这个数值，在技术上叫做内存颠簸，即不停的把内存页面换到磁盘空间上，又从磁盘空间把内存页面读进来，系统的内存使用效率变的极差，系统响应性能也变慢了。这个信息也可以用vmstat来看，pi和po列即与这里相对应。当然，如果只是有页面出，或者只有页面入，或者短时间的一些页面换入换出，则没有什么问题，关注一下即可。区域6：反映内存使用的信息。Real，MB操作系统实际拥有的内存的总量，单位是MB。%Comp，计算型内存占用比率，%Noncomp非计算型内存占用的比率。%Client也为非计算型内存，Noncomp包涵Client型内存，jfs文件系统使用的内存为noncomp，为了区分，jfs2和nfs使用的内存为Client。计算型内存就是进程实际使用的内存，例如我们写程序的时候malloc内存，或者在排序中使用了堆栈，进程中变量数值都需要在内存中保存，这部分内存为计算型内存(阐述不全面，仅供参考)。而操作系统在进行文件读写，需要的io缓冲区，或者我们在写程序的时候，打开文件，读写文件，均在文件缓冲区进行。(裸设备例外，CCCC的数据库采用RAC，数据的存储全部使用裸设备，在数据库服务器上，数据文件的缓冲在oracle的sga区的data buffer中(这个区域系统认为是计算型内存)，是不会占用非计算内存的。)导致内存出问题的可能原因很多。主要有：进程使用了更多的内存，例如，CCCC数据库服务器大量的oracle连接使用了很多内存，或者数据库中执行的某一个sql脚本或者存储过程的执行需要大量的内存来完成其操作(特例库中出现过这个情形，一个存储过程的执行导致操作系统内存被耗尽，pg也随之耗尽，操作系统自动执行PGSP_KILL,把该进程给干掉了，我也是第一次知道aix系统还有这个功能，呵呵)。第二个主要的问题就是内存泄漏，内存泄漏最简单的来说，就是申请了内存空间，使用后不再使用了，但是也没有释放。我们写程序的时候malloc，却没有free。这就导致了严重的问题，随着程序的执行，可用物理内存越来越少，最后就挂了，只好定期重启应用来解决。操作系统的内存换页机制导致了程序中不用的内存页面最后都跑到pg上面去了，换页空间会持续增长的。因应用导致系统问题就是这么产生的。区域7反映的是换页空间的使用率。如果换页空间的使用率长期增长，就说明系统内存不足，已经开始使用磁盘空间来缓冲内存了，如果PG使用率持续增长，或者大于50%，需要警惕(到50%在监控平台已经是主要告警啦!)，并马上提交系统管理员分析内存增长原因。如果该数值持续增长，系统一定会挂掉的!

⑤ 在AIX系统启动时就执行某个脚本要怎么设置

find
./
-name
"*.log"
-ctime
-2
-exec
rm
{}
\;
删除一天前创建的
.log
类型的文件。可以参考一下。

⑥ aix下如何用shell脚本根据进程的CPU占用率定时杀死进程

if test $# -gt 0 #0.0.5
then
for pname in $* #0.0.5
do
pid=`ps -e | grep $pname |sed -e '/grep/D' -e 's/^ *//' -e 's/ .*//'`
echo now killing pocess $pname pid is $pid kill -15 $pid
done
exit 0
else
echo 'usage: kpn <process_name_you_want_to_kill>'
exit 1
fi

⑦ aix查看cpu使用率如何编写脚本从早上8点到18点3分钟采样一次cpu使用率，并将使用率输出到文件中，谢谢

简单点的就用vmstat,，8点到18点是10个小时，3分钟采样一次一个小时是60/3=20次，10个小时共200次，设个cron job每天8点跑这个命令: vmstat 180 200 > /tmp/CPUUsage_$(date +%Y%m%d).log

用sar的话可以统计一段时间里面的情况，用nmon的就是比较全面，还可以生成趋势图，自己man或上网查查资料。

⑧ aix shell脚本对某个目录监控

#!/bin/sh
date=`date +%Y%m%d`
find /ftpdata/hjjk/ftp_down/hospital_register -name \
scoure*$date.txt \
chenggong*$date.txt \
quxiao*$date.txt \
user-$date.txt \
yytable-$date.txt \
yymsg-$date.txt \
>result 2>/dev/null
if [ $? -eq 0 ]
then
case file in
"scoure*$date.txt")
cat -n scoure*$date.txt | grep 12 | grep 1\^abc\^2\^abcd \
2>/dev/null
if [ $? -ne 0 ]
then echo "soure*$date.txt is not nomal"
else echo "soure*$date.txt is nomal"
fi
;;
"chenggong*$date.txt")
cat -n chenggong*$date.txt | grep 17 | grep 1\^abc\^2\^abcd \
2>/dev/null && \
cat -n chenggong*$date.txt | grep 17 | grep 1\^abc\^2\^abcd \
2>/dev/null
if [ $? -ne 0 ]
then echo "chenggong*$date.txt is not nomal"
else echo "chenggong*$date.txt is nomal"
fi
;;
"quxiao*$date.txt")
cat -n quxiao*$date.txt | grep 18 | grep 1\^abc\^2\^abcd \
2>/dev/null
if [ $? -ne 0 ]
then echo "quxiao*$date.txt is not nomal"
else echo "quxiao*$date.txt is nomal"
fi
;;
"user-$date.txt")
cat -n user-$date.txt | grep 10 | grep 1\^abc\^2\^abcd \
2>/dev/null && \
cat -n user-$date.txt | grep 9 | grep 1\^abc\^2\^abcd \
2>/dev/null
if [ $? -ne 0 ]
then echo "user-$date.txt is not nomal"
else echo "user-$date.txt is nomal"
fi
;;
"yytable-$date.txt")
cat -n yytable-$date.txt | grep 3 | grep 1\^abc\^2\^abcd \
2>/dev/null
if [ $? -ne 0 ]
then echo "yytable-$date.txt is not nomal"
else echo "yytable-$date.txt is nomal"
fi
;;
"yymsg-$date.txt")
cat -n yymsg-$date.txt | grep 14 | grep 1\^abc\^2\^abcd \
2>/dev/null
if [ $? -ne 0 ]
then echo "yymsg-$date.txt is not nomal"
else echo "yymsg-$date.txt is nomal"
fi
esac

else
echo "file not find"
fi
rm -rf result

⑨ 哪个工具可以监控ibm aix主机的性能

AIX的性能工具有很多，比如vmstat、topas等等，但是如果要全面和实时的监控其性能数据，一般用户都是选择第三方开发的专用系统。
当然，第三方的系统都非常贵，AIX自带的工具可以满足基本的性能检测要求。

⑩ 如何在LoadRunner中监控AIX的性能数据

2.查找到rstatd，将该行的注释去掉，然后保存退出。（在出现的界面中敲键盘：/rstatd 命令解释：在打开的文档中查找“rstatd”，接下来继续敲键盘：x 命令解释：删除当前字符，在这里为删除rstatd命令前的“#”，继续敲键盘：:wq） 3.重新启动服务 refresh –s inetd 4.确认系统是否已经启动了rstatd守护进程 rpcinfo -p 这样使用loadrunner就可以监视AIX系统的性能情况了。另外，有朋友问：rstatd进程是否需要其他服务的支持。

阅读全文

热点内容

java返回this 发布：2025-10-20 08:28:16 浏览：1093

制作脚本网站发布：2025-10-20 08:17:34 浏览：1371

python中的init方法发布：2025-10-20 08:17:33 浏览：1058

图案密码什么意思发布：2025-10-20 08:16:56 浏览：1234

怎么清理微信视频缓存发布：2025-10-20 08:12:37 浏览：1102

c语言编译器怎么看执行过程发布：2025-10-20 08:00:32 浏览：1454

邮箱如何填写发信服务器发布：2025-10-20 07:45:27 浏览：658

shell脚本入门案例发布：2025-10-20 07:44:45 浏览：554

怎么上传照片浏览上传发布：2025-10-20 07:44:03 浏览：1230

python股票数据获取发布：2025-10-20 07:39:44 浏览：1256

aix性能监控脚本

与aix性能监控脚本相关的资讯