Linux系统下使用top命令的建议与技巧_Linux命令

本文介绍的内容能提升你对 top 命令的认知和使用，以下为你讲解怎样在 Linux 系统下更好的使用 top 命令。

初识top命令

尝试找出你的机器正在运行什么程序，以及哪个进程耗尽了内存导致系统非常非常慢，这是 top 命令所能胜任的工作。

top 是一个非常有用的程序，其作用类似于 Windows 任务管理器或 MacOS 的活动监视器。在 *nix 机器上运行 top 将实时显示系统上运行的进程的情况。

$ top

取决于你运行的 top 版本，你会看到类似如下内容：

Linux系统下使用top命令的建议与技巧

你所用的 top 版本可能跟这个看起来不一样，特别是在显示的列上。

如何阅读输出的内容

你可以根据输出判断你正在运行的内容，但尝试去解释结果你可能会有些困惑。

前几行包含一堆统计信息（详细信息），后跟一个包含结果列的表（列）。让我们从后者开始吧。

列

这些是系统正在运行的进程。默认按 CPU 使用率降序排序。这意味着在列表顶部的程序正使用更多的 CPU 资源并对你的系统造成更重的负担。对于资源使用而言，这些程序是字面上的消耗资源最多的（top）进程。不得不说，top 这个名字起得很妙。

最右边的 COMMAND 一列报告进程名（启动它们的命令）。在这个例子里，进程名是 bash（一个我们正在运行 top 的命令解释器）、flask（一个 Python 写的 web 框架）和 top 自身。

其它列提供了关于进程的有用信息：

1.PID：进程 ID，一个用来定位进程的唯一标识符

2.USER：运行进程的用户

3.PR：任务的优先级

4.NI：Nice 值，优先级的一个更好的表现形式

5.VIRT：虚拟内存的大小，单位是 KiB（kibibytes）

6.RES：常驻内存大小，单位是 KiB（物理内存和虚拟内存的一部分）

7.SHR：共享内存大小，单位是 KiB（共享内存和虚拟内存的一部分）

8.S：进程状态，一般 I 代表空闲，R 代表运行，S 代表休眠，Z 代表僵尸进程，T 或 t 代表停止（还有其它更少见的选项）

9.%CPU：自从上次屏幕更新后的 CPU 使用率

10.%MEM：自从上次屏幕更新后的 RES 常驻内存使用率

11.TIME+：自从程序启动后总的 CPU 使用时间

12.COMMAND：启动命令，如之前描述那样

确切知道 VIRT，RES 和 SHR 值代表什么在日常操作中并不重要。重要的是要知道 VIRT 值最高的进程就是内存使用最多的进程。当你在用 top 排查为什么你的电脑运行无比卡的时候，那个 VIRT 数值最大的进程就是元凶。如果你想要知道共享内存和物理内存的确切意思，请查阅 top 手册的 Linux Memory Types 段落。

是的，我说的是 kibibytes 而不是 kilobytes。通常称为 kilobyte 的 1024 值实际上是 kibibyte。希腊语的 kilo 意思是一千（例如一千米是 1000 米，一千克是 1000 克）。Kibi 是 kilo 和 binary 的合成词，意思是 1024 字节（或者 2^10 ）。但是，因为这个词很难说，所以很多人在说 1024 字节的时候会说 kilobyte。top 试图在这里使用恰当的术语，所以按它说的理解就好。

屏幕更新说明

实时屏幕更新是 Linux 程序可以做的非常酷的事之一。这意味着程序能实时更新它们显示的内容，所以看起来是动态的，即使它们用的是文本。非常酷！在我们的例子中，更新时间间隔很重要，因为一些统计数据（%CPU 和 %MEM）是基于上次屏幕更新的数值的。

因为我们运行在一个持久性的程序中，我们就可以输入一些命令来实时修改配置（而不是停止应用，然后用一个不同的命令行选项再次运行）。

按下 h 调用帮助界面，该界面也显示了默认延迟（屏幕更新的时间间隔）。这个值默认（大约）是 3 秒，但你可以输入 d（大概是 delay 的意思）或者 s（可能是 screen 或 seconds 的意思）来修改它。

细节

在进程列表上面有一大堆有用的信息。有些细节看起来有点儿奇怪，让人困惑。但是一旦你花点儿时间来逐个过一遍，你会发现，在紧要关头，这些是非常有用的。

第一行包含系统的大致信息：

1.top：我们正在运行 top！你好！top！

2.XX:YY:XX：当前时间，每次屏幕更新的时候更新

3.up（接下去是 X day, YY:ZZ）：系统的 uptime，或者自从系统启动后已经过去了多长时间

4.load average（后跟三个数字）：分别是过去一分钟、五分钟、15 分钟的系统负载

第二行（Task）显示了正在运行的任务的信息，不用解释。它显示了进程总数和正在运行的、休眠中的、停止的进程数和僵尸进程数。这实际上是上述 S（状态）列的总和。

第三行（%Cpu(s)）显示了按类型划分的 CPU 使用情况。数据是屏幕刷新之间的值。这些值是：

1.us：用户进程

2.sy：系统进程

3.ni：nice 用户进程

4.id：CPU 的空闲时间，这个值比较高时说明系统比较空闲

5.wa：等待时间，或者消耗在等待 I/O 完成的时间

6.hi：消耗在硬件中断的时间

7.si：消耗在软件中断的时间

8.st：“虚拟机管理程序从该虚拟机窃取的时间”

你可以通过点击 t（toggle）来展开或折叠 Task 和 %Cpu(s) 行。

第四行（Kib Mem）和第五行（KiB Swap）提供了内存和交换空间的信息。这些数值是：

1.总内存容量

2.已用内存

3.空闲内存

4.内存的缓冲值

5.交换空间的缓存值

默认它们是用 KiB 为单位展示的，但是按下 E（扩展内存缩放 extend memory scaling）可以轮换不同的单位：KiB、MiB、GiB、TiB、PiB、EiB（kilobytes、megabytes、gigabytes、terabytes、petabytes 和 exabytes）

top 用户手册有更多选项和配置项信息。你可以运行 man top 来查看你系统上的文档。

两个top的替代品

你不必总是用 top 查看系统状态。你可以根据你的情况用其它工具来协助排查问题，尤其是当你想要更图形化或更专业的界面的时候。

一、htop（参考htop命令_Linux htop命令使用详解：用彩色标识出处理器、swap和内存状态）

htop 很像 top，但是它带来了一些非常有用的东西：它可以以图形界面展示 CPU 和内存使用情况。

Linux系统下使用top命令的建议与技巧

这是我们在刚才运行 top 的同一环境中 htop 的样子。显示更简洁，但功能却很丰富。

任务统计、负载、uptime 和进程列表仍然在，但是它有了漂亮、彩色、动态的每核 CPU 使用情况，还有图形化的内存使用情况。

以下是不同颜色的含义（你也可以通过按下 h 来获得这些信息的帮助）。

CPU 任务优先级或类型：

1.蓝色：低优先级

2.绿色：正常优先级

3.红色：内核任务

4.蓝色：虚拟任务

5.条状图末尾的值是已用 CPU 的百分比

内存：

1.绿色：已经使用的内存

2.蓝色：缓冲的内存

3.黄色：缓存内存

4.条状图末尾的值显示已用内存和总内存

如果颜色对你没用，你可以运行 htop -C 来禁用它们；那样 htop 将使用不同的符号来展示 CPU 和内存类型。

它的底部有一组激活的快捷键提示，可以用来操作过滤结果或改变排序顺序。试着按一些快捷键看看它们能做什么。不过尝试 F9 时要小心，它会调出一个信号列表，这些信号会杀死（即停止）一个过程。我建议在生产环境之外探索这些选项。

htop 的作者 Hisham Muhammad（是的，htop 的名字就是源自 Hisham 的）在二月份的 FOSDEM 2018 做了一个简短的演讲。他阐述了 htop 不仅有简洁的图形界面，还有更现代的进程信息统计展示方式，这都是之前的工具（如 top）所不具备的。

二、docker stats

如果你在用 Docker，你可以运行 docker stats 来为容器状态生成一个有丰富上下文的界面。

这可能比 top 更有帮助，因为它不是按进程分类，而是按容器分类的。这点特别有用，当某个容器运行缓慢时，查看哪个容器耗资源最多比运行 top 再找到容器的进程要快。

借助于上面对 top 和 htop 术语的解释，你应该会更容易理解 docker stats 中的那些。

总结

如果你在 Linux 系统中正在使用 top 命令，不妨按上面的的建议与技巧操作，你会有意想不到的效果。

相关主题

top命令_Linux top命令使用详解：显示或管理执行中的程序