背景

上一篇文章讲解了如何处理服务器日志文件过大导致的磁盘空间不足,链接为:情景 linux--如何解决服务器日志过多导致的磁盘空间不足?。由于篇幅的原因,并没有给出实际的操作,所以有了本实践篇。

其实,解决服务器日志文件过大导致的磁盘空间不足有许多种方法,不再赘述。本文及前文的重点在于,在文中所述的特殊场景下,所体现出来的 linux 知识点及解决方案。

实例

承接上文,我们只需关注/opt 目录的磁盘占用情况即可。

使用dudf命令查看/opt 目录的磁盘使用情况:

df -lh
Filesystem                     Size  Used Avail Use% Mounted on
/dev/mapper/cl-root             92G   11G   81G  12% /
devtmpfs                       7.8G     0  7.8G   0% /dev
tmpfs                          7.8G     0  7.8G   0% /dev/shm
tmpfs                          7.8G   82M  7.7G   2% /run
tmpfs                          7.8G     0  7.8G   0% /sys/fs/cgroup
/dev/sda1                     1014M  138M  877M  14% /boot
/dev/mapper/vg_data2-lv_data2  200G   20G  181G  10% /opt
sudo du -sh /opt
20G /opt

由上可知,df 和 du 得到的/opt 的磁盘占用空间基本一致;这也是理论篇提到的正常情况下

为了让磁盘的使用情况更加明显,在/opt 目录下创建一个 20G 的大文件:

sudo fallocate -l 20G /opt/some_server.logfile
ls -l /opt/some_server.logfile                             
-rw-r--r-- 1 root root 21474836480 Jun 30 12:34 /opt/some_server.logfile

此时,再次查看磁盘使用情况:

df -lh
Filesystem                     Size  Used Avail Use% Mounted on
/dev/mapper/cl-root             92G   11G   81G  12% /
devtmpfs                       7.8G     0  7.8G   0% /dev
tmpfs                          7.8G     0  7.8G   0% /dev/shm
tmpfs                          7.8G   82M  7.7G   2% /run
tmpfs                          7.8G     0  7.8G   0% /sys/fs/cgroup
/dev/sda1                     1014M  138M  877M  14% /boot
/dev/mapper/vg_data2-lv_data2  200G   40G  161G  20% /opt

sudo du -sh /opt

40G /opt

由上可知,df 和 du 得到的/opt 的磁盘占用空间基本一致,这依然是理论篇提到的正常情况下

新开一个终端窗口,使用cat命令向some_server.logfile文件中追加内容:

sudo cat >> /opt/some_server.logfile

这时,命令挂起,等待你输入要追加的内容。其实,这里并不需要真的输入内容,保持现状即可。这一步是为了让程序模拟理论篇中提到的:

当一个应用程序正在写一个大文件的时候,虽然我们可以对这个文件进行删除或挪走,但应用程序依然占有着句柄,并根据句柄所指磁盘位置直接写磁盘,而不检查该文件是否存在。

在原来的终端窗口,删除some_server.logfile文件:

sudo rm /opt/gentoo_root.img

此时,再次查看磁盘空间:

sudo du -sh /opt   
20G /opt
df -lh
Filesystem                     Size  Used Avail Use% Mounted on
/dev/mapper/cl-root             92G   11G   81G  12% /
devtmpfs                       7.8G     0  7.8G   0% /dev
tmpfs                          7.8G     0  7.8G   0% /dev/shm
tmpfs                          7.8G   82M  7.7G   2% /run
tmpfs                          7.8G     0  7.8G   0% /sys/fs/cgroup
/dev/sda1                     1014M  138M  877M  14% /boot
/dev/mapper/vg_data2-lv_data2  200G   40G  161G  20% /opt

这就是理论篇中提到的特殊情况了。

解决删除文件,但空间未释放的问题

这时,我们将追加文件的进程结束掉,再次查看磁盘空间,磁盘占用恢复正常:

sudo du -sh /opt                                                                 
20G /opt
df -lh
Filesystem                     Size  Used Avail Use% Mounted on
/dev/mapper/cl-root             92G   11G   81G  12% /
devtmpfs                       7.8G     0  7.8G   0% /dev
tmpfs                          7.8G     0  7.8G   0% /dev/shm
tmpfs                          7.8G   82M  7.7G   2% /run
tmpfs                          7.8G     0  7.8G   0% /sys/fs/cgroup
/dev/sda1                     1014M  138M  877M  14% /boot
/dev/mapper/vg_data2-lv_data2  200G   20G  181G  10% /opt

事实上,出现此类问题时,应该使用lsof | grep deleted命令查看:

当有进程打开某文件时文件被删除,就会将该文件标记为 deleted:

sudo lsof | grep deleted | grep some_server.logfile
sudo      19134                root    1w      REG                8,1 21474836480     887685 /opt/some_server.logfile (deleted)
cat       19135                root    1w      REG                8,1 21474836480     887685 /opt/some_server.logfile (deleted)

第二列为进程 id,kill -9 杀掉即可。

最佳方案

如果我们在最初出现磁盘空间不足的时候,不删除日志,而是清除其内容,情形则完全不同。

创建 20G 的大文件后的磁盘空间状况:

sudo du -sh /opt
40G /opt
df -lh   
Filesystem                     Size  Used Avail Use% Mounted on
/dev/mapper/cl-root             92G   11G   81G  12% /
devtmpfs                       7.8G     0  7.8G   0% /dev
tmpfs                          7.8G     0  7.8G   0% /dev/shm
tmpfs                          7.8G   82M  7.7G   2% /run
tmpfs                          7.8G     0  7.8G   0% /sys/fs/cgroup
/dev/sda1                     1014M  138M  877M  14% /boot
/dev/mapper/vg_data2-lv_data2  200G   40G  161G  20% /opt

同上,新开一个终端窗口,使用命令向some_server.logfile文件中追加内容。

在原终端里用命令清空文件some_server.logfile的原有内容:

sudo echo "this will be the 1st line." > some_server.logfile

查看文件内容:

cat some_server.logfile 
this will be the 1st line.

再查看磁盘空间:

sudo du -sh /opt
20G /opt

df -lh
Filesystem                     Size  Used Avail Use% Mounted on
/dev/mapper/cl-root             92G   11G   81G  12% /
devtmpfs                       7.8G     0  7.8G   0% /dev
tmpfs                          7.8G     0  7.8G   0% /dev/shm
tmpfs                          7.8G   82M  7.7G   2% /run
tmpfs                          7.8G     0  7.8G   0% /sys/fs/cgroup
/dev/sda1                     1014M  138M  877M  14% /boot
/dev/mapper/vg_data2-lv_data2  200G   20G  181G  10% /opt

而此时追加文件的命令窗口,依然等待着输入要追加的内容,不妨输入几行:

a

查看文件内容,已经有了新追加的内容,因而可以达到无需重启服务解决此问题的效果。

cat /opt/some_server.logfile 
this will be the 1st line.
2nd line
3rd line
line 4:1+2+3+_4
line 5: whatever


↙↙↙阅读原文可查看相关链接,并与作者交流