情景

在 linux,如果希望快速得到一个文件的行数,我想wc -l一定会被优先想到。那么,它真的是用来统计文件行数的么?

查看如下文件:

$ cat a.txt 

结果:

1
2
3

尝试查看行数:

$ wc -l a.txt 
3 a.txt

如此看来,wc -l可以统计文件行数。

再看另外一个例子:

$ cat b.txt 
1
2
3
4$

结果中的$并不是 b.txt 文件的内容,而是 b.txt 的最后一行没有换行,所以和 linux 的命令提示符显示在了同一行上。

尝试查看行数:

$ wc -l b.txt 
3 b.txt

结果却是 3 行。

为了看清楚两个文件的内容,使用od -tc命令查看:

$ cat a.txt | od -tc
0000000   1  \n   2  \n   3  \n
0000006

$ cat b.txt | od -tc
0000000   1  \n   2  \n   3  \n   4
0000007

可见,在 b.txt 中,数字 4 后面没有\n 字符。

结论

现在应该弄清楚wc -l命令的含义了吧?

wc -l原本就不是用来查看行数的,而是用来查看文件的 newline 的数量的。

其实,在 wc 的 man 手册中说的很清楚:

$ man wc
NAME
       wc - print newline, word, and byte counts for each file
...

DESCRIPTION
       Print  newline, word, and byte counts for each FILE, and a total line if more than one FILE is specified.  With
       no FILE, or when FILE is -, read standard input.
...
       -l, --lines
              print the newline counts

而在 linux 系统中,newline 字符就是\n字符。

扩展知识

强烈建议亲手执行一遍上述命令。

你可能会问,如何做到让文件的最后一行内容不带 newline 字符呢?

使用echo -n即可:

$ man echo
NAME
       echo - display a line of text

...

       -n     do not output the trailing newline

echo -n将不输出尾部的 newline 字符。

举例:

$ echo -n "1" > c.txt
$ cat c.txt | od -tc 
0000000   1
0000001

$ wc -l c.txt 
0 c.txt

你看,文件中明明有内容,用wc -l得到的结果却是 0——曾经让我困惑的真实经历。


↙↙↙阅读原文可查看相关链接,并与作者交流