在 linux,如果希望快速得到一个文件的行数,我想wc -l
一定会被优先想到。那么,它真的是用来统计文件行数的么?
查看如下文件:
$ cat a.txt
结果:
1
2
3
尝试查看行数:
$ wc -l a.txt
3 a.txt
如此看来,wc -l
可以统计文件行数。
再看另外一个例子:
$ cat b.txt
1
2
3
4$
结果中的$
并不是 b.txt 文件的内容,而是 b.txt 的最后一行没有换行,所以和 linux 的命令提示符显示在了同一行上。
尝试查看行数:
$ wc -l b.txt
3 b.txt
结果却是 3 行。
为了看清楚两个文件的内容,使用od -tc
命令查看:
$ cat a.txt | od -tc
0000000 1 \n 2 \n 3 \n
0000006
$ cat b.txt | od -tc
0000000 1 \n 2 \n 3 \n 4
0000007
可见,在 b.txt 中,数字 4 后面没有\n 字符。
现在应该弄清楚wc -l
命令的含义了吧?
wc -l
原本就不是用来查看行数的,而是用来查看文件的 newline 的数量的。
其实,在 wc 的 man 手册中说的很清楚:
$ man wc
NAME
wc - print newline, word, and byte counts for each file
...
DESCRIPTION
Print newline, word, and byte counts for each FILE, and a total line if more than one FILE is specified. With
no FILE, or when FILE is -, read standard input.
...
-l, --lines
print the newline counts
而在 linux 系统中,newline 字符就是\n
字符。
强烈建议亲手执行一遍上述命令。
你可能会问,如何做到让文件的最后一行内容不带 newline 字符呢?
使用echo -n
即可:
$ man echo
NAME
echo - display a line of text
...
-n do not output the trailing newline
echo -n
将不输出尾部的 newline 字符。
举例:
$ echo -n "1" > c.txt
$ cat c.txt | od -tc
0000000 1
0000001
$ wc -l c.txt
0 c.txt
你看,文件中明明有内容,用wc -l
得到的结果却是 0——曾经让我困惑的真实经历。