Linux 情景 linux--wc -l 是用来统计文件行数的吗?

stack · 2017年04月17日 · 最后由 stack 回复于 2017年04月19日 · 2067 次阅读

情景

在 linux,如果希望快速得到一个文件的行数,我想wc -l一定会被优先想到。那么,它真的是用来统计文件行数的么?

查看如下文件:

$ cat a.txt 

结果:

1
2
3

尝试查看行数:

$ wc -l a.txt 
3 a.txt

如此看来,wc -l可以统计文件行数。

再看另外一个例子:

$ cat b.txt 
1
2
3
4$

结果中的$并不是 b.txt 文件的内容,而是 b.txt 的最后一行没有换行,所以和 linux 的命令提示符显示在了同一行上。

尝试查看行数:

$ wc -l b.txt 
3 b.txt

结果却是 3 行。

为了看清楚两个文件的内容,使用od -tc命令查看:

$ cat a.txt | od -tc
0000000   1  \n   2  \n   3  \n
0000006

$ cat b.txt | od -tc
0000000   1  \n   2  \n   3  \n   4
0000007

可见,在 b.txt 中,数字 4 后面没有\n 字符。

结论

现在应该弄清楚wc -l命令的含义了吧?

wc -l原本就不是用来查看行数的,而是用来查看文件的 newline 的数量的。

其实,在 wc 的 man 手册中说的很清楚:

$ man wc
NAME
       wc - print newline, word, and byte counts for each file
...

DESCRIPTION
       Print  newline, word, and byte counts for each FILE, and a total line if more than one FILE is specified.  With
       no FILE, or when FILE is -, read standard input.
...
       -l, --lines
              print the newline counts

而在 linux 系统中,newline 字符就是\n字符。

扩展知识

强烈建议亲手执行一遍上述命令。

你可能会问,如何做到让文件的最后一行内容不带 newline 字符呢?

使用echo -n即可:

$ man echo
NAME
       echo - display a line of text

...

       -n     do not output the trailing newline

echo -n将不输出尾部的 newline 字符。

举例:

$ echo -n "1" > c.txt
$ cat c.txt | od -tc 
0000000   1
0000001

$ wc -l c.txt 
0 c.txt

你看,文件中明明有内容,用wc -l得到的结果却是 0——曾经让我困惑的真实经历。

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
共收到 7 条回复 时间 点赞

赞,这些基础知识的坑确实需要有深入的了解。

以后就靠你多给大家普及 bash 的基础知识了. 比如 xargs ps top 各种简单的循环判断. bash 还是挺实用的

好的。👌
大家有建议、想法、需求什么的,随便提哈。

stack 回复

脚本自动化还是挺关键实用的技能. 可惜一般人没意识到. 我以前在阿里的百技学院做过 Bash 的讲师.

见过大牛 orz

学习了🌷 送你一朵小花花

fsntester 回复

谢谢。😀

stack 情景 linux--如何快速生成大文件? 中提及了此贴 07月04日 12:23
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册