Linux sort,uniq,cut,wc命令详解

Rena ·

更新时间:2024-11-13

· 503 次阅读

　　sort 　　sort 命令对 File 参数指定的文件中的行排序，并将结果写到标准输出。如果 File 参数指定多个文件，那么 sort 命令将这些文件连接起来，并当作一个文件进行排序。　　sort语法　　[root@www~]# sort [-fbMnrtuk] [file or stdin] 　　选项与参数：　　-f ：忽略大小写的差异，例如 A 与 a 视为编码相同；　　-b ：忽略前面的空格符部分；　　-M ：以月份的名字来排序，例如 JAN， DEC 等等的排序方法；　　-n ：使用『纯数字』进行排序(默认是以文字型态来排序的)；　　-r ：反向排序；　　-u ：是 uniq ，相同的数据中，仅出现一行代表；　　-t ：分隔符，默认是用 [tab] 键来分隔；　　-k ：以那个区间 (field) 来进行排序的意思　　对/etc/passwd 的账号进行排序　　[root@www~]# cat /etc/passwd | sort 　　adm:x:3:4:adm:/var/adm:/sbin/nologin 　　apache:x:48:48:Apache:/var/www:/sbin/nologin 　　bin:x:1:1:bin:/bin:/sbin/nologin 　　daemon:x:2:2:daemon:/sbin:/sbin/nologin 　　sort 是默认以第一个数据来排序，而且默认是以字符串形式来排序，所以由字母 a 开始升序排序。　　/etc/passwd 内容是以 : 来分隔的，我想以第三栏来排序，该如何　　[root@www~]# cat /etc/passwd | sort -t ':' -k 3 　　root:x:0:0:root:/root:/bin/bash 　　uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin 　　operator:x:11:0:operator:/root:/sbin/nologin 　　bin:x:1:1:bin:/bin:/sbin/nologin 　　games:x:12:100:games:/usr/games:/sbin/nologin 　　默认是以字符串来排序的，如果想要使用数字排序：　　cat /etc/passwd | sort -t ':' -k 3n 　　root:x:0:0:root:/root:/bin/bash 　　daemon:x:1:1:daemon:/usr/sbin:/bin/sh 　　bin:x:2:2:bin:/bin:/bin/sh 　　默认是升序排序，如果要倒序排序，如下　　cat /etc/passwd | sort -t ':' -k 3nr 　　nobody:x:65534:65534:nobody:/nonexistent:/bin/sh 　　ntp:x:106:113::/home/ntp:/bin/false 　　messagebus:x:105:109::/var/run/dbus:/bin/false 　　sshd:x:104:65534::/var/run/sshd:/usr/sbin/nologin 　　如果要对/etc/passwd，先以第六个域的第2个字符到第4个字符进行正向排序，再基于第一个域进行反向排序。　　cat /etc/passwd | sort -t':' -k 6.2，6.4 -k 1r 　　sync:x:4:65534:sync:/bin:/bin/sync 　　proxy:x:13:13:proxy:/bin:/bin/sh 　　bin:x:2:2:bin:/bin:/bin/sh 　　sys:x:3:3:sys:/dev:/bin/sh 　　查看/etc/passwd有多少个shell:对/etc/passwd的第七个域进行排序，然后去重: 　　cat /etc/passwd | sort -t':' -k 7 -u 　　root:x:0:0:root:/root:/bin/bash 　　syslog:x:101:102::/home/syslog:/bin/false 　　daemon:x:1:1:daemon:/usr/sbin:/bin/sh 　　sync:x:4:65534:sync:/bin:/bin/sync 　　sshd:x:104:65534::/var/run/sshd:/usr/sbin/nologin 　　uniq 　　uniq命令可以去除排序过的文件中的重复行，因此uniq经常和sort合用。也是说，为了使uniq起作用，所有的重复行必须是相邻的。　　uniq语法　　[root@www~]# uniq [-icu] 　　选项与参数：　　[root@www~]# uniq [-icu] 　　选项与参数：　　-i ：忽略大小写字符的不同；　　-c ：进行计数　　-u ：只显示的行　　testfile的内容如下　　cat testfile 　　hello 　　world 　　friend 　　hello 　　world 　　hello 　　直接删除未经排序的文件，将会发现没有任何行被删除　　#uniq testfile 　　hello 　　world 　　friend 　　hello 　　world 　　hello 　　排序文件，默认是去重　　#cat words | sort |uniq 　　friend 　　hello 　　world排序之后删除了重复行，同时在行首位置输出该行重复的次数　　#sort testfile | uniq -c 　　1 friend 　　3 hello 　　2 world 　　仅显示存在重复的行，并在行首显示该行重复的次数　　#sort testfile | uniq -dc 　　3 hello 　　2 world 　　仅显示不重复的行　　sort testfile | uniq -u 　　friend 　　cut 　　cut命令可以从一个文本文件或者文本流中提取文本列。　　cut语法　　[root@www~]# cut -d'分隔字符' -f fields 用于有特定分隔字符　　[root@www~]# cut -c 字符区间用于排列整齐的信息　　选项与参数：　　-d ：后面接分隔字符。与 -f 一起使用；　　-f ：依据 -d 的分隔字符将一段信息分割成为数段，用 -f 取出第几段的意思；　　-c ：以字符 (characters) 的单位取出固定字符区间；　　[root@www~]# cut -d'分隔字符' -f fields 用于有特定分隔字符　　[root@www~]# cut -c 字符区间用于排列整齐的信息　　选项与参数：　　-d ：后面接分隔字符。与 -f 一起使用；　　-f ：依据 -d 的分隔字符将一段信息分割成为数段，用 -f 取出第几段的意思；　　-c ：以字符 (characters) 的单位取出固定字符区间；　　PATH 变量如下　　[root@www~]# echo $PATH 　　/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:/usr/X11R6/bin:/usr/games 　　# 1 | 2 | 3 | 4 | 5 | 6 | 7 　　[root@www~]# echo $PATH 　　/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:/usr/X11R6/bin:/usr/games 　　# 1 | 2 | 3 | 4 | 5 | 6 | 7 　　将 PATH 变量取出，我要找出第五个路径。　　#echo $PATH | cut -d ':' -f 5 　　/usr/local/bin 　　#echo $PATH | cut -d ':' -f 5 　　/usr/local/bin 　　将 PATH 变量取出，我要找出第三和第五个路径。　　#echo $PATH | cut -d ':' -f 3，5 　　/sbin:/usr/local/bin 　　将 PATH 变量取出，我要找出第三到后一个路径。　　echo $PATH | cut -d ':' -f 3- 　　/sbin:/usr/sbin:/usr/local/bin:/usr/X11R6/bin:/usr/games 　　将 PATH 变量取出，我要找出第一到第三个路径。　　#echo $PATH | cut -d ':' -f 1-3 　　/bin:/usr/bin:/sbin: 　　将 PATH 变量取出，我要找出第一到第三，还有第五个路径。　　echo $PATH | cut -d ':' -f 1-3，5 　　/bin:/usr/bin:/sbin:/usr/local/bin 　　实用例子:只显示/etc/passwd的用户和shell 　　#cat /etc/passwd | cut -d ':' -f 1，7 　　root:/bin/bash 　　daemon:/bin/sh 　　bin:/bin/sh 　　wc 　　统计文件里面有多少单词，多少行，多少字符。　　wc语法　　[root@www~]# wc [-lwm] 　　选项与参数：　　-l ：仅列出行；　　-w ：仅列出多少字(英文单字)；　　-m ：多少字符；　　默认使用wc统计/etc/passwd 　　#wc /etc/passwd 　　40 45 1719 /etc/passwd 　　40是行数，45是单词数，1719是字节数　　wc的命令比较简单使用，每个参数使用如下：　　#wc -l /etc/passwd #统计行数，在对记录数时，很常用　　40 /etc/passwd #表示系统有40个账户　　#wc -w /etc/passwd #统计单词出现次数　　45 /etc/passwd 　　#wc -m /etc/passwd #统计文件的字节数　　1719

Linux cut uniq wc sort

1024 个赞