Linux awk less tail grep 使用

学习使用linux小工具

Linux awk less grep sed 等命令使用

shell demo


set time = 12:34:56
set hr = `echo $time | awk '{split($0,a,":" ); print a[1]}'` # = 12

set sec = `echo $time | awk '{split($0,a,":" ); print a[3]}'` # = 56

set hms = `echo $time | awk '{split($0,a,":" ); print a[1], a[2], a[3]}'`# = 12 34 56

# 获得5 - 10 line  并且用 `;` 分隔每一行  获得第个元素
sed -n '5,10p' xvideos.com-db.csv | awk '{split($0,a,";" ); print a[1]}'

sed -n '5,10p' xvideos.com-db.csv | awk '{split($0,a,";" ); print a[1] a[2]}'

#从第3000行开始，显示1000行。即显示3000~3999行
cat filename | tail -n +3000 | head -n 1000

#显示1000行到3000行

cat filename| head -n 3000 | tail -n +1000 

tail -n 1000 #：显示最后1000行

tail -n +1000 #：从1000行开始显示，显示1000行以后的

head -n 1000 #：显示前面1000行

tail -400f demo.log #监控最后400行日志文件的变化 等价与 tail -n 400 -f （-f参数是实时）

less demo.log #查看日志文件，支持上下滚屏，查找功能

uniq -c demo.log  #标记该行重复的数量，不重复值为1

grep 'INFO' demo.log     #在文件demo.log中查找所有包行INFO的行

grep -o 'order-fix.curr_id:\([0-9]\+\)' demo.log    #-o选项只提取order-fix.curr_id:xxx的内容（而不是一整行），并输出到屏幕上
grep -c 'ERROR' demo.log   #输出文件demo.log中查找所有包行ERROR的行的数量

# 输出demo.log中的某个日期中的ERROR的行
sed -n '/^2011-08-23.*ERROR/p' demolog.log

#指定执行的sed文件
sed -f demo.sed2 demo.log

demo.sed2


#n   #这一行用法和命令中的-n一样意思，就是默认不输出
#demo.sed2
#下面的一行是替换指令，就是把19位长的日期和INFO/ERROR,id,和后面的一截提取出来，然后用@分割符把这4个字段重新按顺序组合
s/^\([-\: 0-9]\{19\}\).*\(INFO\|ERROR\) .*order-fix.curr_id:\([0-9]\+\),\(.*$\)/\1@\3@\2@\4/p


#排序功能 -t表示用@作为分割符，-k表示用分割出来的第几个域排序(不要漏掉后面的,2/,3/,1，详细意思看下面的参考链接，这里不做详述)
sed -f test.sed demolog.log | sort -t@ -k2,2n -k3,3r -k1,1  #n为按数字排序，r为倒序


awk 'BEGIN{FS="@"} {print $2,$3}' demo.log_after_sort   #BEGIN中预处理的是，把@号作为行的列分割符,把分割后的行的第2，3列输出

对指定时间范围内的日志进行统计，包括输出INFO，ERROR总数，记录总数，每个订单记录分类统计


sed -f demo.sed demolog.log | sort -t@ -k2,2n -k3,3r -k1,1 | awk -f demo.awk

demo.awk


#下面的例子是作为命令行输入的，利用单引号作为换行标记，这样就不用另外把脚本写进文件调用了
awk '
BEGIN {
FS="@"
}

{
if ($3 == "INFO") {info_count++}
if ($3 == "ERROR") {error_count++}

}

END {
print "order total count:"NR           #NR是awk内置变量，是遍历的当前行号，到了END区域自然行号就等于总数了
printf("INFO count:%d ERROR count:%d\n",info_count,error_count)
} ' demo.log_after_sort


ll -lrth #:按照更改时间倒序排列，最新文件在下边

ll -lrSh #:按照文件大小倒序排列，最大文件在下边
grep --color # :高亮查询关键字

在大多数情况下` awk` 的 `print` 语句可以完成任务，但有时我们还需要更多。在那些情况下，awk 提供了两个我们熟知的函数 `printf()` 和 `sprintf()`。是的，如同其它许多 awk 部件一样，这些函数等同于相应的` C 语言函数`。`printf()` 会将格式化字符串打印到 stdout，而 sprintf()函数返回根据`printf`格式说明指定的格式化的字符串，它格式化数据但不输出数据。a w k提供函数`printf`，拥有几种不同的格式化输出功能。例如按列输出、左对齐或右对齐方式。

`printf()`函数基本语法是`printf()`（`格式控制符`，`参数`），格式控制字符通常在引号里。类似C语言，awk printf格式有如下：


%c //ASCII字符
%d //整数
%e //浮点数，科学记数法
%f //浮点数，例如（1 2 3 . 4 4）
%g //awk决定使用哪种浮点数转换 e或者f
%o //八进制数
%s //字符串
%x //十六进制数

下面来试试这些个格式：


echo 97 | awk '{printf("%c\n", $0)}'
A

类似`C语言`的格式化输出：


awk 'BEGIN{FS=":"}{printf("%-15s%s\n", $1, $3)}' group_file2
wireshark    987
usbmon       986
jackuser     985
vboxusers    984
aln         1001

`sprintf`()函数返回根据`printf`格式说明指定的格式化的字符串，它格式化数据但不输出数据。所以需要将`sprintf`返回的数据保存在变量里面再输出


awk 'BEGIN{FS=":";ORS=""}{var=sprintf("%s\n", $1);print var}' group_file2
wireshark
usbmon
jackuser
vboxusers
aln

清除 Javascript 脚本里面的所有console(包含即删除整行)


 sed -i "" "/console/d" app.txt # Mac （ Mac默认会要求你操作源文件的时候备份）

#  可以配合 find 使用
 find . -name "*.js"
 sed -i "/console/d" app.txt # Linux

#Mac 

find . -name "*.js" | awk '{print$1}' | xargs -L1  -I NAME sed -i ""  "/console/d" NAME

# 如果失败或者遇到问题
git checkout . && git clean -xdf

一个Linux 大佬 https://blog.csdn.net/imxiangzi/article/details/50387073

转载请注明出处，本文采用 CC4.0 协议授权