text-processing – 自定义排序和删除双引号通过制表符分隔文件中多列的下划线连接
作者:互联网
基于主题列顺序的自定义排序应为数学,英语,科学
当我使用下面的命令
awk -F',' '{if (NR!=1) {print $2,$3,$5,$4}}' myfile.csv
在我的myfile.csv我得到这样但我想要其他方式
"101" "Anna" "Maths" "V"
"102" "Bob" "Maths" "V"
"103" "Charles" "Science" "VI"
"104" "Darwin" "Science" "VI"
"105" "Eva" "English" "VII"
基于主题列顺序的排序应该是数学,英语,科学
删除双引号并用下划线连接
像这样
101_Anna_Maths_V
102_Bob_Maths_V
105_Eva_English_VII
103_Charles_Science_VI
104_Darwin_Science_VI
原始文件:cat myfile.csv的输出
Sl.No,RollNo,Names,Class,Subject
1,101,Anna,V,Maths
2,102,Bob,V,Maths
3,103,Charles,VI,Science
4,104,Darwin,VI,Science
5,105,Eva,VII,English
解决方法:
你的原始命令:
awk -F',' '{if (NR!=1) {print $2,$3,$5,$4}}' myfile.csv
您的命令以惯用的awk方式编写:
awk -F',' 'NR > 1 { print $2, $3, $5, $4 }' myfile.csv
在上面的命令中,修改为删除每个输入行的所有双引号,其中NR> 1. 1:
awk -F',' 'NR > 1 { gsub(/"/, ""); print $2, $3, $5, $4 }' myfile.csv
上面的命令,修改为输出_作为输出字段分隔符(OFS):
awk -F',' -vOFS='_' 'NR > 1 { gsub(/"/, ""); print $2, $3, $5, $4 }' myfile.csv
标签:python,awk,grep,csv,text-processing 来源: https://codeday.me/bug/20190816/1663246.html