其他分享
首页 > 其他分享> > text-processing – 自定义排序和删除双引号通过制表符分隔文件中多列的下划线连接

text-processing – 自定义排序和删除双引号通过制表符分隔文件中多列的下划线连接

作者:互联网

基于主题列顺序的自定义排序应为数学,英语,科学
 当我使用下面的命令

awk -F',' '{if (NR!=1) {print $2,$3,$5,$4}}' myfile.csv

在我的myfile.csv我得到这样但我想要其他方式

"101"    "Anna"    "Maths"    "V"
"102"    "Bob"    "Maths"    "V"
"103"    "Charles"    "Science"    "VI"
"104"    "Darwin"    "Science"    "VI"
"105"    "Eva"    "English"    "VII"

基于主题列顺序的排序应该是数学,英语,科学
删除双引号并用下划线连接
像这样

101_Anna_Maths_V
102_Bob_Maths_V
105_Eva_English_VII
103_Charles_Science_VI
104_Darwin_Science_VI

原始文件:cat myfile.csv的输出

Sl.No,RollNo,Names,Class,Subject
1,101,Anna,V,Maths
2,102,Bob,V,Maths
3,103,Charles,VI,Science
4,104,Darwin,VI,Science
5,105,Eva,VII,English

解决方法:

你的原始命令:

awk -F',' '{if (NR!=1) {print $2,$3,$5,$4}}' myfile.csv

您的命令以惯用的awk方式编写:

awk -F',' 'NR > 1 { print $2, $3, $5, $4 }' myfile.csv

在上面的命令中,修改为删除每个输入行的所有双引号,其中NR> 1. 1:

awk -F',' 'NR > 1 { gsub(/"/, ""); print $2, $3, $5, $4 }' myfile.csv

上面的命令,修改为输出_作为输出字段分隔符(OFS):

awk -F',' -vOFS='_' 'NR > 1 { gsub(/"/, ""); print $2, $3, $5, $4 }' myfile.csv

标签:python,awk,grep,csv,text-processing
来源: https://codeday.me/bug/20190816/1663246.html