对数据文件操作命令

mac2026-02-02  1

1.分割文件

-l 以行数分割train.txt 保存为out.txtxx

split -l 128113 train.txt out.txt

-C 以文件大小分割train.txt 保存为out.txtxx

split -C 100M train.txt out.txt

2.按文件第一个数字升序排序

-n 以数字升序排序train.txt 保存为out.txtxx

sort -n train.txt > out.txt

3.提取前几列

$1表示前1列,提取train.txt前1列保存到out.txt

awk '{print $1}' train.txt >out.txt

4.在文件前加入一列指定字符串

在train.txt中,第一列添加train

sed -i 's/^/train &/g' train.txt

5.显示行号

从0开始编号,显示行号

:'<,'>s/^/\=line('.') - line("'<") + 0/

6.合并文件

将out1和out2合并为out3

cat out1.txt out2.txt >out3.txt

7.全文替换字符串

将文件中的abc全部替换为efg

:%s/abc/efg/g

8.nohup写入指定文件

默认写入nohup.out文件

nohup python run.py &

指定写入output文件

nohup python run.py>output 2>&1 &
最新回复(0)