9久久伊人精品综合,亚洲一区精品视频在线,成 人免费va视频,国产一区二区三区黄网,99国产精品永久免费视频,亚洲毛片多多影院,精品久久久无码人妻中文字幕,无码国产欧美一区二区三区不卡
學習啦 > 學習電腦 > 操作系統 > Linux教程 > 如何快速刪除Linux文件中的重復數據行

如何快速刪除Linux文件中的重復數據行

時間: 孫勝652 分享

如何快速刪除Linux文件中的重復數據行

  Linux系統操作中,如果文件中的數據過多,想要刪除重復數據行是非常麻煩的,查找不方便,那么有什么方法能夠快速刪除文件重復數據行呢?下面學習啦小編就給大家介紹下如何刪除文件重復數據行,一起來看看吧。

  一、去掉相鄰重復的數據行

  代碼如下:

  $cat data1.txt | uniq

  輸出:

  beijing

  wuhan

  beijing

  wuhan

  二、去掉所有重復的數據行

  代碼如下:

  $cat data1.txt | sort | uniq

  注:

  只有uniq命令的話,只是把相鄰的重復的數據行去掉。

  如果先 sort 的話,就會把所有重復的數據行變成相鄰的數據行,再 uniq 的話,就去掉所有重復的數據行了。

  輸出:

  beijing

  wuhan

  附:data1.txt

  代碼如下:

  [root@syy ~]# cat data1.txt

  beijing

  beijing

  wuhan

  wuhan

  wuhan

  beijing

  beijing

  beijing

  wuhan

  wuhan

  注:在過濾日志中的IP地址很有用。

  Linux下刪除大數據文件中部分字段重復的行

  最近寫的一個數據采集程序生成了一個含有1千多萬行數據的文件,數據由4個字段組成,按照要求需要刪除第二個字段重復的行,找來找去linux下也沒找到合適的工具,sed/gawk等流處理工具只能針對一行一行處理,并無法找到字段重復的行。看來只好自己python一個程序了,突然想起來利用mysql,于是進行乾坤大挪移:

  1. 利用mysqlimport --local dbname data.txt導入數據到表中,表名要與文件名一致

  2. 執行下列sql語句(要求唯一的字段為uniqfield)

  代碼如下:

  use dbname;

  alter table tablename add rowid int auto_increment not null;

  create table t select min(rowid) as rowid from tablename group by uniqfield;

  create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;《/p》 《p》drop table tablename;

  rename table t2 to tablename;

  上面就是Linux刪除文件重復數據行的方法介紹了,本文介紹了多種情況下刪除文件重復數據行的方法,希望對你有所幫助。

312214 主站蜘蛛池模板: av在线播放无码线| 亚洲国产精品综合一区二区| 亚洲欧洲自拍拍偷午夜色| 亚洲国产精品一区二区三| 国产综合久久久久鬼色| 全球成人中文在线| 亚洲AV熟妇在线观看| 日韩人妻无码一区二区三区99 | 亚洲午夜福利AV一区二区无码 | 国产视频最新| 国产成人精品一区二区秒拍1o| 狠狠躁夜夜躁人人爽天天古典| 亚洲高清乱码午夜电影网| 国产午夜福利精品视频| 亚洲人午夜精品射精日韩| 国产高清一区二区三区视频 | 日韩无套无码精品| 国产精品中文字幕自拍| 欧洲国产成人久久精品综合| 国产精品午夜福利小视频| 国产美女裸身网站免费观看视频| 国产一区二区三区不卡视频| 亚洲AV国产福利精品在现观看| 亚洲色大成网站www在线| 在线看av一区二区三区| 巨爆乳中文字幕爆乳区| 亚洲欧洲精品成人久久曰| 亚洲国产日韩在线视频| 中文字幕无码中文字幕有码a| 宅男噜噜噜66在线观看| 成人午夜免费一区二区三区| 日韩成人一区二区二十六区 | 国产熟睡乱子伦午夜视频| 久久久久亚洲AV成人片一区| 丰满人妻AV无码一区二区三区| 国产成人精品无码免费看| 成人无码视频97免费| 亚洲另类无码一区二区三区| 久久精品国产亚洲精品2020| 好男人社区影视在线WWW| 97视频精品全国免费观看|