国产欧美日韩第一页|日本一二三不卡视频|在线精品小视频,亚洲第一免费播放区,metcn人体亚洲一区,亚洲精品午夜视频

相關(guān)文章

云南公布第二批免費向社會提供信息技術(shù)服務(wù)企業(yè)名單中國互聯(lián)網(wǎng)企業(yè)赴美上市規(guī)模預(yù)計今年或減半用友云百城巡展（昆明站）：企業(yè)上云走向“敏輕簡” 【滇企復(fù)工進行時】藍(lán)隊云：未雨綢繆，危機之下必有機遇搜狐、騰訊、迅雷等一批互聯(lián)網(wǎng)公司涉黃被罰5萬

幫助中心 > 技術(shù)知識庫 > 云服務(wù)器 > 服務(wù)器教程 > 如何在grep和sed命令中使用擴展的正則表達式

如何在grep和sed命令中使用擴展的正則表達式

2017-01-12 08:21:23 6822

對于grep，可以使用egrep命令來替代，那么就支持?jǐn)U展的正則表達式了。

對于sed，只要加上參數(shù)-r就可以支持?jǐn)U展的正則表達式了。

以下是使用的例子，假設(shè)有一堆文件，內(nèi)容都是諸如：

snme0001 今天心情不錯！

stta0001 明天是周五。

seef0001 能把你的IPAD借給我玩玩嗎？

我們想把這些文件中不含有英文的句子合并到一個大文件中，我使用如下命令：

egrep '[[:alpha:]]{4}[[:digit:]]{4}' $' ' * | cut -d ":" -f2 | sed -e 'y/ABCDEFGHIJKLMNOPQRSTUVWXYZ/abcdefghijklmnopqrstuvwxyz/' - | sed -r -e '/ .*[a-zA-Z]/!w ../M1.txt'

1. 首先把這些文件中符合句子ID格式的句子都抓出來。對于tab，egrep沒有特別好的方法來匹配，必須用$' '來表示，而且由于$是個特殊符號，所以得把tab專門抽出來，而不能和其他的字符或者模式放到一個模式里。另外，*表示當(dāng)前文件夾下的所有文件。

2. 抓取ID和句子。之所以用cut，因為egrep抓出來的句子的前邊有文件名和冒號。所以，正好用cut，獲取以冒號來分割的第二部分。

3. 由于有些句子的ID是大寫字母，這里要全部轉(zhuǎn)為小寫字母。tr命令這里實在是不好用，因為它只能對文件進行處理。又不太會用awk，所以就用了sed的這個替換功能。y表示替換命令，然后要替換字符對前后來寫，所以ABCD..和abcd的數(shù)目要相同。

4. 這里用到了!，這個表示符號條件的就不執(zhí)行命令，不符合的才執(zhí)行。也就是說，凡是在tab后出現(xiàn)了英文字母的句子，就不寫到某個文件內(nèi)。在sed里，是可以用來表示tab的，比較好。

上一篇：linux tee命令如何使用
下一篇：幾種常用RAID的簡介

售前咨詢

售前咨詢服務(wù)時間：09:00-23:30

售前值班
4006-75-4006

咨詢熱線：

4006-75-4006（09:00-23:30）
0871-6388 6388 （總機）（工作日 09:00-18:00）

您可能遇到了下面的問題：
云服務(wù)器問題對象存儲計費域名注冊指南
售后咨詢

售后咨詢服務(wù)時間：00:00-24:00

24H值班技術(shù)
4006-75-4006

投訴與建議 最快響應(yīng)10分鐘

您可能遇到了下面的問題：
云服務(wù)器教程遠(yuǎn)程登陸問題 FTP上傳問題其他問題查詢
備案咨詢

備案咨詢服務(wù)時間：09:00-18:00（工作日）

備案專業(yè)客服
0871-6388 6388

您可能遇到了下面的問題：
備案所需材料提交備案流程關(guān)于幕布申請備案服務(wù)指引
電話

0871-6388 6388 （總機）
工單
二維碼
TOP