巨大なファイルから正規表現で検索し抽出して別ファイルへ!EmEditorなら時間を大幅短縮できる

★ 当レビューの商品は筆者が自己購入したものです。

ギガバイトクラスの巨大テキストファイルもサクサク編集できる、超高機能テキストエディタ「EmEditor(エムエディタ)」。

今日は非常にめんどうな「正規表現で別ファイルに抽出」を試してみましょう。

EmEditorならエディタの中で簡単に検索し、瞬時に別ファイルに集めることができます!

記事中の商品/サービス

正規表現で抽出

特定の文字列を含む行、またはヒットした部分の文字列のみを抽出したい、という場面はかなりひんぱんにあります。

もちろんGrepコマンドやSortコマンドを駆使すれば、同じようなことはできることはできますが、ビジュアル的に見ながら作業したい場面も多いことでしょう。コマンドラインが苦手な人も多いはず。

そんなときにはEmEditorです!

 

まず住所ジェネレータにて、架空の住所を2000件用意しました。

架空の住所2000件

 

この中から、「静岡県の市まで」の住所を抽出したいと思います。静岡県○○市が必要ということですね。

EmEditorの検索ボックスを出し、正規表現を打ち込みます。今回の場合「静岡県.+市」と入力しました。正規表現で検索したいので、「正規表現」の部分にチェックを入れます。

正規表現を入力

 

次に右下の「抽出」ボタンの横にある「▼」を押します。するとどのように抽出したいのかを設定できるダイアログが開きます。

今回は住所全てではなく市名までですから、「一致した文字列のみ表示」を選択します。そしてOK。

 

あとは「抽出」ボタンをポチッとな!(古い)

一瞬で抽出結果が集まった

 

一瞬で静岡県からはじまる市名が集まりました!

EmEditorから一切離れず別ウィンドウにまとまるので、再構築や再利用が手軽です。データベースの正規化にも力を発揮するでしょう。

WTS的まとめ

2000件ならまだしも、さまざまな表記が入り乱れた10万件のデータとなると、エディタやコマンドラインを行き来して作業するのは、は非常にめんどうで時間を食います。

EmEditorは単体で完結でき、何度も試しながら求めるデータにしていけますので、作業がとてもやりやすいのです。かなり時間を節約できます!

巨大なファイルから正規表現で検索し抽出して別ファイルへ!EmEditorなら時間を大幅短縮できる
巨大なSQLファイルの編集にはEmEditor!ギガバイト単位でも置換、編集可能
1GBの超巨大CSVを1秒で開きさらに高速編集!ネタではなくて本当に使えるエディタEmEditer

コメント