ギガバイトクラスの巨大テキストファイルもサクサク編集できる、超高機能テキストエディタ「EmEditor(エムエディタ)」。
今日は非常にめんどうな「正規表現で別ファイルに抽出」を試してみましょう。
EmEditorならエディタの中で簡単に検索し、瞬時に別ファイルに集めることができます!
正規表現で抽出
特定の文字列を含む行、またはヒットした部分の文字列のみを抽出したい、という場面はかなりひんぱんにあります。
もちろんGrepコマンドやSortコマンドを駆使すれば、同じようなことはできることはできますが、ビジュアル的に見ながら作業したい場面も多いことでしょう。コマンドラインが苦手な人も多いはず。
そんなときにはEmEditorです!
まず住所ジェネレータにて、架空の住所を2000件用意しました。
この中から、「静岡県の市まで」の住所を抽出したいと思います。静岡県○○市が必要ということですね。
EmEditorの検索ボックスを出し、正規表現を打ち込みます。今回の場合「静岡県.+市
」と入力しました。正規表現で検索したいので、「正規表現」の部分にチェックを入れます。
次に右下の「抽出」ボタンの横にある「▼」を押します。するとどのように抽出したいのかを設定できるダイアログが開きます。
今回は住所全てではなく市名までですから、「一致した文字列のみ表示」を選択します。そしてOK。
あとは「抽出」ボタンをポチッとな!(古い)
一瞬で静岡県からはじまる市名が集まりました!
EmEditorから一切離れず別ウィンドウにまとまるので、再構築や再利用が手軽です。データベースの正規化にも力を発揮するでしょう。
WTS的まとめ
2000件ならまだしも、さまざまな表記が入り乱れた10万件のデータとなると、エディタやコマンドラインを行き来して作業するのは、は非常にめんどうで時間を食います。
EmEditorは単体で完結でき、何度も試しながら求めるデータにしていけますので、作業がとてもやりやすいのです。かなり時間を節約できます!
コメント