すわブログ

生産性向上術・グルメを中心に、シンプルに分かりやすく伝えるswaのブログです。

大量のデータを置換する際の時短テクニック

細かい時間も削減しましょう@swaです。

f:id:swablg:20170122165647p:plain

大量のデータを抽出した際に、記号や改行コードなどファイル内の文字列を置換することはしばしばあるかと思います。データを抜きなおすのは相当時間がかかるため置換を行うのですが、それでもエディタなどで実施するとかなりの時間がかかります。

置換の時間を削減するために有効なツール「speeeeed」

下記のツールを使うと置換の時間を激減させることが可能です。

speeeeed

通常、エディタなどでファイルの文字列を置換する場合には下記の手順を踏みます。

  1. ファイルを開く
  2. ファイル内の文字を検索する
  3. 文字を置換する
  4. ファイルで表示している文字を描画する

speeeeedではファイルを開かずに置換できるため、エディタ描画分(1と4)のパフォーマンスがよくなる。という仕組みです。実際にswaが500MBあるファイルで約22万回の置換を行った場合には

  • エディタ使用:2時間 (10秒あたりの置換数から推定)
  • ツール使用:13秒 (実測値)

と、かかる時間をおよそ550分の1に激減させることができました。またBREGEXP.DLLを導入すれば正規表現も扱えます。

「大量のデータを時間をかけずに置換したい!」

そんなときにぜひ有効なのでダウンロードして利用しましょう。