改行コードの不揃いを正規表現で統一させる方法を紹介

技術メモ
記事内に広告が含まれています。

改行コードがバラバラのテキストファイルを、正規表現によって統一する方法を紹介します。

解決したい事象

改行コードがバラバラのテキストをCRLFかLFのどちらかに統一します。

ここではサクラエディタを例に紹介しますが、エディタについては正規表現が使用できればなんでもOKです。

以下の画像では、青矢印の個所の改行コードが他と異なっています。

改行コード統一手順

置換前

テキストエディタの置換ダイアログを開きます。(Ctrl+R)

置換ダイアログの置換前と置換後に下記の指定をして、全ての行に置換を実施します。

ダイアログの「正規表現(E)」にチェックを入れるのを忘れないでください。

入力項目入力値説明
置換前\r\nCRLFの改行コードを指定
置換後\nLFの改行コードを指定
置換ダイアログ入力値

置換後

全て置換を実施すると、下記の画像の通りすべての改行コードが全てLFに統一されます。

CRLFに統一したい場合

上記の場合はLFに統一されています。

Windowsの改行コードであるCRLFに統一したい場合は続けて、下記の手順を実行します。

置換前

置換ダイアログの置換前と置換後に下記の指定をして、全ての行に置換を実施します。

入力項目入力値説明
置換前\nLFの改行コードを指定
置換後\r\nCRLFの改行コードを指定
置換ダイアログ入力値

置換後

下記の画像の通り、全てCRLFに置換できました。

CRだけに統一したい場合は置換後に\r\nではなく、\rを指定すればよいです。

参考情報

改行に関する正規表現

改行コードに関する正規表現については、下記のようなものがあります。

なお、このWebページの表示環境によっては正規表現の円マークがバックスラッシュとして表示されることがあります。

改行の種類正規表現標準で使用されているOS由来
CR\r古いMacOSタイプライターのCarriage Return。
タイプライターのキャリッジ(Carriage)と呼ばれる部品を先頭に戻す(Feed)ところからきています。
LF\nUnix/Linux/MacOSタイプライターのLine Feed。
タイプライターで下の行(Line)に移動(Feed)することからきています。
CRLF\r\nWindows上記のCRとLFの組み合わせ。
つまりキャリッジ(Carriage)を先頭に戻して(Return)、行(Line)を移動(Feed)する。
改行の種類

参考情報

環境

サクラエディタを使用しました。

Sakura Editor
Japanese text editor for MS Windows

以上です。