【Python】空白行を一括削除する方法｜初心者でもできる簡単スクリプト付き

Pythonで空白行を削除するシーンとは？
1. どんなときに空白行を削除したくなる？
2. 空白行が残っていると何が問題か
基本の方法｜Pythonで空白行を削除する最もシンプルな書き方
複数ファイル対応！空白行を一括削除する応用スクリプト
空白行が削除できない場合の原因と対処法
まとめ｜Pythonで空白行をスマートに削除しよう
1. よくある質問（FAQ）
次のステップへ

Pythonで空白行を削除するシーンとは？

Pythonを使ってテキスト処理を行う場面では、「空白行の削除」は意外と頻繁に登場します。手作業で行うには面倒で非効率なこの作業も、Pythonを使えば一瞬です。

「なんとなく空白行が多いと気持ち悪い」という感覚だけでなく、実は実務やデータ分析、機械学習の前処理など、さまざまな場面で空白行の除去は重要な意味を持ちます。

どんなときに空白行を削除したくなる？

以下のような状況で、空白行の削除が必要になるケースがよくあります。

1. テキストデータの前処理時

スクレイピングやPDF抽出後のテキストに、不要な空白行が含まれている
自然言語処理（NLP）で文単位に分割する際に空行が邪魔になる

2. ログファイルやCSVなどの整形

プログラムの出力ファイルに空白行が混在していて、可読性が下がっている
CSVの読み込み処理でエラーが出る原因になっている

3. MarkdownやHTMLの整形

空白行が多すぎて読みづらいドキュメントになっている
不要な改行によってレイアウト崩れやスタイルの乱れが発生する

空白行が残っていると何が問題か

空白行があるだけで「見た目が悪い」という感覚も正しいですが、実際にはそれ以上に深刻な問題につながることもあります。

1. 処理エラーやバグの原因になる

多くのプログラムでは、空白行も「データの一部」として扱われることがあります。例えば、空白行を想定せずに読み込んだCSVファイルが原因で、データ処理時に「IndexError」や「ValueError」が発生することも。

2. データ解析の精度が落ちる

空白行が意図せずに「空データ」としてカウントされると、平均値や中央値の計算が狂ったり、グラフにノイズが出たりする原因になります。

3. チームでの共有やレビュー時に不便

チーム開発や共同編集の場面では、「空白行だらけのファイル」はそれだけで可読性が下がり、レビューもしづらくなります。特にバージョン管理ツール（Gitなど）では、不要な差分として扱われてしまい、ノイズになることも。

本記事で学べること

空白行の定義と削除の基本
空白行を削除するPythonスクリプトの書き方
削除できない空白行の原因と対処法
正規表現による柔軟な空白行の判定方法
安全なファイル操作と自動処理の実践方法

日本では現在、ITエンジニアの人材不足が深刻化しており、
それに伴いエンジニアの需要が急速に高まっています。
プログラミングスキルを身につけることで、以下のような多くのメリットが得られます。
✅ 転職市場での競争力が向上し、収入アップのチャンスが広がる
✅ 副業として活用でき、収入源を増やせる
✅ プログラマーに限らず、IT時代を生き抜く武器になる
もし少しでも興味があるなら、まずはプログラミングスクールの無料体験を試してみるのがおすすめです。

スクール名	特徴	主な学習内容	対象者
	AI・データサイエンス特Python/AIに特化した実践カリキュラム。現役エンジニアの手厚いサポートと「学び放題」制度が特徴。専門実践教育訓練給付金適用可能。	Python, 機械学習, データ分析	AI・データ分析初心者～中級者
	完全マンツーマン指導。オーダーメイドカリキュラムとトリプルサポート体制（講師+コーチ+Q&A掲示板）。挫折率2.1%の継続性。	Web開発, AI, アプリ開発	キャリアチェンジ志望者
	AI/機械学習専門。E資格合格率83.1%。カリキュラムが無期限に閲覧可能。卒業生コミュニティが強み。AI特化の転職サポートあり。	Python, 機械学習, データ分析	AIエンジニア志望者
	転職保証付きの短期集中型スクール。未経験者向けのサポートが充実。	Web開発, プログラミング全般	未経験からのエンジニア転職志望者

基本の方法｜Pythonで空白行を削除する最もシンプルな書き方

空白行の削除は、Pythonにおけるテキスト処理の中でも非常に基本的な操作です。しかし、ファイルの読み書きや文字コードの扱いに注意しないと、うまく動作しないこともあります。

ここでは、初心者でも理解しやすいように、シンプルかつ安全に空白行を削除する方法を解説します。

空白行とは何か？判断基準を解説

まず「空白行」とは何を指すのかを正しく理解しておきましょう。

一般的に、空白行とは文字がまったく含まれていない行、または空白スペースやタブのみで構成されている行を意味します。

空白行の例

textコピーする編集する（1行目）これは通常の行です。
（2行目）
（3行目）　　
（4行目）これは別の行です。

上記では、2行目は完全な空行、3行目はスペースだけが入っている空白行です。どちらもPythonで除去の対象とされるべき行です。

空白行の判断基準（Python的には）

if line.strip() == "":
    # この行は空白行とみなす

strip()メソッドは行頭・行末の空白やタブ・改行コードをすべて取り除くため、実質的に空かどうかの判定が可能です。

1つのファイルから空白行を削除するコード例

以下は、1つのテキストファイルから空白行を削除する最も基本的なPythonコードです。

📌 コード例：空白行を除去して上書き保存する

input_file = "sample.txt"

with open(input_file, "r", encoding="utf-8") as infile:
    lines = infile.readlines()

non_blank_lines = [line for line in lines if line.strip() != ""]

with open(input_file, "w", encoding="utf-8") as outfile:
    outfile.writelines(non_blank_lines)

✅ コードのポイント解説

readlines()で一括読み込み
strip()で空白行を判定し、リスト内包表記で除外
同じファイル名でwritelines()を使って上書き保存

読みやすくするためのコツ（with文・エンコード対応）

Pythonでファイルを扱う際は、読みやすさと安全性の観点から、以下のベストプラクティスを守るとよいでしょう。

1. with文を使う理由

自動的にファイルを閉じてくれる
エラー発生時も安全にリソースを解放

with open("file.txt", "r") as f:
    ...

2. エンコードは明示すること

ファイルの文字コード（エンコーディング）を明示することで、文字化けや読み込みエラーを防げます。

推奨設定：

open("file.txt", "r", encoding="utf-8")

特にWindows環境では、cp932（Shift_JIS系）がデフォルトになることがあり、想定外の挙動を招く原因になります。

3. バックアップを取っておく（安心感アップ）

元ファイルを上書きする前に、以下のようにコピーを取ることもおすすめです。

import shutil
shutil.copy("sample.txt", "sample_backup.txt")

まとめ

空白行の削除は、単純な処理でありながらトラブル回避や作業効率の向上に直結する重要なスキルです。最初はシンプルなコードから慣れ、後の応用に活かしていきましょう。

次章では、複数ファイルをまとめて処理する方法や、自動化スクリプトについて解説します。

複数ファイル対応！空白行を一括削除する応用スクリプト

1つのファイルから空白行を削除するだけでは、実務では不十分なこともあります。特に、複数のテキストファイルを一括で処理したい場面は、現場で非常によくあります。

たとえば：

アンケートやログデータをまとめたテキスト群
スクレイピングで自動収集したHTMLテキスト
Markdownなどのドキュメント類

そんなときに役立つのが、「フォルダ内の全ファイルを一括処理するスクリプト」です。

フォルダ内の全ファイルに処理をかける方法

まず、Pythonで特定のフォルダ内にあるすべてのファイルを対象に処理をかけるには、os や glob モジュールを使います。

ステップ概要

globでフォルダ内のファイル一覧を取得
拡張子で対象ファイルを絞り込む（例：.txt）
各ファイルに対して、空白行の削除処理を実行

import glob

files = glob.glob("text_folder/*.txt")  # 任意のフォルダを指定
for file in files:
    print(file)  # ファイルパスを確認

このようにして対象を一括で取得できます。

ファイルの上書き保存とバックアップの注意点

空白行を削除して同じファイル名で保存する場合は、「上書き保存」のリスクにも注意が必要です。

注意すべきポイント

元データが消えてしまうと復元が困難になる
意図しないデータ破損を防ぐためにも、事前にバックアップを取ることが重要です

📌 Pythonでバックアップを取る方法

import shutil

shutil.copy(file_path, file_path + ".bak")

このコードを実行すれば、.bak拡張子で元ファイルが複製され、安全に処理できます。

上書き保存のベストプラクティス

with open()で安全に書き込み
encoding="utf-8"を明示
ファイル保存前に1行ずつ中身を確認する仕組みにしておくと、なお安心

スクリプトの全体コードと実行方法

以下に、フォルダ内の全テキストファイルから空白行を削除し、元ファイルに上書き保存するPythonスクリプトを紹介します。

📌 応用スクリプト全体コード

import glob
import shutil

folder_path = "text_folder"  # 処理対象のフォルダを指定
files = glob.glob(f"{folder_path}/*.txt")

for file_path in files:
    # バックアップを作成
    shutil.copy(file_path, file_path + ".bak")
    
    # 空白行を除去
    with open(file_path, "r", encoding="utf-8") as infile:
        lines = infile.readlines()
    non_blank_lines = [line for line in lines if line.strip() != ""]

    # 上書き保存
    with open(file_path, "w", encoding="utf-8") as outfile:
        outfile.writelines(non_blank_lines)

    print(f"空白行を削除しました → {file_path}")

実行方法（初心者向け）

上記スクリプトを remove_blank_lines.py として保存
同じフォルダに text_folder を作成し、そこに .txt ファイルを入れる
ターミナルやコマンドプロンプトで以下を実行

python remove_blank_lines.py

まとめ

複数ファイルに対する空白行削除は、Pythonによって劇的に作業時間を短縮できる強力なテクニックです。

「大量ファイルの手動修正に疲れた…」
「整理されたテキストでデータ処理をスムーズに進めたい…」

そんなときこそ、今回のような自動化スクリプトを一度導入するだけで作業効率が大きく向上します。

空白行が削除できない場合の原因と対処法

Pythonで空白行を削除するスクリプトを書いたのに、「一部の空白行がなぜか残ってしまう」という現象に悩まされることがあります。

これはコードの間違いではなく、「空白行の定義」や「データの形式」が想定と異なっていることが原因です。

ここでは、空白行が削除されない主な原因と、その対処法を具体的に解説します。

全角スペースや改行コードが原因かも？

見た目には何も書かれていないように見える行でも、実際には「空白文字」が存在している場合があります。Pythonの strip() で除去できないケースも存在するため、注意が必要です。

よくある見逃しポイント

全角スペース（全角空白）："　"（半角ではなく全角）が含まれていると、strip()では除去できない
特殊な改行コード：環境によっては \n ではなく \r\n や \r が使われている
タブ（\t）の混在：スペースではなくタブ文字で埋まっている行もある

対処方法

strip() では不十分なときは replace() を併用して対応

cleaned = line.replace("　", "").strip()  # 全角スペースも削除
if cleaned == "":
    # 空白行とみなす

正規表現を使った柔軟な対応方法

Pythonの re モジュール（正規表現）を使えば、より細かく空白行を判定することができます。特に、空白・タブ・全角スペースをすべて含めて「空白行」と定義したい場合には有効です。

✅ 正規表現を使ったサンプル

import re

pattern = re.compile(r'^\s*$')  # 空白・タブ・改行のみで構成される行

if pattern.match(line):
    # 空白行とみなす

このように ^\s*$ というパターンは、

^：行頭
\s*：空白（スペース・タブ・改行）を0回以上
$：行末
にマッチするので、あらゆる種類の空白行に対応可能です。

正規表現を使うメリット

タブや全角スペース、改行の組み合わせも検出可能
コードの保守性が高く、あいまいなデータにも強い

文字コードの違いによるトラブルと解決策

見落とされがちなのが「文字コード（エンコーディング）」の問題です。特にWindowsとMac/Linuxの間でファイルをやり取りする場合に、予期しない文字列処理の不具合が起きることがあります。

よくある文字コードトラブル

ファイルを開いたら文字化け
空白行に見えるのに処理されない（実は制御文字が混入）
改行コードが想定と異なる（例：\r\n vs \n）

解決策

文字コードを明示的に指定して開く

with open("file.txt", "r", encoding="utf-8") as f:
    lines = f.readlines()

文字コードを明示的に指定して開く

with open("file.txt", "r", encoding="utf-8") as f:
    lines = f.readlines()

文字コードを明示的に指定して開く

pip install chardet

import chardet

with open("file.txt", "rb") as f:
    raw = f.read()
    result = chardet.detect(raw)
    encoding = result["encoding"]

with open("file.txt", "r", encoding=encoding) as f:
    lines = f.readlines()