Python初心者のCSV操作術
Python初心者のCSV操作術
はじめに
Python初心者の方にとって、データ処理は最初の壁の一つです。特に表計算ソフトで扱うようなカンマ区切りのデータを扱う場合、CSV(Comma Separated Values)ファイルが頻繁に登場します。Python には標準ライブラリとして csv モジュールが用意されており、reader と writer を使うだけで簡単にデータ読み込み・書き出しが可能です。この記事では、Python初心者が実際に手を動かしながら CSV 操作を学べるよう、サンプルコードとともに解説します。
CSVファイルの読み込み
まずは CSV ファイルを読み込む方法です。csv.reader を使うと、行ごとにリストとして取得できます。以下のサンプルでは、sample.csv というファイルを開き、1 行ずつ処理しています。
import csv
with open('sample.csv', newline='', encoding='utf-8') as f:
reader = csv.reader(f)
for row in reader:
print(row) # 例: ['名前', '年齢', '職業']
このコードは、カンマ区切りのデータを自動で分割し、リストとして返します。newline='' を指定することで、改行コードの扱いを統一し、Windows と Unix での違いを吸収します。
CSVファイルへの書き込み
次に、データを書き出す方法です。csv.writer を使うと、リストをカンマ区切りでファイルに書き込むことができます。以下の例では、リストのリストを作成し、output.csv に書き込んでいます。
import csv
data = [
['名前', '年齢', '職業'],
['太郎', '28', 'エンジニア'],
['花子', '34', 'デザイナー']
]
with open('output.csv', 'w', newline='', encoding='utf-8') as f:
writer = csv.writer(f)
writer.writerows(data)
書き込み時も newline='' を指定することで、行末の改行が正しく処理されます。これで、表計算ソフトで開くときに正しく列が分割されます。
まとめ
Python初心者が CSV 操作を始める際に覚えておきたいポイントは次のとおりです。
- 標準ライブラリの
csvモジュールを使うと、readerとwriterで簡単にデータ読み込み・書き出しができる。 - ファイルを開く際は
newline=''を指定し、改行コードの違いを吸収する。 - カンマ区切りのデータは、表計算ソフトと同じフォーマットで扱えるため、データ処理の橋渡しに最適。
- 実際にサンプルコードを動かしながら、行ごとのリスト構造を確認すると理解が深まる。
これらを踏まえて、ぜひ自分のプロジェクトで CSV ファイルを活用してみてください。データ処理の基礎が身につけば、さらに高度な分析や可視化へとステップアップできます。
コメント
コメントを投稿