こんにちは。
野中やすおです。
今回の記事では、Pythonを使ってcsvファイルを読み込んだり、書き込んだりする方法を書きたいと思います。
pandasを使ったcsvファイルの読み込み
csvファイルの読み込みには、いくつか方法がありますが、pandasを使うのが便利で主流となっています。
pandasとは何か?
このサイトにたどり着いた人はすでにご存知の方も多いと思いますが、pandasはPythonにおけるデータ分析を支援する機能を提供するライブラリのことです。
pandasの主なデータ構造として、SeriesやDataframeという型があり、Seriesは1次元(リストのような形式)、DataFrameは2次元(表のような形式)のデータを収納するのに使われます。
csvの読み込み
まずは、csvファイルの読み込みを行ってみましょう。
1 2 3 4 |
import pandas as pd #読み込み df_csv = pd.read_csv('hoge.csv') df_csv type(def_csv) #DataFrame型であることを確認 |
まずは、pandasをインポートします。慣習的にpdという名前で定義します。
pandas.read_csv(ファイルパス)によってcsvファイルを読み込みます。読み込むことで、DataFrame型として作成されます。また様々な読み込みに当たって様々なオプションがあります。詳しくは、公式のドキュメントをご覧ください。
csvの書き込み
次にcsvファイルの書き込みです。
1 2 3 4 |
import pandas as pd df = pd.DataFrame([['taro', 180, 70], ['akiko', 170, 55]], columns=['name','height','weight',]) #DataFrameデータをファイルに書き込み df #出力 |
まずはDataFrame型のデータを作成します。
1 2 |
#書き込み df.to_csv('hoge.csv'), index=False) |
df.to_csvによってcsvファイルを描き込みます。indexはオプションで、Falseがないと行ラベルが各行の1番左の列に書き込まれることになります。こちらも他のオプションは公式ドキュメントをご覧ください。
以上、Pythonを使ってcsvファイルを読み込んだり、書き込んだりする方法を書いてきました。