ポートフォリオサイト公開中

【google Colab】 簡単なcsvファイル操作まとめ【python】

こんにちは、ともろう(@tomorrowSLog)です。
google Colaboratoryにおけるcsvファイルの操作を備忘録としてまとめます。
ColabはGPUを扱うこともできるのでcsv操作は重要ですね。

目次
  1. ローカルのcsvファイルをColaboratoryにアップロード
  2. githubのcsvファイルをColaboratoryにアップロード
  3. google driveをマウントしてcsvファイルをColaboratoryにアップロード
  4. Colaboratoryのcsvファイルをローカルにダウンロード
  5. githubに.ipynbのコピーを作る
  6. まとめ

【python】Dataframeの操作まとめ【行列の追加、削除、参照、ソート】

ローカルのcsvファイルをColaboratoryにアップロード

ローカルの環境からinput.csvをgoogle Colaboratoryにアップロードする。

コードを実行するとファイルを選択できるので、input.csvを選択する。

import pandas as pd
from google.colab import files
uploaded = files.upload()

#アップロードするファイルを選択

df = pd.read_csv('input.csv')

githubのcsvファイルをColaboratoryにアップロード

gtihubのデータセットをcolaboratoryにアップロード

DMM APIを利用した際に作ったAV.csvをアップロードします。

import pandas as pd
url = 'https://raw.githubusercontent.com/tomowarkar/blog_content/master/dataset/AV.csv'
df = pd.read_csv(url)

かの有名なtitanicのデータセットもこんな感じにアップロードできちゃいます。

import pandas as pd
url = 'https://gist.githubusercontent.com/michhar/2dfd2de0d4f8727f873422c5d959fff5/raw/ff414a1bcfcba32481e4d4e8db578e55872a2ca1/titanic.csv'
titanic_df = pd.read_csv(url, sep='\t')

google driveをマウントしてcsvファイルをColaboratoryにアップロード

google driveのMy Drive(マイドライブ)内にあるinput.csvをアップロードします。

#認証が必要
import pandas as pd
from google.colab import drive
drive.mount('/content/drive/')

#google driveのMy Drive内にあるinput.csvを選択
df = pd.read_csv('/content/drive/My Drive/input.csv')

google driveの認証が必要となるので、一手間かかる感じがある。

Colaboratoryのcsvファイルをローカルにダウンロード

これさえ覚えればとりあえず問題ない気がする。

from google.colab import files
df.to_csv("output.csv")
files.download('output.csv') 

おそらく一番簡単にcolabで作ったファイルをローカルに落とす方法。

githubに.ipynbのコピーを作る

colab左上のファイル>GitHubにコピーを保存からご自由に。

.ipynbをダウンロードすることもできる。

まとめ

忘れやすいからサクッとまとめました。

ではでは

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です