驚くほど簡単な技術系健忘録

驚くほど簡単な技術系健忘録

アプリやWebサービス、RPAを作る上での健忘録を書いていきます。

Kaggleでデータ分析始めたけどPythonでわからないことが多すぎる件について

データ分析の最初はデータの欠損を調べましょうみたいな感じのブログが多くて、
yolo-kiyoshi.com

ここのブログを見ながら写経をしていたときに疑問になった点について記述。

#テストデータの欠損状況
test.isnull().sum()[test.isnull().sum()>0].sort_values(ascending=False)

[test.isnull().sum()>0]

の部分何やねん!って思って調べたところ、
sinhrks.hatenablog.com
ここのブログにもあるけど
「特定の年, 月, etc... のデータだけ選択したい」ときの特定カラムの条件指定だった。
例としては以下のコードの感じ。

df[df.index.year == 2015]

というか
sinhrks.hatenablog.com
のブログがわかりやすいのでおすすめ。