Kaggleでデータ分析始めたけどPythonでわからないことが多すぎる件について
データ分析の最初はデータの欠損を調べましょうみたいな感じのブログが多くて、
yolo-kiyoshi.com
ここのブログを見ながら写経をしていたときに疑問になった点について記述。
#テストデータの欠損状況 test.isnull().sum()[test.isnull().sum()>0].sort_values(ascending=False)
の
[test.isnull().sum()>0]
の部分何やねん!って思って調べたところ、
sinhrks.hatenablog.com
ここのブログにもあるけど
「特定の年, 月, etc... のデータだけ選択したい」ときの特定カラムの条件指定だった。
例としては以下のコードの感じ。
df[df.index.year == 2015]
というか
sinhrks.hatenablog.com
のブログがわかりやすいのでおすすめ。