2022-01-01から1日間の記事一覧

交差検証のデータセットの分け方について

自分と同じ疑問を抱いている人がいた。 detail.chiebukuro.yahoo.co.jp 交差検証でTrain, Val, Testに分けるとき、Testを恣意的に分けてしまってよいのかという疑問。すなわちTestについてもCross validationする必要があるのでは?ということ。 通例では恣…

Scikit-learnのcross_val_predict()の動作について

cross_val_predict()と似た関数のcross_val_score(cv=2)は[0.92, 0.90]のようにCV数に対応したスコアの配列を返す。 一方で、cross_val_predictはCV数に依存せず、常に同じ配列を返すのが気になっていた。 たとえば以下のような感じ。 cross_val_predict(CV=…

決定境界の描画ライブラリ

mlxtendのplot_decision_regionsを使う。 from sklearn.model_selection import train_test_split from sklearn.decomposition import PCA, KernelPCA from sklearn import datasets from sklearn.svm import SVC from mlxtend.plotting import plot_decisio…

学習曲線について

学習曲線(あるいは学習・検証曲線)には横軸のとり方によって以下の3種類がある。(Accuracyを縦軸にとった場合) 3つの場合とも、学習曲線と検証曲線を並べることで過学習の判定に用いることができる。 1.横軸がEpoch数 →過学習の判定や、アーリースト…