2017-01-01から1年間の記事一覧

回帰分析と機械学習で中央線の高コスパ物件を探す(コスパ高物件導出)

前回は、家賃予測モデルの生成を行いました。 pompom168.hatenablog.com 今回は、Random Forestで生成した家賃予測モデルを使って、コスパ高物件を見つけます。 予測された家賃より実際の家賃が安いほうが、コスパが高いとします。 結果 1位〜5位を掲載しま…

回帰分析と機械学習で中央線の高コスパ物件を探す(家賃予測モデル生成)

前回は、データの可視化と変数選択を行いました。 pompom168.hatenablog.com 今回は、本格的に家賃予測モデルを生成します。 スクレイピングした物件の、8割を学習に、2割を評価のテスト用に使用することにします。 使用する変数 説明変数 部屋数、間取りK有…

回帰分析と機械学習で中央線の高コスパ物件を探す(データ可視化+変数選択)

前回の記事の続きです。 pompom168.hatenablog.com 今回は、具体的にデータの中身を見ていくために可視化を行います。 また、主に多重共線性をなくすために変数選択を行います。 データの可視化 物件数 まずは、各駅ごとの物件数を見ます。 なんとなく納得す…

回帰分析と機械学習で中央線の高コスパ物件を探す(スクレイピング+前処理)

みんなが大好き中央線沿いで、コスパ高い物件を探してみます。 完全に以下のブログに触発されたものです。 www.analyze-world.com やったこと webから中央線沿いの物件情報をスクレイピング モデルへの入力のため前処理 データの可視化と変数選択 家賃予測モ…