解析環境セットアップ

ライブラリーの準備

このノート全体にわたって、共通して使用するパッケージ、関数やデータなどをここで呼び出して、すぐに使える状態にする。

In [1]:
%matplotlib inline

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

データセットの準備

このノートでは scikit-learn パッケージに保存されているボストン住宅価格データセットを使って、回帰分析を行う例を示す。このデータセットは、各区画における住宅の価格、犯罪率、非小売業の割合、全額固定資産税率などを集計したデータとなっています。このページではこのデータセット使って、犯罪率、非小売業の割合、全額固定資産税率などの特徴量(説明変数)を使って、住宅の価格(目的変数)を予測する回帰分析を行う例を示す。

In [2]:
import sklearn.datasets
boston = sklearn.datasets.load_boston()

X = boston.data
y = boston.target

print(X.shape)
(506, 13)
In [3]:
boston_df = pd.DataFrame(np.concatenate([y.reshape(y.shape[0], 1), X], axis=1),
                         columns=['y' if i == 0 else 'X' + str(i) for i in range(X.shape[1] + 1)])
sns.pairplot(boston_df)
Out[3]:
<seaborn.axisgrid.PairGrid at 0x91dff7d50>