scikit-learn的基本用法(二)——数据集的使用

文章作者:Tyan
博客:noahsnail.com  |  CSDN  |  简书

本文主要是演示scikit-learn自带的数据集的一些用法。本文介绍两种sklearn构建数据集的方式,一种是直接加载已有的数据集,另一种是通过工具构建一个数据集。

  • Demo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import matplotlib.pyplot as plt

from sklearn import datasets
from sklearn.linear_model import LinearRegression

# 直接加载数据集
loaded_data = datasets.load_boston()
data_X = loaded_data.data
data_y = loaded_data.target

# 定义模型
model = LinearRegression()
# 学习参数
model.fit(data_X, data_y)
# 计算预测值
result = model.predict(data_X)


# 创造一些线性回归的数据点
X, y = datasets.make_regression(n_samples = 100, n_features = 1, n_targets = 1, noise = 5)
# 绘制创造的数据集的散点图
plt.scatter(X, y)
plt.show()
  • 结果
1
2
[ 30.00821269  25.0298606   30.5702317   28.60814055]
[ 24. 21.6 34.7 33.4]

image

参考资料

  1. https://www.youtube.com/user/MorvanZhou
如果有收获,可以请我喝杯咖啡!