网络机器人吧社区

机器学习项目实战之波士顿房价预测

TiBeing 2019-02-10 14:43:08

本文是基于python 构建机器学习预测房价实例。主要介绍构建机器学习项目的基本过程。分为数据导入、特征工程、模型选择、模型优化、模型预测五个部分。

首先,我们需要导入数据。导入数据的方式一般使用python 中的pandas 库。pandas 能够快速便捷的处理数据。

具体如图:




在对数据进行了基本了解后,可以尝试展开特征工程。一般的特征工程中,主要有:缺失值处理、离散化处理、归一化处理、特征增加等。

在本例子中,特征工程主要是:变量属性转换、均值填充缺失值。

具体如下图:


进一步,完成了上述工作,我们需要进行模型选择工作。也就是常说的训练过程。先将需要进行训练的数据集划分为测试集和训练集。

具体如图:


最后我们在训练好模型后,可以对新产生的数据进行预测。

具体如下图:


Copyright © 网络机器人吧社区@2017