本案例基于环保领域,根据历史空气质量数据对未来空气质量进行预测,这具有重要的现实意义和社会价值。
首先导入数据集,在<样本集管理>处点击<新建样本集>,选择历史空气质量样本集导入,提交后会在列表显示上传成功的样本集,我们可以查看样本集的结构以及样例数据。
选择[大数据分析/实验管理]菜单,点击右上角<新建实验>按钮,组建一个新的实验。
在本次实验我们主要使用的LSTM等算法,希望拟合出一条能准确预测未来空气质量的曲线。在实验的组件区选取数据预处理,机器学习算法,模型评估相关算法进行组态。
在本次实验我们采用了缺失值处理算法,删除样本集中存在的缺失值,利用设置角色算法为参数设置自变量与应变量的角色,将70%的数据作为训练集,剩余的30%的数据作为测试集,采用LSTM算法进行建模分析,配置完成LSTM算法基础配置,神经网络结构配置,训练参数配置,初始权重化配置。最后进行批量调试,运行算法1000次,利用回归模型评估组件选择健康度最高的一次作为最优的算法。
基于批量调试我们得到一个健康度为94.56%的模型,接下来我们将得到的最优模型应用于实际生产。选择发布,并在部署管理中根据已发布的实验建立服务以及对服务进行管理。
点击<新建任务>在计算任务菜单处选择试验任务,点击<新建任务>后,在界面输入任务名称,选择算法服务和相关配置项,在配置界面绑定输入和输出的对象实例,确认后就可以在实验任务界面查看新建的试验任务,在对应的对象处查看算法对抗压强度的预测输出值。
该场景是平台在环保领域的一次应用,基于历史数据预测未来的空气质量,为控制环境污染提供依据。