混泥土的强度等级是指在标准条件下养护28天所达到的抗压强度,在实际生产中检测混泥土的抗压强度需要在标准条件下等待28天,无法及时得到当前混泥土强度的反馈,因此需要对强度进行预测,及时调整生产。
下面开始对混泥土的抗压强度进行分析。
(1)在<样本集管理>处点击<新建样本集>。
(2)选择混泥土数据集导入,提交后会在列表显示上传成功的样本集。
选择[大数据分析/实验管理]菜单,点击右上角<新建实验>按钮,组建一个新的实验。
在本次实验我们使用的预处理、特征工程、DNN、回归评估等算法,希望拟合出一条能准确预测的曲线可以为生产提供帮助。
我们采用缺失值处理算法,对样本集中的缺失采用临近值进行补充,并采用基于3Sigma的离群点处理算法删除样本集中的离群点,最后利用相关系数矩阵和人工实际经验筛选影响抗压强度的参数。
在完成对样本集数据处理和特征提取后,我们将样本集分为训练集与测试集,两者比例为80:20,采用DNN算法对训练集进行建模分析,将抗压强度作为应变量,将上述选择的参数作为自变量,配置DNN算法参数,完成基础配置,神经网络结构配置,训练参数配置,初始权重化配置。
(1) DNN算法配置
(2) DNN洞察
利用模型应用组件将DNN算法训练的模型在测试集上进行验证,并且利用回归模型评估组件进行评估,模型评估组件从误差,绝对误差,相对误差这3个角度对模型性能进行评估。通过批量调试对算法进行训练,得到基于模型评估组件的最优模型。本次实验采取批量调试1000次。
(1) 批量调试
(2) 模型评估
最终得到一个健康度为96.47%的模型,接下来我们将得到的最优模型应用于实际生产。选择发布,并在部署管理中根据已发布的实验建立服务以及对服务进行管理。
在部署管理中以上述发布的实验新建服务,在部署管理的界面处点击<新建服务>,在涉及实验处选择已经发布的实验,确认样本集输入和实验输出,点击提交后可以在列表界面查看到发布的服务。
创建完服务后就可以依据以创建的服务发布实验任务,在<计算任务>的实验任务界面查看已有的实验任务与创建新的实验任务。
点击<新建任务>后,在界面输入任务名称,选择算法服务,根据算法需要选择时间粒度(单位有秒、分钟、小时、天)和缓存周期,在配置界面绑定输入和输出的对象实例,确认后就可以在实验任务界面查看新建的试验任务,在对应的对象处查看算法对抗压强度的预测输出值。
该场景是混泥土28天抗压强度预测,我们演示了从样本集导入到实验任务的创建的一个完整流程,最终得到一个健康度为96.47%的模型对抗压强度进行预测,及时对混泥土的生产提供进一步指导。