“面向突发情况的在线机器学习用于流式废水进水流量预测”
在线机器学习应用于突发情况下流式废水进水流量预测
准确预测进流率对于污水处理厂的操作人员和管理人员是必要的。简单说,进流率是进入处理厂的未处理水。这个预测与废水的特性密切相关,如生化需氧量(BOD)、总悬浮物(TSS)和pH值。
以往的研究表明,数据驱动的模型有效地预测了进流率。然而,许多研究都集中在批处理学习上,即数据随着时间的推移收集,机器学习模型也是批量训练的。这种方法是不错的,但在COVID-19时代尤其需要进行修订,因为有影响力的模式发生了重大变化。
在机器学习中,批处理学习涉及随时间离散处理数据。相反,在线学习则是在新数据可用时持续训练模型。在COVID-19期间,由于COVID-19封锁措施带来的输入-输出关系的变化,批处理学习方法的局限性更加显著。为此,研究团队将重点转向探索在线学习模型,以确定其在克服这些局限性方面的潜力。
麦克马斯特大学的土木工程师Pengxiao Zhou解释说,他们利用创新的机器学习技术提高了预测污水进流率的能力,特别是在COVID-19封锁情况下的独特背景下。
研究人员将传统的批处理学习模型(包括随机森林、K最近邻和多层感知器)与相应的在线学习模型(自适应随机森林、自适应K最近邻和自适应多层感知器)在加拿大两个污水处理厂预测进流率时进行了性能比较。
在线学习模型在各种情景下始终优于传统的批处理学习模型,展现出最高的R2值,最低的平均绝对百分比误差(MAPE)和最低的均方根误差(RMSE)。在所有情况下,预测进流率提前24小时的测试数据集的R2值是显著的。
研究人员发现,这些在线学习模型在动态数据模式下提供了可靠的预测。它们在处理连续和大量进流数据流方面效率高。
研究团队利用从加拿大两个污水处理厂获得的三到四年的每小时进流率数据和气象数据建立了这些模型。他们通过将在线学习模型与相应的传统批处理学习模型进行比较分析,预测了这两个处理厂的进流率。
Pengxiao Zhou指出,新的在线学习模型可以为污水处理操作人员或管理人员提供更强大的决策支持,以应对由COVID-19等紧急情况导致的进流模式变化。
为了进一步验证构建模型的有效性,团队今后的努力将涉及进行更多案例研究和探索更广泛的预测情景。