• •
刘一宁, 陈柏安, 杜鹏程, 林晓刚, 江美慧
LIU Yining, CHEN Baian, DU Pengcheng, LIN Xiaogang, JIANG Meihui
摘要: 在公共建筑能耗研究中,公共建筑负荷易产生异常数据,对异常负荷值进行识别与修复是不可或缺的数据处理环节。针对现有的异常数据识别与修复方法的局限性,本文提出了一种基于MDLOF-iForest算法和M-KNN-Slope算法的公共建筑负荷异常数据识别与修复方法。MDLOF-iForest算法在传统的LOF算法中引入马氏距离,提高了模型对数据特征间关联性的感知能力,同时将MDLOF算法与iForest算法的优势相结合,可以快速准确的识别出异常数据。其次,M-KNN-Slope算法利用异常数据与正常数据负荷趋势线特征相似的邻居,得到相似趋势线斜率加权平均值,完成对异常数据的修复,减少了对样本数据的依赖。通过对中国广西的一栋办公公共建筑和一栋商业公共建筑2024年8月至11月负荷数据的验证,修复后90%左右数据与正确数据差值在10%以内,且相较一般算法,M-KNN-Slope算法能够获得更多误差在5%以内数据,利用修复前后进行预测(XGBoost、LSTM、BP和SVM)在均方根值(Root Mean Square Error, RMSE)上分别降低了5.02%-14.40%,在绝对平均误差(Mean Absolute Error, MAE)上分别降低了2.44%-13.34%。