In the context of climate change, a transition towards more renewable energy sources and more local use of energy is inevitable. To be able to plan machine schedules for local energy systems, accurate forecasts of electricity load demands are needed. However, shortly after smart meters have first been installed, there is only little past data available.
Nevertheless, a precise forecast is ...
Abstract (English)
In the context of climate change, a transition towards more renewable energy sources and more local use of energy is inevitable. To be able to plan machine schedules for local energy systems, accurate forecasts of electricity load demands are needed. However, shortly after smart meters have first been installed, there is only little past data available.
Nevertheless, a precise forecast is required. The research in this thesis aims to answer the question of how to achieve high forecast accuracy in Short Term Load Forecasting (STLF)
settings when not much training data is available. The focus is thus laid on more simple models, leveraging the internal structure of load demand time series data.
For different model types, it is analyzed how the amount of available training data affects the model performance. Furthermore, a novel NMF-based forecasting model is
presented. A time series of the aggregated electricity load demand of 350 households, measured in 30-minute intervals, is used for all experiments.
The done research shows that, for the forecasting accuracy of many models, the amount of training data plays a critical role. It is shown that simple models, leveraging the idea of
slicing the data to daily pieces, give satisfying forecasting accuracy, even when only little training data is available. The most successful models were simple regression models,
applying a Random Forest or a Ridge Regression on features describing the load values of past days. Including information about working days, in contrast to weekends and holidays, can help to further improve the forecast accuracy. The novel NMF-based models gave promising results but are not suited for a situation with only little training data available. Overall, more elaborated model designs needed more data to achieve low forecast errors.
It is shown that for a practical application, in a setting where not much data has been collected yet, simple forecasting models, strongly relying on the daily periodicity in the
data, are superior to more elaborated models like Neural Networks. The results suggest that daily slicing of time series is a simple, yet effective, preprocessing step for STLF
tasks, and that one should not simply use large Neural Network models just because it is today’s flavor of doing so.
Translation of the abstract (German)
Vor dem Hintergrund des Klimawandels ist ein Übergang zu mehr erneuerbaren Energiequellen und einer stärkeren lokalen Energienutzung unumgänglich. Um Kraftwerksfahrpläne
für lokale Energiesysteme planen zu können, sind genaue Prognosen des Strombedarfs erforderlich. Kurze Zeit nach der Installation von Smart Metern stehen jedoch nur wenige Verbrauchsdaten zu vergangenen Zeiten zur Verfügung. ...
Translation of the abstract (German)
Vor dem Hintergrund des Klimawandels ist ein Übergang zu mehr erneuerbaren Energiequellen und einer stärkeren lokalen Energienutzung unumgänglich. Um Kraftwerksfahrpläne
für lokale Energiesysteme planen zu können, sind genaue Prognosen des Strombedarfs erforderlich. Kurze Zeit nach der Installation von Smart Metern stehen jedoch nur wenige Verbrauchsdaten zu vergangenen Zeiten zur Verfügung. Dennoch bedarf es einer genauen Vorhersage.
In dieser Arbeit wird der Frage nachgegangen, wie eine hohe Vorhersagegenauigkeit erreicht werden kann, wenn nur wenige Trainingsdaten verfügbar sind. Der Schwerpunkt
liegt daher auf einfacheren Modellen, welche die interne Struktur der vorliegenden Zeitreihendaten nutzen.
In diesem Kontext wird für verschiedene Modelltypen analysiert, wie sich die Menge der verfügbaren Trainingsdaten auf die Vorhersagegenauigkeit auswirkt. Zudem wird
ein neuartiges NMF-basiertes Vorhersagemodell vorgestellt. Für alle Experimente wurde eine Zeitreihe des aggregierten Strombedarfs von 350 Haushalten verwendet, die in
30-Minuten-Intervallen gemessen wurde.
Die durchgeführten Forschungsarbeiten zeigen, dass für die Vorhersagegenauigkeit vieler Modelle die Trainingsdatenmenge eine entscheidende Rolle spielt. Außerdem wird gezeigt, dass einfache Modelle, die eine Aufteilung der Daten in tägliche Abschnitte
nutzen, eine zufriedenstellende Vorhersagegenauigkeit bieten, selbst wenn nur wenige Trainingsdaten verfügbar sind.
Am erfolgreichsten waren einfache Regressionsmodelle, bei denen ein Random Forest oder eine Ridge Regression auf Features angewendet wurde, die die Lastwerte der
vergangenen Tage beschreiben. Wurden Informationen über Arbeitstage beziehungsweise Wochenenden und Feiertage mit einbezogen, konnte die Vorhersagegenauigkeit weiter
verbessert werden. Die neuartigen NMF-basierten Modelle lieferten vielversprechende Ergebnisse, sind jedoch in einer Situation mit nur wenigen verfügbaren Trainingsdaten
nicht geeignet. Insgesamt benötigten aufwändigere Modelldesigns mehr Daten, um niedrige Vorhersagefehler zu erreichen.
Es wird gezeigt, dass für eine praktische Anwendung in einem Umfeld, in dem noch nicht viele Daten gesammelt wurden, einfache Vorhersagemodelle, die sich vor allem
auf die tägliche Periodizität der Daten stützen, ausgefeilten Modellen wie Neuronalen Netzen überlegen sind. Die Ergebnisse legen nahe, dass das Zerlegen von Zeitreihen
in tägliche Abschnitte ein einfacher, aber effektiver Vorverarbeitungsschritt ist und dass große Neuronale Netze nicht einfach verwendet werden sollten, nur weil dies heutzutage eine gängige Methode ist.