Ein synthetischer Datensatz dänischer Privatstromprosumenten

Scientific Data Band 10, Artikelnummer: 371 (2023) Diesen Artikel zitieren

1 Altmetrisch

Details zu den Metriken

Aus herkömmlichen privaten Stromverbrauchern werden Prosumenten, die Strom nicht nur verbrauchen, sondern auch produzieren. Es wird erwartet, dass dieser Wandel in den nächsten Jahrzehnten in großem Umfang stattfinden wird und zahlreiche Unsicherheiten und Risiken für den Betrieb, die Planung, die Investitionen und tragfähige Geschäftsmodelle des Stromnetzes mit sich bringt. Um sich auf diesen Wandel vorzubereiten, benötigen Forscher, Versorgungsunternehmen, politische Entscheidungsträger und aufstrebende Unternehmen ein umfassendes Verständnis des Stromverbrauchs zukünftiger Prosumenten. Aufgrund von Datenschutzbedenken und der langsamen Einführung neuer Technologien wie batterieelektrischen Fahrzeugen und Hausautomation ist leider nur eine begrenzte Datenmenge verfügbar. Um dieses Problem anzugehen, stellt dieses Papier einen synthetischen Datensatz vor, der fünf Arten von Daten zu importiertem und exportiertem Strom von privaten Prosumenten enthält. Der Datensatz wurde unter Verwendung realer traditioneller Verbraucherdaten aus Dänemark, PV-Erzeugungsdaten aus dem GSEE-Modell (Global Solar Energy Estimator), Ladedaten für Elektrofahrzeuge (EV), die mit dem Emobpy-Paket generiert wurden, einem Betreiber eines Energiespeichersystems für Privathaushalte (ESS) und einem entwickelt Generative Adversarial Network (GAN)-basiertes Modell zur Erzeugung synthetischer Daten. Die Qualität des Datensatzes wurde durch qualitative Inspektion und drei Methoden bewertet und validiert: empirische Statistiken, auf Informationstheorie basierende Metriken und auf maschinellen Lerntechniken basierende Bewertungsmetriken.

Mit der zunehmenden Verbreitung erneuerbarer Energiequellen (RES), Elektrofahrzeugen (EVs) und Energiespeichersystemen (ESS) in modernen Haushalten wandeln sich konventionelle Verbraucher zu Prosumern, wodurch die Energiesysteme immer dynamischer und bidirektionaler werden. Im Jahr 2022 setzten die erneuerbaren Energien ihr schnelles Wachstum fort und machten 13 % der weltweiten Stromerzeugung aus, was einem Anstieg von 17 % im Vergleich zu 2021 entspricht. Der im Jahr 2021 veröffentlichte Ausblick der Internationalen Energieagentur (IEA) prognostizierte, dass 56 % der weltweiten Stromerzeugung aus erneuerbaren Quellen stammen würden Erneuerbare Energien bis 2050, wobei Solarenergie voraussichtlich die wichtigste erneuerbare Ressource sein wird und bis zu 43 % des gesamten Anteils erneuerbarer Energien ausmachen wird2. Auch der weltweite Stromverbrauch wird aufgrund der Raumheizung und der Elektrifizierung des Verkehrs steigen. Unter allen Stromverbrauchern wird davon ausgegangen, dass inländische Elektrofahrzeuge den größten Beitrag zur Emissionsreduzierung leisten und bis 2050 voraussichtlich 70 % aller Personenkraftwagen ausmachen werden, während batterieelektrische Fahrzeuge (BEV) 56 % aller Fahrzeugverkäufe ausmachen werden3.

Basierend auf dieser Prognose ist es für Netzbetreiber, politische Entscheidungsträger, Versorgungsunternehmen und andere Interessengruppen unerlässlich, die Dynamik des künftigen Stromverbrauchs von Privathaushalten zu verstehen. Allerdings gibt es hierfür mehrere Hindernisse, vor allem hinsichtlich der Verfügbarkeit hochwertiger Daten. Erstens stehen Praktikern und Forschern aus Datenschutzgründen keine umfangreichen Daten zum individuellen Stromverbrauch zur Verfügung. In Ländern mit weit verbreiteter Smart-Meter-Einführung stehen Intervallverbrauchsdaten nur Verbrauchern, Netzbetreibern und Einzelhändlern zur Abrechnung zur Verfügung. In allen Fällen sind jedoch die Benutzertypen basierend auf ihrer Hinter-dem-Zähler-Ausrüstung (BTM), z. B. Elektrofahrzeugen, stationären Batterien oder Solar-PV-Systemen, unbekannt. Zweitens ist der Typ der bestehenden Stromprosumenten quasi dynamisch und ändert sich im Laufe der Zeit, ohne dass es einen Mechanismus zur Aktualisierung der Kategorisierung der Prosumenten gibt. Beispielsweise kann eine Fehlfunktion einer Solar-PV dazu führen, dass ein Solarnutzer vorübergehend zu einem Nicht-Solarnutzer wird, oder die Nichtverfügbarkeit eines Elektrofahrzeugs kann den Typ des Nutzers vorübergehend ändern. Dynamische Kenntnisse über den Prosumer-Typ (z. B. auf Stunden- oder Tagesbasis) könnten für Systembetreiber, Aggregatoren und Einzelhändler von entscheidender Bedeutung sein, um das Nachfrageverhalten in Stunden bis Tagen im Voraus für Planung und Betrieb besser einschätzen zu können. In dieser Hinsicht erleichtert ein groß angelegter, gekennzeichneter Datensatz über den Stromverbrauch verschiedener Arten von Prosumern die Modernisierung von Stromnetzen4.

Vorhandene öffentliche Datensätze lassen sich in zwei Hauptkategorien einteilen: (1) gesammelte Daten aus lebenden Laboren5,6,7 und (2) Simulationsstudien8,9. Einige Living Labs weltweit erfassen Intervalldaten auf Geräteebene mit intelligenten Zählern und anderen intelligenten Geräten6,7,10,11. Diese können hochauflösende Daten bereitstellen, jedoch nur für eine begrenzte Anzahl von Prosumern. Aufgrund von Datenschutzbedenken oder vertraglichen Verpflichtungen ist es einigen von ihnen nicht möglich, Daten öffentlich weiterzugeben. Einige Forscher haben in Simulationsstudien entweder physikbasierte oder datengesteuerte Modelle zur Simulation des Stromverbrauchs einzelner Haushalte erstellt8,9,12. Die physikbasierten Modelle erfordern physikalische Parameter der Gebäude, wie z. B. Wärmekapazität, Wärmewiderstand, Innentemperaturen usw., die in der Praxis nur schwer zu ermitteln und einzuhalten sind. Darüber hinaus verschärfen die physikbasierten Modelle die Bedenken hinsichtlich der Privatsphäre, denn je mehr man über einen Prosumenten weiß, desto einfacher ist es, den Haushalt zu identifizieren. Im Vergleich zu den physikbasierten Modellen stützen sich die datengesteuerten Modelle nur auf historische Daten von Verbrauchern/Prosumenten. Das Hauptproblem besteht darin, dass BTM-Technologien für Privathaushalte mit entsprechender Automatisierung noch nicht in großem Maßstab eingeführt wurden, insbesondere für stationäre Batterien und BEVs. Daher verfügen die datengesteuerten Modelle nicht über genügend Intervalldaten, um eine Vielzahl unterschiedlicher Arten von Prosumer-Zeitreihen zu synthetisieren.

Um das Problem der Datenverfügbarkeit zu lösen, erstellen wir zunächst einen Datensatz auf der Grundlage realer Verbraucherdaten als Benchmark-Benutzer und aggregieren ihn mit drei verschiedenen RES-Intervalldaten unter Berücksichtigung anderer Informationen aus Dänemark. Die drei betrachteten erneuerbaren Energiequellen sind: automatisierte Energiespeichersysteme (ESS), Solar-PV-Systeme auf Dächern und BEVs, da davon ausgegangen wird, dass BEVs den zukünftigen Fahrzeugmarkt dominieren werden3. Der Vollständigkeit halber erstellen wir auf diese Weise fünf Prototypen von Prosumern und einen Prototypen von Verbrauchern. Um die Datenschutzbedenken bei der Verwendung realer Verbraucherdaten zu berücksichtigen, formatieren wir die Daten täglich neu und verwenden CTGAN-basierte Datensynthesizer (Conditional Tabular Generative Adversarial Network), um synthetische Daten für jeden Prototyp zu generieren. Dieses Verfahren kann aus drei Gründen die Privatsphäre realer Verbraucher schützen. Zunächst haben wir die Stromdaten realer Verbraucher verwendet, um verschiedene Arten von Stromprofilen von Prosumenten zu erstellen, was bedeutet, dass ihr tatsächlicher Verbrauch durch die Mischung mit der RES-Zeitreihe verschleiert wird. Zweitens ist der Datengenerator eine Black-Box-Methode, die nicht zurückentwickelt werden kann und schwer zu disaggregieren ist. Darüber hinaus sind der Lebensstil und die Belegung des Endbenutzers im Datensatz nicht vorhanden, da der Datensatz nur Tagesprofile für bestimmte Jahreszeiten und Temperaturen enthält. Daher besteht kein Zusammenhang zwischen zwei aufeinanderfolgenden Tagen. Insgesamt haben wir einen synthetischen Datensatz von 600.000 Tagen importierter Energie aus dem Netz und exportierter Energie in das Netz erstellt. Der entwickelte Algorithmus erstellt sechs Arten von Stromverbrauchsprofilen für Stromverbraucher unter Berücksichtigung von zwei Arten von Tagen (Wochentag und andere Tage, einschließlich Feiertagen und Wochenenden), vier Jahreszeiten und der Umgebungstemperatur. Wir richten uns insbesondere an dänische Privatkunden, da unser Industriepartner Watts A/S aus Dänemark stammt und für unser Projekt stündliche Nutzungsdaten traditioneller Verbraucher bereitgestellt hat13. Dennoch ist der vorgeschlagene Datensynthesizer generisch und kann je nach Daten- und erforderlicher Informationsverfügbarkeit zur Synthese von Daten für andere Regionen und Länder verwendet werden.

Mehrere Faktoren machen diese Studie und diesen Datensatz bedeutsam. Erstens enthält der Datensatz den stündlich importierten (aus dem Netz) und exportierten (in das Netz) Stromverbrauch einzelner Privatnutzer, gekennzeichnet nach BTM-Geräten, Tagestyp, Jahreszeit und Tagestemperatur. Nach unserem besten Wissen steht ein solcher Datensatz der Öffentlichkeit derzeit nicht für Forschung und Entwicklung zur Verfügung7,14. Außerdem kann der Datensatz in verschiedenen Anwendungen verwendet werden, z. B. Systemplanung, Marktanalyse und Geschäftsmodellentwicklung, BTM-Flexibilitätsmodellierung, Entwurf kommunaler Energiezentren, Mikronetz- und lokaler Marktentwurf sowie Elektrifizierungsbewertung und deren Auswirkungen auf Treibhausgasemissionen in der Region Ära der Prosumer15,16. Zweitens wird die Qualität des Datensatzes auf vier Arten validiert: qualitative Inspektion, empirische Statistik, auf maschinellem Lernen (ML) basierende Bewertungsmetriken und Informationstheorie. Schließlich umgeht der synthetische Datensatz aus den oben genannten Gründen die Datenschutzbedenken.

In diesem Abschnitt wird die Methodik zur Generierung des vorgeschlagenen synthetischen Datensatzes beschrieben, einschließlich eines Gesamtarbeitsablaufs, der Modellierung des BEV-Verbrauchs in Wohngebieten, der Modellierung der PV-Erzeugung in Wohngebieten und der automatisierten ESS-Modellierung zur Synthese der Daten. Abschließend stellen wir das CTGAN vor, das zur Generierung synthetischer Daten verwendet wird.

Das Blockdiagramm in Abb. 1 zeigt den Arbeitsablauf unserer Methodik. Im Allgemeinen sind acht Phasen erforderlich, um den endgültigen synthetischen Datensatz zu erhalten. Zu diesen Phasen gehören die Datenerfassung, die Erstellung von PV- und EV-Jahresprofilen, die Bestimmung von Prosumern mit ESS, die Erstellung von ESS-Profilen, die Zusammenfassung der Prosumertypen, die Datenaufteilung, die Datenkennzeichnung und die Generierung synthetischer Daten. In der Datenerfassungsphase nutzen wir Energiedaten von 2.000 echten dänischen Verbrauchern, einschließlich importierter und exportierter Energiedaten in stündlicher Auflösung für 2019, die von unserem Projektpartner aus der Industrie bereitgestellt wurden. Diese Profile dienen als Grundlast. Hierbei handelt es sich um dänische Haushalte, die in derselben Nachbarschaft unter denselben Wetterbedingungen leben. Die Rohdaten wurden vom DataHub17 des dänischen Übertragungsnetzbetreibers (ÜNB) EnergiNet gesammelt, mit Zustimmung der Verbraucher gemäß den Datenschutzrichtlinien18 des Industriepartners, der Datenschutz-Grundverordnung (DSGVO)19 und dem dänischen Datenschutzgesetz20. Die Wetterdaten werden von OpenWeather für das spezifische Gebiet21 gesammelt und heruntergerechnet, um sie an die Auflösung der Energiedaten, d. h. die stündliche Auflösung, anzupassen. Während die Akzeptanzrate von BEV in den letzten Jahren exponentiell gestiegen ist22, gibt es nicht genügend BEV-Besitzer, die bereit sind, ihre Daten zu teilen, um beim Aufbau eines glaubwürdigen Datensatzes zu helfen. Darüber hinaus verwenden die meisten aktuellen BEV-Besitzer zu Hause langsame Ladegeräte und ihr BEV-Ladeverbrauch wird nicht separat erfasst. Daher benötigen wir ein ausgefeiltes BEV-Ladedatenmodell, um Daten für dänische EV-Besitzer in verschiedenen Szenarien zu generieren. Wir verwenden ein vertrauenswürdiges, validiertes Tool23 mit vielen Features und Funktionalitäten, um den Ladebedarf von Elektrofahrzeugen im dänischen Wohnsektor detailliert zu simulieren. Um die dänischen Fahrgewohnheiten einzubeziehen, haben wir dänische Mobilitätsstatistiken zur Anzahl der Fahrten pro Tag, Entfernung und Dauer, BEV-Spezifikationen wie Motortyp, Batteriegröße, Wärmeübertragung und anderen externen Faktoren wie Verfügbarkeit der Ladestation und Nennleistung des Elektroautos gesammelt Ladegeräte vom Statistikamt und BEV-Marktanteil in Dänemark24,25. Weitere Einzelheiten zu BEV-Ladedaten finden Sie im Abschnitt „EV-Profilgenerator“.

Der Datengenerierungsprozess bricht zusammen.

Wir hatten das gleiche Datenverfügbarkeitsproblem mit Daten zur PV-Erzeugung von Wohngebäuden. Bis Ende 2019 besaßen nur 13 % der dänischen Haushalte PV-Dachanlagen26. Außerdem wird die PV-Erzeugung nicht separat gemessen; Es sind nur exportierte Energiedaten verfügbar. Daher verwenden wir ein PV-Erzeugungsmodell, das lokale Wetterinformationen und systematische Verzerrungen des Meteosat-basierten Satellitendatensatzes berücksichtigt. Der Prozess der Synthese von PV-Erzeugungsdaten wird im Abschnitt „PV-Profilgenerator“ ausführlich erläutert. Nachdem die EV- und PV-Profile vorliegen, ist eine weitere Überlegung, ob die Prosumenten zu Hause über eine stationäre Batterie verfügen, was in der Phase der Bestimmung von Prosumenten mit ESS erfolgt. Hier haben wir willkürlich 300 Prosumer als ESS-Nutzer ausgewählt, da keine Daten über den aktuellen Status der Energiespeicherung für Privathaushalte in Dänemark vorliegen. Dennoch kann man von unterschiedlichen Durchdringungsniveaus ausgehen, um die Auswirkungen auf das importierte/exportierte Energieprofil der Prosumenten zu sehen. Für Verbraucher mit einer stationären Batterie an ihrem Standort wird ein regelbasiertes Automatisierungssystem entwickelt, um die Lade-/Entladeprofile der Batterie entsprechend dem Eigenverbrauch, der PV-Erzeugung und dem BEV-Verbrauch (falls vorhanden) zu erstellen. Die regelbasierte Steuerung für den ESS-Betrieb in Wohngebieten ist heutzutage der in der Branche am weitesten verbreitete Ansatz27. Wir erklären die ESS-Datengenerierung im Abschnitt „ESS-Profilgenerator“.

Mit den drei Modellen und echten Verbraucherdaten haben wir einen Seed-Datensatz erstellt, der fünf Arten von Prosumern mit unterschiedlichen Kombinationen von BTM-Geräten umfasst. Der Datensatz wird dann in Tagesprofile mit zwei Arten von Tagen aufgeteilt, nämlich Wochentage und andere Tage, einschließlich Feiertage und Wochenenden. Wie im Diagramm in Abb. 1 dargestellt, kennzeichnen wir die generierten Daten nach den beiden Arten von Tagen (Werktag oder andere), der mittleren Temperatur des Tages, der Standardabweichung der Tagestemperatur und vier Jahreszeiten, um eine Synthese zu erstellen Datensatz mit 12 CTGANs basierend auf ihren Benutzertypen. Weitere Einzelheiten finden Sie im Abschnitt „Generatives Modell für synthetische Daten“.

Die Stromverbrauchsprofile variieren aus vielen sozioökonomischen, kulturellen und technischen Gründen erheblich von Region zu Region. Während wir in dieser Studie den vorgeschlagenen Rahmen zur Synthese der Daten von Prosumenten und Verbrauchern in dänischen Wohngebieten verwendet haben, kann der vorgeschlagene Rahmen durch Anpassung der Eingabeparameter zur Synthese von Prosumenten- und Verbraucherdaten in jeder Region angewendet werden.

Die BEV-Ladeaktivität wird mit dem emobpy23 in PYTHON simuliert. emobpy ist ein Open-Source-Tool, das die Generierung von BEV-Ladeprofilen aus empirischen Mobilitätsstatistiken und physikalischen Eigenschaften von Fahrzeugen ermöglicht. Es modelliert die Fahrmobilität einzelner BEVs, den Stromverbrauch, die Netzverfügbarkeit und die importierte Energie aus dem Netz für einen Haushalt anhand von vier sequentiellen Modellen. Konkret nutzt das Fahrzeugmobilitätsmodell einen Stichprobenansatz, um auf Basis empirischer Wahrscheinlichkeitsverteilungen für jeden Tag des Berechnungszeitraums plausible Reiseabläufe zu generieren. Das Ergebnis dieses Modells ist eine chronologisch sortierte Liste von Reisen, dargestellt durch Kanten, die Ursprungs- und Zielorte mit Abfahrtszeit, zurückgelegter Entfernung und Reisedauer verbinden. Das Stromverbrauchsmodell schätzt eine Zeitreihe des Fahrstromverbrauchs von BEVs während der Fahrt. Es formuliert den Leistungsbedarf für Fahrzeugtraktion, -heizung und -kühlung unter Berücksichtigung der Fahrzeugmobilitätszeitreihen, die durch das Fahrzeugmobilitätsmodell, den Fahrzeugtyp, die Geschwindigkeit und das Gelände generiert werden. Das Netzverfügbarkeitsmodell berücksichtigt den treibenden Stromverbrauch und die Verfügbarkeit der Ladeinfrastruktur, um die Netzverfügbarkeitszeitreihe zu bestimmen, die den Prozentsatz der Zeit darstellt, in der das Laden für BEVs in einem bestimmten Gebiet möglich ist. Schließlich generiert die importierte Energie aus dem Netzmodell eine Zeitreihe des Netzstrombedarfs zum Laden von BEVs auf der Grundlage der Zeitreihen des treibenden Stromverbrauchs und der Netzverfügbarkeit, die von den vorherigen Modellen generiert wurden.

Um das Tool für unsere Anwendung umzufunktionieren, haben wir die vier in EMOBPY eingeführten Modelle in ein Modell integriert und Einstellungen angepasst, um ein neues Modell zu erstellen, das die physikalischen Eigenschaften und Wetterbedingungen des BEV als Eingaben verwendet und das BEV-Ladeprofil für Privathaushalte als Ausgabe extrahiert. Die in Abb. 1 dargestellten Eingabeparameter werden auf der Grundlage der BEV-Marktaufteilungsstatistik in Dänemark25 und Beschäftigungsdaten von Statistics Denmark24 erhoben. Unter Berücksichtigung der Gesamtdatenmenge und unter Ausschluss der Fehlerfälle haben wir für ein Jahr 743 private Ladeprofile von BEV-Nutzern erstellt, darunter unterschiedliche Beschäftigungsstatus, d. h. Vollzeit-, Teilzeit- und Freizeit-BEV-Nutzer sowie verschiedene BEV-Marken basierend auf den oben genannten Statistiken. Daher haben wir BEV-Ladeprofile für 538 Vollzeitnutzer, 178 Teilzeitnutzer und 30 Freizeitnutzer erstellt, die später zur Synthese vieler weiterer BEV-Nutzer verwendet werden. Der Einfachheit halber und weil wir keine Hybrid-Elektrofahrzeuge in die Studie einbeziehen, haben wir BEV-Benutzer im folgenden Datensatz als EV-Benutzer gekennzeichnet. Darüber hinaus berücksichtigen wir in diesem Beitrag nicht den Vehicle-to-Grid-Betrieb.

Wir haben Solar Ninja verwendet, um PV-Profile zu erstellen. Das Tool verwendet das GSEE-Modell (Global Solar Energy Estimator), um das Verhalten von Solaranlagen auf Dächern darzustellen, zusammen mit den globalen meteorologischen Neuanalysen und dem Meteosat-basierten CM-SAF SARAH-Satellitendatensatz, um stündliche PV-Erzeugungsprofile zu erstellen28. Genauer gesagt verwendet das Tool mathematische Modelle, um die Leistungsabgabe von PV-Modulen abzuschätzen, indem es die Sonneneinstrahlung auf der PV-Ebene berechnet und Wechselrichter- und Systemverluste berücksichtigt, die durch temperaturabhängige Moduleffizienzkurven verursacht werden. Daher ist das Modell deterministisch und erfordert Eingaben von diffuser Strahlung, direkter Strahlung, Temperatur, Breitengrad, Längengrad, Systemverlust, Neigung, Nennkapazität der Panels, Panelwinkel und Panelausrichtung. Das GSEE-Modell wurde in mehreren europäischen Ländern in verschiedenen Forschungsstudien validiert, z. B.29,30,31. Um die Fähigkeiten dieses Tools in unserer Studie zu nutzen, werden neben den Wetter- und geografischen Parametern auch andere Eingabeparameter (z. B. PV-Kapazität, Verluste und Neigung) von der PVoutput-Plattform32 abgerufen, einer öffentlichen Plattform zur gemeinsamen Nutzung von PV-Erzeugungsdaten für Privathaushalte . Darüber hinaus haben wir Datenblätter des dänischen Übertragungsnetzbetreibers verwendet, um typische Parameter wie PV-Kapazität, Neigung und Systemverlust für kleine PV-Wohnanlagen in Dänemark zu extrahieren33. Mit diesen Eingaben werden repräsentative Modelle erstellt, um PV-Erzeugungsdaten für die weitere Verwendung in dieser Studie zu synthetisieren.

Der Großteil der Forschung zu Energiespeichertechnologien in Dänemark lässt sich in zwei Typen einteilen: zentralisierte Lösungen und Speicherung auf Wohnebene, während die Studien im Allgemeinen auf einer aggregierten Ebene basieren, da Benutzer mit ESS tendenziell als Gruppe modelliert werden34,35,36,37. In unserem vorgeschlagenen Datensatz gehen wir davon aus, dass das ESS Privatanwendern gehört und mit einem einfachen regelbasierten Controller betrieben wird (eine in der Branche übliche Praxis, die als naive Betriebsmethode bezeichnet wird)27. Die Studie zeigt, dass die naive Operationsmethode in den meisten Fällen eine vergleichbare Leistung wie komplizierte stochastische Optimierungsmodelle aufweist27. Zur Simulation des ESS-Betriebs sind zwei Parameter erforderlich, nämlich die Ladekapazität (maximal nutzbarer Energiespeicher Smax) und die Lade-/Entladeleistungsgrenze Pmax. Diese beiden Parameter werden anhand der Wahrscheinlichkeitsverteilung verschiedener ESS-Marken basierend auf ihrem Marktanteil bei unserem Industriepartner13 und den ESS-Spezifikationen in38,39 generiert. Der regelbasierte Batteriecontroller funktioniert wie folgt, vorausgesetzt, dass der Ladezustand (State of Charge, SoC) zum Zeitpunkt t St ist:

Wenn der Nettobedarf positiv ist, d. h. die Erzeugung größer ist als der Bedarf (z. B. t>Ed, t), beträgt die Batterieladeleistung, also die stündliche Energie, \({\rm{\min }}\left({E }_{{\rm{g}},t}-{E}_{{\rm{d}},t},{P}_{{\rm{\max }}},{S}_{ {\rm{\max }}}-{S}_{t}\right)\), wobei die importierte Energie Null ist und die exportierte Energie sein wird:

Wenn die Nettonachfrage negativ ist, dh die Erzeugung kleiner oder gleich der Nachfrage ist (z. B. t > Ed, t), beträgt die exportierte Energie Null. Daher ist die Batterieentladeleistung gleich \({\rm{\min }}\left({E}_{{\rm{d}},t}-{E}_{{\rm{g}} ,t},{P}_{{\rm{\max }}},{S}_{t}\right)\), und die importierte Energie wird sein:

Mit der oben beschriebenen naiven Betriebsmethode wird die Batterie geladen, wenn überschüssige PV-Erzeugung verfügbar ist. Die Batterie wird entladen, um den Import von Energie aus dem Netz zu minimieren, wenn der Strombedarf der Haushalte höher ist als die PV-Erzeugung.

Mit den EV-, PV- und ESS-Profilgeneratoren erstellen wir einen Datensatz, der fünf Arten von Prosumern und einen Verbrauchertyp umfasst. Um die in „Hintergrund und Zusammenfassung“ erläuterten Datenschutzbedenken auszuräumen, haben wir die Zeitreihen jedes Benutzers in separate Tage aufgeteilt, diese in Tagesprofilen zusammengefasst und sie dann als Eingaben zur Generierung eines synthetischen Datensatzes verwendet. Weitere Eingabeparameter sind der Tagesmedian und die Standardabweichung der Temperatur als kontinuierliche Variablen sowie die Jahreszeit als kategoriale Variable. Zusammenfassend sind die Parameter wie folgt:

Art der Tage

Werktage (252 Tage): Alle Wochentage außer Feiertagen.

Andere Tage (113 Tage): Feiertage und Wochenenden.

Wichtige BTM-Ausrüstung

PV & ESS

PV & EV

PV & EV & ESS

Konventionelle Verbraucher

Temperatur

Tägliche Durchschnittstemperatur

Tägliche Standardabweichung der Temperatur

Jahreszeiten (Frühling, Sommer, Herbst und Winter)

Es gibt viele Techniken zur Synthese von Zeitreihen, darunter kopulabasierte Modelle40,41, flussbasierte Modelle42, Diffusionsmodelle43,44 und GAN-Modelle45,46,47. Obwohl Diffusionsmodelle bei der Generierung synthetischer Bilder eine bessere Leistung erbringen, werden GAN-basierte Modelle bei der Synthese von Zeitreihen aufgrund ihrer Fähigkeit zur Verallgemeinerung und Erzeugung einer Vielzahl von Daten mit hoher Wiedergabetreue bevorzugt48,49,50. In diesem Artikel verwenden wir das CTGAN-Modell, das ein bedingtes GAN und zwei Techniken enthält, um synthetische Daten aus tabellarischen realen Daten zu generieren. Genauer gesagt wendet das CTGAN eine Training-by-Sampling-Technik für kategoriale Spalten an und verwendet ein Variations-Gauß-Mischungsmodell (VGM) anstelle eines GMM (Gauß-Mischungsmodell) für numerische Spalten, um komplizierte Verteilungen genau zu modellieren. In dieser Studie haben wir 12 Arten von Prosumern/Konsumenten (basierend auf der oben aufgeführten BTM-Ausrüstung und der Art des Tages); daher 12 CTGANs, wie in Abb. 1 dargestellt. Anschließend werden die 12 CTGAN-Modelle basierend auf jedem Benutzerdatentyp trainiert. Mit diesen 12 Arten von Benutzermodellen generieren wir einen ausgewogenen synthetischen Datensatz. Das Benutzerverteilungsverhältnis zwischen den realen und synthetischen Datensätzen ist in Abb. 4 dargestellt. Die Hyperparameter der CTGANs sind in allen 12 Modellen identisch und wie in Tabelle 1 dargestellt eingestellt.

Unter Verwendung des in Abb. 1 diskutierten Frameworks wurde der endgültige synthetische Datensatz generiert. Der Datensatz wird der Öffentlichkeit bei Figshare51 in zwei Formaten zur Verfügung gestellt, nämlich als Pickle-Datei mit der gleichen Struktur wie in Abb. 2 zur ausschließlichen Verwendung in PYTHON und als XLSX-Datei für Benutzer, die mit Rechentools nicht vertraut sind51. Konkret handelt es sich bei der Pickle-Datei um ein verschachteltes Objekt, das sechs Benutzertypen nach ihrer Hauptausrüstung enthält, nämlich PV-Benutzer, PV- und ESS-Benutzer, PV- und EV-Benutzer, PV- und EV- und ESS-Benutzer, EV-Benutzer bzw. konventionelle Verbraucher. Für jeden Benutzertyp gibt es zwei Arten von Tagen, nämlich Arbeitstage und andere Tage, zu denen importierte und exportierte Energie, tägliche Durchschnittstemperatur, tägliche Temperaturstandardabweichung und Jahreszeit gehören. Andererseits stellt die XLSX-Datei sechs Arten von importierter und exportierter Energie der Benutzer unter zwei Arten von Tagen dar, jeweils mit einer eigenen formatierten Tabelle. Bemerkenswert ist, dass es insgesamt 20 Tabellen/Registerkarten gibt, da EV-Benutzer und konventionelle Verbraucher keine erneuerbare Energieerzeugung haben und daher keine Energie exportieren. Die Spalten jeder Tabelle enthalten die 24-Stunden-Zeitstempel eines Tages, also 0–23, die mittlere Temperatur, die Standardabweichung der Temperatur und die Jahreszeit. Im Online-Repository51 haben wir auch erklärt, wie man das XLSX-Arbeitsblatt in eine CSV-Datei konvertiert, um es Benutzern zu erleichtern, andere Berechnungstools als die in PYTHON anzuwenden.

Struktur des vorgeschlagenen Datensatzes.

Das öffentliche Repository enthält die in Abb. 3 gezeigten Dateien, wobei der Datenordner den vorgeschlagenen Datensatz in zwei Formaten enthält, einschließlich Pickle und XLSX51. Der Ordner „Ressourcen“ enthält Codes in PYTHON für die Datenkonvertierung und Datenanalyse. Der Ausgabeordner enthält die generierten visualisierten Ergebnisse aus der Ausführung des Plotanalysecodes „generate_plots_analysis.py“ im Ressourcenordner. Die Anforderungsdatei beschreibt die in diesem Projekt verwendeten Abhängigkeiten51.

Struktur der Datensatzdatei.

Benutzertypverteilungen (innerer Donut: reale Daten, äußerer Donut: synthetische Daten).

Wir haben die Qualität der synthetischen Daten mithilfe qualitativer Inspektion und drei numerischer Analysen validiert: empirische Statistiken, auf Informationstheorie basierende Metriken und ML-basierte Bewertungsmetriken52. Wie im „Hintergrund und Zusammenfassung“ erläutert, gibt es keinen gekennzeichneten, groß angelegten Datensatz zu echten Prosumenten. Daher verwenden wir den Eingabe-Seed-Datensatz für das synthetische Datengenerierungsmodell als realen Datensatz für Validierungszwecke. Wir besprechen die einzelnen Validierungsmethoden jeweils in den folgenden vier Unterabschnitten.

In Abb. 5 haben wir den durchschnittlichen saisonalen Verbrauch der konventionellen Verbraucher an Wochentagen verglichen. Dieses Durchschnittsprofil wird untersucht und mit den tatsächlichen Stromverbrauchsmerkmalen dänischer Privathaushalte auf aggregierter Ebene verglichen11,53. Die allgemeine Profilform und die Spitzenzeit des importierten Stroms um 19 Uhr sind ähnlich. Neben den durchschnittlichen Verbraucherprofilen verglichen wir die häufigsten täglichen Muster für jeden Prosumer-Typ, sogenannte Refined Motifs (RM), zwischen den realen und synthetischen Datensätzen4. Die Ergebnisse sind in Abb. 6 für verschiedene Arten von Prosumern und Tagen dargestellt. Die RMs für synthetische Daten und reale Daten weisen eine ähnliche Amplitude und einen ähnlichen Trend auf, was darauf hindeutet, dass der synthetische Datensatz ähnliche Formen wie der tatsächliche Datensatz aufweist4.

Vergleich des saisonalen Nachfrageprofils für konventionelle Verbraucher.

RM-Vergleich für reale und synthetische Daten (blau: synthetische Daten, orange: reale Daten).

Wir haben zunächst Boxplots verwendet, um die empirischen Statistiken der realen und synthetischen Datensätze visuell zu vergleichen, einschließlich des Grades der Streuung (Spreizung) und der Schiefe der beiden Datensätze, des 1. und 3. Quartils, des Interquartilbereichs, des Mittelwerts, des Medians, des Minimums, des Maximums und Ausreißer. Der erste Vergleich erfolgt für die aggregierten Daten, die in Abb. 7 getrennt für verschiedene Tagestypen und importierte/exportierte Energie dargestellt sind. Insgesamt folgen die synthetischen Datenstatistiken den Werten des realen Datensatzes. Der werktags importierte Energiedatensatz weist die höchsten Fehler für PV-, EV- und ESS-Benutzer auf, während die Statistiken der anderen Tage nahezu identisch sind. Wir haben auch die stündlich importierten und exportierten Boxplots der Energie für jeden Benutzertyp in den synthetischen und realen Datensätzen verglichen, dargestellt in Abb. 8, wobei die synthetischen Daten in jeder Abbildung dem allgemeinen Trend folgen. Um den Unterschied zwischen der realen und der synthetischen Datenverteilung zu quantifizieren, wird für jedes Intervall der Wasserstein-Abstand, ein Maß für den Abstand zwischen zwei Wahrscheinlichkeitsverteilungen54, berechnet. Die niedrigeren Wasserstein-Abstandswerte weisen auf eine größere Ähnlichkeit oder Überlappung zwischen den realen Daten und den synthetischen Datenverteilungen hin. Aus den Boxplots in Abb. 8 geht hervor, dass der synthetische Datensatz für einige Benutzertypen, z. B. PV-, EV- und ESS-Benutzer sowie PV- und EV-Benutzer, einen niedrigeren Maximalwert aufweist als die realen Daten. Ein Grund könnte die Verlustfunktion im CTGAN sein, ein Beweis für einen Verlust der unteren Grenze (ELBO), der die abnormalen Daten im Optimierungsprozess aus dem realen Datensatz auslässt. Aus der Wasserstein-Distanz weisen PV-, EV- und ESS-Benutzer bei allen Benutzertypen die größten Unterschiede zwischen den synthetischen und realen Datensätzen auf. Diese Beobachtung wird zusätzlich durch die täglichen Datenboxplots gestützt, die detaillierte Informationen zu den Interquartilbereichsunterschieden liefern. Insbesondere treten die größten Diskrepanzen bei PV-, EV- und ESS-Nutzern bei exportiertem Strom zwischen 8 und 11 Uhr und bei importiertem Strom zwischen 19 und 20 Uhr auf. Diese Zeiträume fallen mit einer hohen Stochastik in den Erzeugungs- und Nachfragedaten von Prosumern aufgrund des Einflusses der PV-Erzeugung, des Ladens von Elektrofahrzeugen und des ESS-Betriebs zusammen. Folglich führt diese Diskrepanz zu größeren Unterschieden in der empirischen Statistik auf aggregierter Ebene zwischen den synthetischen und realen Datensätzen.

Tägliche Statistiken (blau: synthetische Daten, orange: reale Daten).

Stündliche Statistiken an Werktagen. (Grün: Wasserstein-Distanz zwischen synthetischen und realen Daten. Blau: Boxplot synthetischer Daten, Orange: Boxplot realer Daten).

Permutationsentropie (PE) ist eine bekannte Metrik der Zeitreihen-Informationstheorie, die die Komplexität eines dynamischen Systems quantifiziert, indem sie die Ordnungsbeziehungen zwischen den Werten einer Zeitreihe erfasst und eine Wahrscheinlichkeitsverteilung der Ordinalmuster extrahiert52. In einem Versuch, einige Einschränkungen zu überwinden, z. B. die Unfähigkeit, zwischen unterschiedlichen Mustern zu unterscheiden, und die Unempfindlichkeit gegenüber Mustern in der Nähe des Grundrauschens, was es für Anwendungen wie die Analyse von Energiesystemdaten ungeeignet macht55, wurde die gewichtete Permutationsentropie (WPE) als Lösung vorgeschlagen Messen Sie mit größerer Robustheit und Stabilität durch die Einbeziehung von Amplitudeninformationen55,56.

Wir haben das WPE-Maß verwendet, um die Komplexität des synthetischen Datensatzes mit dem realen Datensatz für jeden Benutzertyp zu vergleichen. Die WPE-Hyperparameter werden basierend auf den Empfehlungen in57,58 auf die Größenordnung von 6 und eine Verzögerung von τ = 1 eingestellt. Ein Vergleich zwischen realen und synthetischen Daten ist in Tabelle 3 dargestellt. Unter idealen Bedingungen erwarten wir, dass beide Datensätze eine ähnliche Komplexität, d. h. WPE-Werte, aufweisen. Aus der Tabelle können wir ersehen, dass der synthetische Datensatz komplexer ist als die realen Daten, da der WPE für den synthetischen Datensatz höher ist. Die relative Beziehung zwischen verschiedenen Benutzertypen ist jedoch von realen bis zu synthetischen Datensätzen konsistent, wobei der synthetische Datensatz unabhängig vom Benutzertyp immer komplexer ist. Um die Robustheit dieser Funktion zu beweisen, haben wir den Datensatz in 50 Zeitreihen mit Daten im Wert von einem Jahr sowohl für reale als auch für synthetische Datensätze aufgeteilt. Anschließend haben wir den WPE für jede Zeitreihe berechnet, wie in Abb. 10 dargestellt. Wie erwartet weist der synthetische Datensatz bei verschiedenen Benutzertypen immer eine höhere Komplexität auf, obwohl die durchschnittlichen WPE-Werte zwischen dem realen und dem synthetischen Datensatz nahe beieinander liegen. Dies zeigt, dass das CTGAN die Komplexität des realen Datensatzes im Allgemeinen überschätzt. Allerdings entsprechen die Benutzertypen mit höherer Komplexität im synthetisierten Datensatz demselben Typ im realen Datensatz, was bedeutet, dass die Modelle die Merkmale und die relative Komplexität jedes Benutzertyps erfolgreich erfassen können.

Die vierte und letzte Vergleichsstudie verwendet ML-Klassifizierungsmodelle, um die Ähnlichkeit von Merkmalen zwischen den beiden Datensätzen zu bewerten. Genauer gesagt haben wir Train on Synthetic, Test on Real (TSTR) und Train on Real, Test on Real (TRTR)59 verwendet. TSTR bewertet die Leistung der synthetischen Daten, indem es ein Modell (Klassifikator) mit synthetischen Daten trainiert und es an realen Daten testet. Auf diese Weise weist ein synthetischer Datensatz nur dann eine hohe Qualität auf, wenn der mit synthetischen Daten trainierte Klassifikator eine ähnliche Leistung erbringt wie der mit realen Daten trainierte Klassifikator (TRTR). Wir haben ein 1D-Faltungs-Neuronales Netzwerk (CNN) angewendet, um fünf Arten von Prosumern zu klassifizieren, d. h. mit den in Tabelle 2 angegebenen Hyperparametern.

Mit demselben Klassifikator haben wir versucht, die Prosumer-Typen in den Datensätzen für Arbeitstage und andere Tage zu bestimmen. Die Ergebnisse der vier Kombinationen sind in Abb. 9 als Verwirrungsmatrizen dargestellt. Für die meisten Benutzertypen zeigt der Klassifikator ähnliche Ergebnisse für TRTR und TSTR, was die Existenz ähnlicher Merkmale sowohl in realen als auch in synthetischen Datensätzen beweist. Beim Vergleich von TSTR mit TRTR in Abb. 9 stellen wir fest, dass die allgemeine numerische Beziehung für die vorhergesagten Ergebnisse und die Grundwahrheit zwischen realen Daten und synthetischen Daten sehr ähnlich sind. Die Gesamtgenauigkeit, Präzision, Sensitivität (Recall) und Spezifität sind ebenfalls in den Tabellen 4 und 5 angegeben. Wir stellen eine Genauigkeitslücke von 10 % zwischen synthetischen und realen Datensätzen fest, was für einen synthetischen Datensatz akzeptabel ist, siehe z. B. Tabelle 6 in60. Bei der Arbeitstagsklassifizierung in Abb. 9 könnten PV-Benutzer im Vergleich zu TSTR fälschlicherweise als EV & PV & ESS identifiziert werden. Ein möglicher Grund könnten die ähnlichen Komplexitätswerte der beiden Benutzertypen im synthetischen Datensatz im Vergleich zum realen Datensatz sein (siehe Tabelle 3), was darauf hindeutet, dass ihre Häufigkeiten und Amplituden bei Schwankungen ähnlich sind.

Verwirrungsmatrizen für Benutzer.

WPE für verschiedene Benutzertypen (50) im jährlichen Rhythmus (blau: synthetische Daten, orange: reale Daten).

Die erste Einschränkung unseres synthetischen Datensatzes ist die stündliche Auflösung, die für einige Anwendungen, wie z. B. Energiedisaggregation und Stromqualitätsanalyse, nicht ausreicht. Untersuchungen zeigen außerdem, dass die Verwendung stündlicher Daten zur Schätzung des Eigenverbrauchs von PV-Nutzern aufgrund des Informationsverlusts zu einer bis zu 9 %igen Überschätzung führen kann61. Der vorgestellte synthetische Datensatz kann jedoch für viele Studien verwendet werden, z. B. zur Nachfragesteuerung, zum umgekehrten Stromfluss von Prosumern, zur Untersuchung der Auswirkungen unterschiedlicher Akzeptanzraten und zum nachfrageseitigen Management. Eine weitere Einschränkung besteht darin, dass die Komplexität synthetischer Daten aufgrund der Struktur von CTGAN tendenziell überschätzt wird, wie wir im Abschnitt „Datenvalidierung“ erläutert haben. Zu guter Letzt berücksichtigt der Datensatz die Verhaltensgewohnheiten und Veränderungen auf Geräteebene der Prosumenten im Laufe der Zeit nicht vollständig, da der Seed-Datensatz keine Beschriftungen für die Geräte jedes Endbenutzers enthält. Eine potenzielle Verbesserung zur Einbeziehung zusätzlicher Verhaltensstochastik im Zusammenhang mit dem Strombedarf von Geräten ist die Verwendung eines auf Physik basierenden Bottom-up-Modells, z. B. der StROBe-Bibliothek, wenn die Benutzer bestimmte Geräte mit Kenntnissen über die Verteilung detaillierter physikalischer Parameter hinzufügen möchten12. Allerdings wird dadurch ein synthetischer Datensatz mit höherer Komplexität erzeugt, der über die im Abschnitt „Metriken der Informationstheorie“ berichteten Ergebnisse hinausgeht, was nicht wünschenswert ist.

Die als Eingabe für CTGAN verwendeten realen Daten sind aufgrund von Vorschriften zum Schutz der Privatsphäre der Verbraucher nicht verfügbar18. Andere, die die Arbeit wiederholen oder Studien mit den Rohdaten durchführen möchten, sollten sich an Watts A/S13 wenden. Der Code zur Datenvalidierung und -analyse ist im öffentlichen Repository von Figshare51 verfügbar.

Bp. Statistischer Überblick über die Weltenergie, https://www.bp.com/en/global/corporate/energy-economics/statistical-review-of-world-energy.html (2022).

Nalley, S. & Larose, A. Internationaler Energieausblick 2021. Tech. Rep. https://www.eia.gov/outlooks/ieo/pdf/IEO2021_ReleasePresentation.pdf (2021).

Wood Mackensiz. Batterieelektrische Fahrzeuge werden bis 2050 den Fahrzeugabsatz dominieren, https://www.woodmac.com/press-releases/battery-electric-vehicles-to-dominate-vehicle-sales-by-2050/ (2021).

Yuan, R., Pourmousavi, SA, Soong, WL, Nguyen, G. & Liisberg, JA Irmac: Interpretierbare verfeinerte Motive in der binären Klassifizierung für Smart-Grid-Anwendungen. Technische Anwendungen künstlicher Intelligenz 117, 11, https://doi.org/10.1016/j.engappai.2022.105588 (2023).

Artikel Google Scholar

Shaw, M. et al. Der Energiespeicherversuch der nächsten Generation in Australien. In Proceedings of the Tenth ACM International Conference on Future Energy Systems, e-Energy' 19, 439–442, https://doi.org/10.1145/3307772.3331017 (Association for Computing Machinery, New York, NY, USA, 2019).

Jim, M. & Russo, S. Pecan Street Jahresbericht GJ 2020–2021. Technik. Rep., Pecan Street Inc. https://www.pecanstreet.org/wp-content/uploads/2022/06/Pecan-Street-Annual-Report-20-21.pdf (2021).

Kapoor, S., Sturmberg, B. & Shaw, M. Eine Überprüfung öffentlich verfügbarer Energiedatensätze. Technik. Rep. 00120, The Australian National University, Canberra ACT 2601 Australien. https://arena.gov.au/projects/wattwatchers- (2021).

Li, H., Wang, Z. & Hong, T. Ein synthetischer Datensatz zum Gebäudebetrieb. Wissenschaftliche Daten 8, 1–13, https://doi.org/10.1038/s41597-021-00989-6 (2021).

Artikel ADS Google Scholar

Modellierung des Energiebedarfs von Gebäuden: vom einzelnen Gebäude bis zum städtischen Maßstab. In Eicker, U. (Hrsg.) Urban Energy Systems for Low-Carbon Cities, 79–136, https://doi.org/10.1016/B978-0-12-811553-4.00003-2 (Academic Press, 2019).

Pereira, L., Costa, D. & Ribeiro, M. Ein mit Wohngebieten gekennzeichneter Datensatz für die Datenanalyse intelligenter Zähler. Wissenschaftliche Daten 9, 1–11, https://doi.org/10.1038/s41597-022-01252-2 (2022).

Artikel Google Scholar

Andersen, FM, Gunkel, PA, Jacobsen, HK & Kitzing, L. Stromverbrauch in Wohngebieten und Haushaltsmerkmale: Eine ökonometrische Analyse dänischer Smart-Meter-Daten. Energy Economics 100, 105341, https://doi.org/10.1016/j.eneco.2021.105341 (2021).

Artikel Google Scholar

Baetens, R. & Saelens, D. Modellierungsunsicherheit in Bezirksenergiesimulationen durch stochastisches Verhalten der Wohnbewohner. Journal of Building Performance Simulation 9, 431–447, https://doi.org/10.1080/19401493.2015.1070203 (2016).

Artikel Google Scholar

Anders, SH, Jon, L. & Julian, LV Watts A/S, sollen wir gemeinsam etwas bewirken?, https://watts.dk/ (2021).

Li, H. et al. Datengesteuerte Leistungskennzahlen und Datensätze für die Gebäudeenergieflexibilität: Ein Rückblick und Perspektiven https://doi.org/10.48550/ARXIV.2211.12252 (2022).

Artikel Google Scholar

Qiu, Y. & Kahn, ME Bessere Nachhaltigkeitsbewertung grüner Gebäude mit Hochfrequenzdaten. Nature Sustainability 1, 642–649, https://doi.org/10.1038/s41893-018-0169-y (2018).

Artikel Google Scholar

Beratung, NE Bewertung der Lastflexibilität im NEM, vorbereitet für die australische Agentur für erneuerbare Energien. Technik. Rep. Februar, Australische Agentur für erneuerbare Energien. https://arena.gov.au/assets/2022/02/valuing-load-flexibility-in-the-nem.pdf (2022).

Das Energienetz. Was ist DATAHUB?, https://en.energinet.dk/energy-data/datahub/ (2019).

Watt. Richtlinie zu personenbezogenen Daten für Watts, https://watts.dk/en/persondata/ (2022).

Europäisches Parlament und Rat der Europäischen Union. Europäische Datenschutzverordnung, https://gdpr-info.eu/ (2018).

Das dänische Parlament. Gesetz zur Ergänzung der Verordnung zum Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten und zum freien Datenverkehr (Datenschutzgesetz), https://www.retsinformation.dk/eli/lta/2018/502 (2018). ).

OpenWeather. OpenWeather: Wettervorhersagen, Nowcasts und Verlauf auf schnelle und elegante Weise, https://openweathermap.org/ (2019).

TCP, H. Dänemark EV-Einführung nach Jahr, https://ieahev.org/countries/Denmark/ (2019).

Gaete-Morales, C., Kramer, H., Schill, WP & Zerrahn, A. Ein offenes Tool zur Erstellung von Zeitreihen für batterieelektrische Fahrzeuge aus empirischen Daten, Emobpy. Wissenschaftliche Daten 8, 1–18, https://doi.org/10.1038/s41597-021-00932-9 (2021).

Artikel Google Scholar

Statistik Dänemark. Arbeit und Einkommen, https://www.dst.dk/en/Statistik/emner/arbejde-og-indkomst.

Hall, D., Wappelhorst, S., Mock, P. & Lutsey, N. European Electric Vehicle Factbook 2019/2020. The International Council On Clean Transportation 19, https://theicct.org/sites/default/files/publications/EV-EU-Factbook-2020.pdf (2020).

Jaganmohan, M. Anteil der Haushalte mit grünen Energiequellen in Dänemark 2019, https://www.statista.com/statistics/1088463/share-of-households-with-green-energy-sources-in-danemark (2019).

Lemos-Vinasco, J., Schledorn, A., Pourmousavi, SA & Guericke, D. Ökonomische Bewertung stochastischer Hausenergiemanagementsysteme in einer realistischen Umgebung mit rollierendem Horizont https://doi.org/10.48550/ARXIV.2203.08639 (2022) .

Artikel Google Scholar

Pfenninger, S. & Staffell, I. Langfristige Muster der europäischen PV-Leistung anhand von 30 Jahren validierter stündlicher Neuanalyse und Satellitendaten. Energie 114, 1251–1265, https://doi.org/10.1016/j.energy.2016.08.060 (2016).

Artikel Google Scholar

Grams, CM, Beerli, R., Pfenninger, S., Staffell, I. & Wernli, H. Ausgleich der europäischen Windenergieproduktion durch räumlichen Einsatz unter Berücksichtigung des Wetterregimes. Naturklimawandel 7, 557–562, https://doi.org/10.1038/nclimate3338 (2017).

Artikel PubMed PubMed Central Google Scholar

Zeyringer, M., Price, J., Fais, B., Li, P.-H. & Sharp, E. Entwurf kohlenstoffarmer Energiesysteme für Großbritannien im Jahr 2050, die robust gegenüber räumlich-zeitlichen und jährlichen Wetterschwankungen sind. Nature Energy 3, 395–403, https://doi.org/10.1038/s41560-018-0128-x (2018).

Artikel ADS CAS Google Scholar

Brown, T., Schlachtberger, D., Kies, A., Schramm, S. & Greiner, M. Synergien von Sektorkopplung und Übertragungsverstärkung in einem kostenoptimierten, hoch erneuerbaren europäischen Energiesystem. Energie 160, 720–739, https://doi.org/10.1016/j.energy.2018.06.222 (2018).

Artikel Google Scholar

PVOutput: ein kostenloser Dienst zum Teilen und Vergleichen von PV-Ausgabedaten, https://pvoutput.org/about.html (2022).

Die dänische Energieagentur und Energinet. Technologiedaten - Strom- und Fernwärmeerzeugung. Technik. Rep. https://ens.dk/en/our-services/projections-and-models/technology-data/technology-data-generation-electricity-and (2016).

Sorknæs, P., Mæng, H., Weiss, T. & Andersen, AN Überblick über den aktuellen Status und zukünftige Entwicklungsszenarien des Elektrizitätssystems in Dänemark – Ermöglichung der Integration großer Mengen Windkraft. https://www.store-project.eu/documents/target-country-results/en_GB/energy-storage-needs-in-denmark (2013).

Pedersen, AS et al. Status und Empfehlungen für Forschung und Entwicklung zu Energiespeichertechnologien im dänischen Kontext. Technik. Rep. Februar, Energinet. http://energinet.dk/SiteCollectionDocuments/Danskedokumenter/Forskning-PSO-projekter/RDD Energy storage_ex app.pdf (2014).

EA-Energieanalysen. Der Wert der Stromspeicherung – Ein Ausblick auf Dienstleistungen und Marktchancen auf dem dänischen und internationalen Strommarkt. Technik. Rep., Energinet. https://en.energinet.dk/Analysis-and-Research/Analyses/The-value-of-electricity-storage/ (2020).

Dinh, NT et al. Optimale Dimensionierung und Planung von Gemeinschaftsbatteriespeichern innerhalb eines lokalen Marktes. In Proceedings of the Thirteenth ACM International Conference on Future Energy Systems, e-Energy' 22, 34–46, https://doi.org/10.1145/3538637.3538837 (Association for Computing Machinery, New York, NY, USA, 2022).

Langby, C. Heimbatteriespeicher, https://mozo.com.au/energy/guides/home-battery-storage (2021).

Energie, V. ESS-Design- und Installationshandbuch. Technik. Rep., Victron Energie. https://www.solar-electric.com/lib/wind-sun/VE-ESS_design_and_installation_manual.pdf (2018).

Abraj, M., Wang, YG & Thompson, MH OPEN Ein neues Mischungskopulamodell für räumlich korrelierte mehrere Variablen mit einer Umweltanwendung. Wissenschaftliche Berichte 1–10, https://doi.org/10.1038/s41598-022-18007-z (2022).

Lemos-Vinasco, J., Bacher, P. & Møller, JK Probabilistische Lastvorhersage unter Berücksichtigung der zeitlichen Korrelation: Online-Modelle zur Vorhersage der elektrischen Last von Haushalten. Applied Energy 303, 117594, https://doi.org/10.1016/j.apenergy.2021.117594 (2021).

Artikel Google Scholar

Rezende, DJ & Mohamed, S. Variationsinferenz mit normalisierenden Flüssen. 32. Internationale Konferenz über maschinelles Lernen, ICML 2015 2, 1530–1538 (2015).

Google Scholar

Tashiro, Y., Song, J., Song, Y. & Ermon, S. Csdi: Bedingte punktebasierte Diffusionsmodelle für die probabilistische Zeitreihenimputation. Fortschritte in neuronalen Informationsverarbeitungssystemen 34, 24804–24816, https://arxiv.org/abs/2107.03502 (2021).

Dhariwal, P. & Nichol, A. Diffusionsmodelle schlagen GANs bei der Bildsynthese. Fortschritte in neuronalen Informationsverarbeitungssystemen 34, 8780–8794, https://doi.org/10.48550/arXiv.2105.05233 (2021).

Artikel Google Scholar

Alzantot, M., Chakraborty, S. & Srivastava, M. SenseGen: Eine Deep-Learning-Architektur für die Generierung synthetischer Sensordaten. 2017 IEEE International Conference on Pervasive Computing and Communications Workshops, PerCom Workshops 2017 188–193, https://doi.org/10.1109/PERCOMW.2017.7917555 (2017).

Patki, N., Wedge, R. & Veeramachaneni, K. GaussianCopula – Der synthetische Datentresor SDV. Tagungsband – 3. IEEE International Conference on Data Science and Advanced Analytics, DSAA 2016 399–410 (2016).

Asre, S. & Anwar, A. Generierung synthetischer Energiedaten mithilfe eines zeitvarianten generativen gegnerischen Netzwerks. Elektronik (Schweiz) 11, https://doi.org/10.3390/electronics11030355 (2022).

Yoon, J. & Jarrett, D. Zeitreihengenerative gegnerische Netzwerke. 33. Konferenz über neuronale Informationsverarbeitungssysteme (NeurIPS 2019) 1–11 (2019).

Yu, L., Zhang, W., Wang, J. & Yu, Y. SeqGAN: Sequenzgenerative gegnerische Netze mit Politikgradienten. 31. AAAI-Konferenz zu Künstlicher Intelligenz, AAAI 2017 2852–2858 (2017).

Ping, H., Stoyanovich, J. & Howe, B. DataSynthesizer: Datenschutzschonende synthetische Datensätze. ACM International Conference Proceeding Series Teil F1286, https://doi.org/10.1145/3085504.3091117 (2017).

Yuan, R. et al. Ein synthetischer Datensatz dänischer Privatstromprosumenten, figshare, https://doi.org/10.6084/m9.figshare.c.6383862.v1 (2023).

Bandt, C. & Pompe, B. Permutationsentropie: Ein natürliches Komplexitätsmaß für Zeitreihen. Physical Review Letters 88, 4, https://doi.org/10.1103/PhysRevLett.88.174102 (2002).

Artikel CAS Google Scholar

Andersen, FM, Baldini, M., Hansen, LG & Jensen, CL Stündlicher Stromverbrauch und Spitzenbedarf privater Haushalte in Dänemark. Angewandte Energie 208, 607–619, https://doi.org/10.1016/j.apenergy.2017.09.094 (2017).

Artikel Google Scholar

Panaretos, VM & Zemel, Y. Statistische Aspekte von Wasserstein-Entfernungen. Jährliche Überprüfung der Statistiken und ihrer Anwendung 6, 405–431 (2019).

Artikel ADS MathSciNet Google Scholar

Fadlallah, B., Chen, B., Keil, A. & Príncipe, J. Gewichtete Permutationsentropie: Ein Komplexitätsmaß für Zeitreihen, die Amplitudeninformationen enthalten. Physical Review E – Statistical, Nonlinear, and Soft Matter Physics 87, 1–7, https://doi.org/10.1103/PhysRevE.87.022911 (2013).

Artikel CAS Google Scholar

Vuong, PL, Malik, AS & Bornot, J. Gewichtete Permutationsentropie als Komplexitätsmaß für elektroenzephalographische Zeitreihen verschiedener physiologischer Zustände. IECBES 2014, Tagungsband – 2014 IEEE Conference on Biomedical Engineering and Sciences: „Miri, Where Engineering in Medicine and Biology and Humanity Meet“ 979–984, https://doi.org/10.1109/IECBES.2014.7047658 (2014).

Yin, Y. & Shang, P. Gewichtete Permutationsentropie basierend auf verschiedenen symbolischen Ansätzen für Finanzzeitreihen. Physica A: Statistical Mechanics and its Applications 443, 137–148, https://doi.org/10.1016/j.physa.2015.09.067 (2016).

Artikel ADS Google Scholar

Niu, H., Wang, J. & Liu, C. Analyse der Rohölmärkte mit verbesserter multiskaliger gewichteter Permutationsentropie. Physica A: Statistische Mechanik und ihre Anwendungen 494, 389–402, https://doi.org/10.1016/j.physa.2017.12.049 (2018).

Artikel ADS Google Scholar

Hartmann, KG, Schirrmeister, RT & Ball, T. Eeg-gan: Generative kontradiktorische Netzwerke für elektroenzephalographische (EEG) Gehirnsignale. arXiv-Vorabdruck https://doi.org/10.48550/arXiv.1806.01875 (2018).

Artikel Google Scholar

Cheon, MJ et al. CTGAN VS TGAN? Welches eignet sich besser zur Generierung synthetischer EEG-Daten? Journal of Theoretical and Applied Information Technology 99, 2359–2372 (2021).

Google Scholar

Ayala-Gilardón, A., Sidrach-de Cardona, M. & Mora-López, L. Einfluss der Zeitauflösung auf die Schätzung des Eigenverbrauchs und der Autarkie von Photovoltaikanlagen. Applied Energy 229, 990–997, https://doi.org/10.1016/j.apenergy.2018.08.072 (2018).

Artikel Google Scholar

Referenzen herunterladen

Dieses Projekt wird gemeinsam vom Industrie-PhD-Stipendienprogramm der Universität Adelaide und Watts A/S, Dänemark, finanziert, das herkömmliche Verbraucherdaten als Eingabedatenquelle bereitstellt.

Fakultät für Elektrotechnik und Maschinenbau, Universität Adelaide, Adelaide, Australien

Rui Yuan, S. Ali Pourmousavi und Wen L. Soong

School of Computer and Mathematical Sciences, The University of Adelaide, Adelaide, Australien

Andrew J. Black

Watts A/S, Køge, Dänemark

Jon AR Liisberg & Julian Lemos-Vinasco

Sie können diesen Autor auch in PubMed Google Scholar suchen

AP und RY konzipierten das/die Experiment(e), RY führte das/die Experiment(e) durch, JR und JL lieferten und validierten Daten, RY, AP, WS und AB analysierten die Ergebnisse. Alle Autoren haben das Manuskript überprüft.

Korrespondenz mit Rui Yuan.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Yuan, R., Pourmousavi, SA, Soong, WL et al. Ein synthetischer Datensatz dänischer Privatstromprosumenten. Sci Data 10, 371 (2023). https://doi.org/10.1038/s41597-023-02271-3

Zitat herunterladen

Eingegangen: 13. Januar 2023

Angenommen: 26. Mai 2023

Veröffentlicht: 08. Juni 2023

DOI: https://doi.org/10.1038/s41597-023-02271-3

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt