Dokumentation und Hilfe
Hinweis:
Die Dokumentation befindet sich derzeit noch im Aufbau und wird fortlaufend ergänzt.Bei Fragen, Problemen oder Fehlern in der Dokumentation schreiben Sie eine Mail an support@okeanos.ai
Allgemein
Der Begriff Jährlichkeit definiert die Wahrscheinlichkeit für das Eintreten eines Ereignisses mit der dazugehörigen Abflussmenge.
Im Falle eines HQ100 z.B. beträgt die Wahrscheinlichkeit 0,01 pro Jahr, dass dieses Ereignis eintritt oder überschritten wird.
Ein alternativer Begriff zur Jährlichekit, ist das Wiederkehrintervall.
Es ist möglich, dass im Profil Jährlichkeiten von bis zu 10.000 Jahre gespeichert werden können.
Bedenken Sie, dass Jährlichkeiten größer als 200 Jahre, zu deutlichen Unsicherheiten führen.
Derzeit werden die ausgewählten Daten auf abhängige Ereignisse geprüft.
Das bedeutet, dass der Abstand zwischen den Ereignissen mindestens 7 Tage betragen muss, sonst handelt es sich um ein abhängiges Ereignis.
Diese Prüfung wird für alle Datentypen durchgeführt, mit Außnahme der täglichen Daten.
Die Anzahl an abhängigen Ereignissen bezieht sich daher auf die im Pegelbaum ausgewählten Daten, auch wenn die Daten für die statistische Methode
intern nochmal aggregiert werden.
Daten
Bei dieser Methode können Sie Ihren Datensatz temporär abspeichern. Das bedeutet,
sobald Sie einen neuen Datensatz hochladen, verfällt der ursprüngliche Datensatz
oder wird bei gleicher Benennung überschrieben. Um diese Daten erneut verwenden zu können,
müssen diese auch erneut hochgeladen oder permanent in der Datenbank gespeichert werden.
Der aktuell verwendete Datensatz ist oben rechts unter „Aktiver Datensatz“ zu finden.
Sollten Sie während einer aktiven Sitzung einen anderen Datensatz im Pegelkatalog ausgewählt haben,
so besteht die Möglichkeit im Katalog unter „Hochgeladen“ den ursprünglichen temporären Datensatz wieder auszuwählen.
In der Abfluss-Datenbank haben Sie die Möglichkeit mehrere Datensätze einem Flusseinzugsgebiet zu zuweisen.
Dadurch werden die Datensätze permanent gespeichert und ein schneller Wechsel zwischen den Datensätzen ist über den Pegelkatalog möglich.
Alternativ zum Flusseinzugsgebiet können z.B. auch Projektnamen eingegeben werden, wodurch die Organisation der Daten erleichtert wird.
Jede/r Nutzer/in ist einem Lizenzhalter zugewiesen. Ein Lizenzhalter ist eine Firma, Institution, Uni etc.,
die eine gewisse Anzahl an Lizenzen erwirbt und diese intern weitervergibt.
Alle Nutzer eines Lizenzhalters haben Zugriff auf dieselbe Datenbank.
Es ist daher möglich, die Daten der eines anderen Nutzers zu sehen, zu löschen oder zu überschreiben.
Welche/r Nutzer/in welche Daten hochgeladen hat ist jedoch nicht zu erkennen.
Extremwertstatistik
Bei dem Kolmogorov-Smirnov Test werden sowohl die empirische Verteilungsfunktion als auch eine theoretische Verteilungsfunktion
(z. B. GEV, Gumbel…) an die Daten angepasst. Beide Verteilungsfunktionen werden dann miteinander verglichen,
indem die betragsmäßig größte Differenz zwischen beiden ermittelt wird,
um die Aussage treffen zu können, ob die Daten der theoretischen Verteilungsfunktion folgen oder nicht.
Im Vergleich zu einer theoretischen Verteilungsfunktion (z.B. GEV, Gumbel), die zeigt, wie wahrscheinlich es ist, dass ein bestimmter Wert höchstens erreicht wird, zeigt die empirische Verteilungsfunktion wie hoch der Anteil der Stichprobe kleiner oder gleich diesem Wert ist. Die Hypothesen lauten wie folgt: Nullhypothese (H0): Die Daten folgen der theoretischen Verteilung
Alternativhypothese (H1): Die Daten folgen der theoretischen Verteilung nicht
Die Nullhypothese wird verworfen, wenn der p-Wert unterhalb des Signifikanzniveaus von 0,05 liegt.
Die Ausgabe innerhalb dieser Software entspricht dem p-Wert.
Im Vergleich zu einer theoretischen Verteilungsfunktion (z.B. GEV, Gumbel), die zeigt, wie wahrscheinlich es ist, dass ein bestimmter Wert höchstens erreicht wird, zeigt die empirische Verteilungsfunktion wie hoch der Anteil der Stichprobe kleiner oder gleich diesem Wert ist. Die Hypothesen lauten wie folgt:
Die Ausgabe innerhalb dieser Software entspricht dem p-Wert.
Bei dem Cramér-von-Mises Test ist eine Abwandlung des Kolmogorov-Smirnov Tests, mit dem Unterschied, dass die Summe der quadrierten
Abweichungen zwischen der theoretischen und empirischen Unterschreitungswahrscheinlichkeit berechnet wird.
Die Hypothesen lauten wie folgt:
Nullhypothese (H0): Die Daten folgen der theoretischen Verteilung
Alternativhypothese (H1): Die Daten folgen der theoretischen Verteilung nicht
Die Nullhypothese wird verworfen, wenn der p-Wert unterhalb des Signifikanzniveaus von 0,05 liegt.
Die Ausgabe innerhalb dieser Software entspricht dem p-Wert.
Die Ausgabe innerhalb dieser Software entspricht dem p-Wert.
Der Anderson-Darling Test vergleicht die Häufigkeitsverteilung mit einer theoretischen Verteilungsfunktion. Anders als beim KS-Test,
wird die Summe der quadrierten Abweichung berechnet.
Die Hypothesen lauten wie folgt:
Nullhypothese (H0): Die Häufigkeitsverteilung entspricht der theoretischen Verteilung
Alternativhypothese (H1): Die Häufigkeitsverteilung entspricht der theoretischen Verteilung nicht
Die Nullhypothese wird verworfen, wenn der p-Wert unterhalb des Signifikanzniveaus von 0,05 liegt.
Die Ausgabe innerhalb dieser Software entspricht dem p-Wert.
Die Ausgabe innerhalb dieser Software entspricht dem p-Wert.
Hierbei wird der Korrelationskoeffizient zwischen der geordneten Stichprobe und der Quantilsfunktion der
gewählten theoretischen Verteilungsfunktion. Ein Wert von 0 bedeutet, dass keine Korrelation vorliegt.
Dagegen bedeutet ein Wert von 1, dass eine Korrelation vorliegt.
Die Ausgabe innerhalb dieser Software entspricht dem Korrelationskoeffizienten, welcher zwischen 0 und 1 liegt.
Durch Informationskriterien ist es möglich, verschiedene Verteilungsfunktionen miteinander zu vergleichen.
Prinzipiell wird ein Kompromiss zweischen der Anpassungsgüte und der Komplexität einer Verteiungsfunktion gefunden. Die Komplexität
definert sich über die Anzahl der Verteilungsparameter, weshalb es vorkommen kann, dass Verteilungsfunktionen mit wenigen Parametern begünstigt werden.
Denn auch wenn die Anpassung komplexer Verteilungsfunktionen geringfügig besser ist, steigen auch deren Unsicherheiten, was Informationskriterien negativ
bewerten.
Die beiden Informationskriterien AIC (Akaike-Kriterium )und BIC (Bayes´sche Kriterium) sind die am häufigsten verwendeten Kriterien. Anders als bei den Anpassungstests, wird hier kein p-Wert ausgegeben und mit dem Signifikanznveau verglichen. Sowohl für AIC und BIC wird die Wahl auf die Verteilungsfunktion festgelegt, die den niedrigsten Wert aufweist. Von diesem Minimum aus, werden alle Verteilungsfunktionen verworfen, die um mehr als 6 abweichen oder nicht berechnet werden konnten.
Verteilungsfunktionen, die um weniger als 6 vom Minimum abweichen, können als geeignet angesehen werden. Ergänzend folgt bei der Wahl der Verteilungsfunktion/en nach wie vor die visuelle und hydrologische Beurteilung.
Die beiden Informationskriterien AIC (Akaike-Kriterium )und BIC (Bayes´sche Kriterium) sind die am häufigsten verwendeten Kriterien. Anders als bei den Anpassungstests, wird hier kein p-Wert ausgegeben und mit dem Signifikanznveau verglichen. Sowohl für AIC und BIC wird die Wahl auf die Verteilungsfunktion festgelegt, die den niedrigsten Wert aufweist. Von diesem Minimum aus, werden alle Verteilungsfunktionen verworfen, die um mehr als 6 abweichen oder nicht berechnet werden konnten.
Verteilungsfunktionen, die um weniger als 6 vom Minimum abweichen, können als geeignet angesehen werden. Ergänzend folgt bei der Wahl der Verteilungsfunktion/en nach wie vor die visuelle und hydrologische Beurteilung.
In der Hydrologie ist es üblich ein Signifikanzniveau von 5% anzunehmen, daher ist dieser Wert in allen Fällen,
mit 0,05 fest definiert.
Dieser Wert kann nicht verändert werden.
Partielle Serien
Eigene partielle Serien zu verwenden ist grundsätzlich möglich. Wenn diese hochgeladen wird, erscheint im Pegelkatalog
ein P (Partielle Serie).
Um die Extremwertstatistik ordnungsgemäß auf eine eigenee partiellen Serie anzuwenden,
trägt man im Reiter "Partielle Serien" den Grenzwert (eigener Grenzwert) von 0 ein.