Post-Selektive Inferenz

In der klassischen Statistik werden Modellwahl und Inferenz als getrennte Schritte betrachtet: Zunächst wird ein Modell spezifiziert, anschließend erfolgt die Inferenz auf unabhängigen Daten. In der Forschungspraxis werden jedoch häufig datengetriebene Verfahren zur Modellselektion eingesetzt. Werden dieselben Daten anschließend auch für die Inferenz genutzt, kann dies zu einer erhöhten Alpha-Fehlerrate führen, weil die Modellwahl die Verteilung der Teststatistiken beeinflusst. Wir beschäftigen uns mit Methoden der post-selektiven Inferenz, die auch nach datengetriebener Modellwahl valide statistische Schlussfolgerungen ermöglichen. In Simulationsstudien untersuchen wir, unter welchen Bedingungen naive Inferenz nach Modellwahl besonders problematisch ist und wie gut verschiedene Korrekturverfahren funktionieren – insbesondere im Hinblick auf die Kontrolle der Fehlerraten und die Teststärke. Dabei betrachten wir sowohl Situationen, in denen das selektierte Modell dem wahren datengenerierenden Modell entspricht, als auch Fälle, in denen das selektierte Modell fehlspezifiziert ist. Ziel ist es, bestehende Ansätze systematisch zu evaluieren und mögliche Verbesserungen zu entwickeln. Unser aktueller Fokus liegt auf post-selektiver Inferenz in ALMs und LMMs.

Einschlägige Publikationen / Projects in Progress

Nikolei, A., & Scharf, F. (in prep.). Simulation-Based Evaluation of Selective Inference in Linear Mixed Models: A Closer Look at the Approach of Rügamer et al. (2022).

Nikolei, A., & Scharf, F. (in prep.). Correct Post-Selective Inference via SelfmadeCarving.