[Fortsetzung des Projektes: Errors in Autobiographical Memory and Their Effects in Time-to-Event Analysis]
Universität Bremen - Bremer Institut für Präventionsforschung und Sozialmedizin (BIPS) (D),
Universität Duisburg-Essen - Institut für Soziologie (IfS) (D)
Prof. Dr. Iris Pigeot (Bremen)
Prof. Dr. Rainer Schnell (Duisburg)
Dr. Walter Schill (Bremen)
Dipl.-Math. Sigrid Behr (Bremen)
2010 - 2012
[Vorausgehende erste Förderperiode: Februar 2008 - Januar 2010]
In vielen wissenschaftlichen Untersuchungen, die auf administrativen Datenbanken beruhen, liegen nur Angaben zu gewissen Kovariablen oder zu Proxy-Maßen für alle Personen vor. Liegt für eine Stichprobe auch exakte Kovariableninformation vor, wird gewöhnlich allein die Information aus der Stichprobe für die Datenanalyse verwandt. Das Vernachlässigen der Information aus der Stichprobengrundgesamtheit führt zu einem Effizienzverlust bei der Parameterschätzung. Dieses Problem wurde in der Epidemiologie aufgegriffen, indem Zwei-Phasen oder Double Sampling Methoden entwickelt wurden, um die gemeinsamen Daten besser zu nutzen. Eine Konsequenz ist, dass die Kosten für Kovariablenmessungen in Surveys gesenkt werden können.
Dieses Projekt wird die in der Epidemiologie entwickelten Ideen des Double Sampling auf das Design und die Analyse von Survey Daten übertragen, in denen der "Sampling Frame" aus einer Populationsdatenbank besteht. Likelihood-orientierte Methoden und auf Gewichtungen basierende Ansätze sind entwickelt worden, um die Datenquellen zu verknüpfen und die Effizienz zu verbessern. Die tatsächliche Performance diverser Zwei-Phasen Methoden wird in originären soziologischen wie epidemiologischen Datensätzen verglichen. Neue Methoden zur Stratifizierung, die die vorhandene Kovariableninformation der Stichprobengrundgesamtheit berücksichtigen, werden untersucht. Als epidemiologische Datenquelle dienen die im vorherigen Projekt "Errors in autobiographical memory and their effects in time-to-event analysis" erhobenen Befragungsdaten zu schweren Blutungen nach Einnahme von Blutverdünnern, die mit einer administrativen Datenbank verknüpft werden können. Im soziologischen Kontext bieten die ALWA-Daten eine gute Datengrundlage für Zwei-Phasen Methoden, da sie drei Datenquellen vereinen: administrative Daten, Befragungsdaten und psychometrische Daten.
Ziel des Projektes ist die Entwicklung empirisch basierter Empfehlungen zur effizienten Nutzung vorhandener Phase-eins Information aus großen administrativen Datenbanken für die Planung von Studien mit zwei-phasigen "Choice-based Samples" und Ereigniszeitdaten.
Dieses Projekt wird Art und Ausmaß von Messfehlern bei erinnerten autobiographischen, retrospektiv erhobenen Ereignissen in epidemiologischen und sozialwissenschaftlichen Surveys untersuchen. Hierzu sollen Modelle zur Erklärung von Erinnerungsfehlern entwickelt und geprüft werden. Des Weiteren wird der Effekt solcher Messfehler auf Parameterschätzungen und Modell-Fit in der Ereigniszeit-Analyse untersucht.
Eines der am häufigsten angewendeten Datenanalyseverfahren für Ereignisdaten ist das Hazard-Modell. Die meisten Anwendungen in den Sozialwissenschaften und in der Epidemiologie basieren auf Surveydaten. Dabei erheben Surveys Ereignisdaten üblicherweise retrospektiv durch Berichte der Befragten. Daher sind Retrospektivdaten immer mit Messfehlern, bedingt durch Erinnerungsfehler, behaftet. In der praktischen Forschung werden solche Messfehler häufig ignoriert, obwohl es Hinweise auf die möglichen Effekte der Messfehler auf Parameterschätzungen und den Modellfit gibt. Während aber eine umfassende Literatur zur Wirkung von Messfehlern in linearen und nichtlinearen Modellen existiert, sind die Effekte speziell von Erinnerungsfehlern auf Ereignisdatenmodelle weitgehend unbekannt.
Nach der Modellierung von Erinnerungsfehlern soll der Einfluss solcher Messfehler auf Parameterschätzungen und den Modellfit bei Hazard-Modellen quantifiziert werden. Basierend auf diesen empirischen, statistischen Modellen über Erinnerungsfehler soll die Leistungsfähigkeit verschiedener Korrekturverfahren für Messfehler in der Anwendung auf Ereignisdaten untersucht werden. Zu den Korrekturverfahren gehören unter anderem SIMEX (Simulation, Extrapolation), Regressionskalibrierung und korrigierte Likelihood Methoden.
Für epidemiologische Surveys können Beginn und Dauer von Symptomen, Hospitalisierungen und Behandlungen im Prinzip durch administrative Daten verifiziert werden. In diesem Projekt wollen wir, unter Berücksichtigung der datenschutz-rechtlichen Bestimmungen, entsprechende Daten von Krankenkassen nutzen, um erhobene Patientendaten zu validieren. Im soziologischen Kontext sollen Daten zu Phasen der Arbeitslosigkeit genutzt werden.
Stefan Bender, FDZ der Bundesagentur für Arbeit (BA), Nürnberg
Prof. Dr. Iris Pigeot
Universität Bremen
BIPS
Achterstr. 30
D-28359 Bremen
Tel.: (0421) 218 56942
Fax: (0421) 218 56941
pigeot[at]bips.uni-bremen.de
Webseite
Prof. Dr. Rainer Schnell
Universität Duisburg-Essen
Campus Duisburg
Institut für Soziologie
Lotharstr. 65
D-47057 Duisburg
Tel.: (0203) 379 2732
Fax: (0203) 379 1425
rainer.schnell[at]uni-due.de
Webseite