Gießen - Mannheim

Identifikation von Fälschungen in Erhebungsdaten

Justus-Liebig-Universität Gießen, Zentrum für Internationale Entwicklungs- und Umweltforschung (ZEU) (D), GESIS - Leibniz-Institut für Sozialwissenschaften, Survey Design & Methodology (D)

Projektleitung

Prof. Dr. Peter Winker (Gießen)
Dr. Natalja Menold (Mannheim)

Wissenschaftliche Mitarbeiter

Dipl.-Soz. Nina Storfinger (Gießen)
Dipl.-Vw. Sebastian Bredl (Gießen)
Dr. Christoph J. Kemper (Mannheim)
Dipl.-Soz. Rolf Porst (Mannheim)
Dipl.-Soz. Michael Blohm (Mannheim)

Projektlaufzeit

2010 - 2012

Forschungsvorhaben

Umfragedaten können aufgrund von Fälschungen durch den Interviewer verzerrt sein. Ausgehend von der Analyse der Motivation potentieller Fälscher sollen Methoden entwickelt werden, um das Risiko der Aufdeckung zu erhöhen. Dabei werden multivariate statistische Verfahren zur Identifikation der typischen Eigenschaften gefälschter Fragebögen weiterentwickelt und (auch experimentell) erprobt. Gleichzeitig wird untersucht, welche Aspekte des Fragebogendesigns (Länge, Art der Fragen etc.) die Aufdeckung von Fälschungen mittels der betrachteten Verfahren erleichtern.

Zur Analyse der vorliegenden Interviewdaten werden Cluster-Methoden angewandt, welche auf speziellen Indikatoren, d.h. Eigenschaften von gefälschten Daten, basieren. Dabei sollen klassische hierarchische, Clustermethoden, sowie auch heuristische Optimierungsverfahren eingesetzt werden, um die bestmöglichen Cluster für verschiedene Indikatoren zu erhalten. Um die Sensitivität der Methode in Abhängigkeit von der Stichprobengröße zu untersuchen, sollen Bootstrapping-Verfahren zum Einsatz kommen. Für den Fall, dass ex-ante-Informationen über Fälschungen zur Verfügung stehen, soll eine Diskriminanzanalyse durchgeführt werden, um typische Eigenschaften von gefälschten Interviews zu identifizieren.

Parallel zur Analyse der statistischen Methode entwickeln wir Design-Merkmale von Fragebögen, die die Chance der ex-post Aufdeckung von Fälschungen erhöht. Die Ausgangsbasis sind Theorien über den kognitiven Prozess der Beantwortung von Fragen in Fragebögen sowie das Satisficing Modell, das speziell die Motivation der Befragungsteilnehmer im Fokus hat. Die Indikatoren werden durch die Testung der Hypothesen zu Unterschieden im Antwortverhalten zwischen den realen Befragungsteilnehmern und denjenigen, die die Daten erzeugen (fälschen), gewonnen.

Erste Projektergebnisse

In einem ersten Schritt führten wir eine explorative Untersuchung durch, um Fragebogenattribute zu identifizieren, die es ermöglichen, gefälschte Daten zu erkennen. Dazu werden existierende Umfragedaten mit gefälschten Daten verglichen. Unsere ersten Ergebnisse zeigen, dass Fälscher u.a. die politischen Aktivität oder das politische Wissen der real Befragten überschätzen. Darüber hinaus produzieren die Fälscher eher konsistente Antworten in Itembatterien, sodass sich höhere Reliabilitäten, sowie höhere erklärte Varianzen in Faktorenanalysen ergeben. Schließlich unterscheiden sich die gefälschten und die realen Erhebungsdaten hinsichtlich des Antwortverhaltens, wie etwa extreme Antworten, Rundungen und Reihenfolgeeffekte. Aus diesen Ergebnissen bilden wir bestimmte Indikatoren, welche anschließend innerhalb der multivariaten statistischen Analysen helfen, gefälschte Erhebungsdaten zu identifizieren.

Die Ergebnisse der Clusteranalysen zeigen, dass es mit Hilfe der Indikatoren tatsächlich möglich ist, auf der Interviewerebene gefälschte Daten von den echten Daten zu trennen. Mit Bootstrapp-Analysen werden Voraussetzungen einer leistungsfähigen Anwendung von ex-post-Analysen überprüft. Wie erwartet führt eine größere Anzahl an Interviews zu einer besseren Clusterbildung, was bedeutet, dass die Einstufungsqualität deutlich verbessert wird. Weitere Cluster-Verfahren und zusätzliche Indikatoren sollen in zukünftigen empirischen Arbeiten berücksichtigt werden.

Kontakt

Prof. Dr. Peter Winker
Justus-Liebig-Universität Gießen
Fachbereich Wirtschaftswissenschaften
Lehrstuhl für Statistik und Ökonometrie
Lichter Str. 64
D-35394 Gießen
Tel.: (0641) 99 22640
Fax: (0641) 99 22649
peter.winker[at]wirtschaft.uni-giessen.de

Dr. Natalja Menold
GESIS
Survey Design & Methodology
Postfach 12 21 55
D-68072 Mannheim
Tel.: (0621) 1246 286
Fax: (0621) 1246 100
natalja.menold[at]gesis.org

+Projekte ++Gießen - Mannheim

<< 10/16 >>

Universität Darmstadt - Institut für Soziologie, Projekt; Experimental Mobile Phone Panel

Universität Mannheim - MEA, Projekt: Respondent Incentives, Interviewer Training, and Survey Participation

ETH Zürich – Professur für Soziologie, Projekt: Asking Sensitive Questions

Universität Trier – Fachbereich VWL, Projekt: Response Propensities in Access Panel Based Surveys

Uni Duisburg-Essen - IfS, Projekt: Use of Population Data Bases with Double Sampling for Choice-Based Sample Surveys and Time-to-Event Analysis

University of Utrecht - Department of Methodology and Statistics, Projekt: Access Panel and Internet Survey

Universität Hamburg - Fachbereich Psychologie, Projekt: Multiple Imputation of Complex Data Sets

Universität Bremen - EMPAS, Projekte: Access Panel and Internet Survey, Coordination

Universität Konstanz - Fachbereich Geschichte und Soziologie, Projekt: The Factorial Survey as Method for Measuring Attitudes

Universität Leipzig - Institut für Soziologie, Projekt: Asking Sensitive Questions

GESIS Mannheim, Projekte: Identification of Falsification in Survey Data, Enhancing the Validity of Intercultural Comparative Surveys

Uni Bielefeld - Fakultät für Soziologie, Projekte: Multiple Imputation of Complex Data Sets, The Factorial Survey as Method for Measuring Attitudes

Universität Giessen - ZEU, Projekt: Identification of Falsification in Survey Data

Universität Mainz - Institut für Soziologie, Projekt: Asking Sensitive Questions

Universität Bremen - BIPS, Projekt: Use of Population Data Bases with Double Sampling for Choice-Based Sample Surveys and Time-to-Event Analysis

FU Berlin - Institut für Statistik und Ökonometrie, Projekt: Response Propensities in Access Panel Based Surveys

print

english

DFG