Liebe Forumsmitglieder,
ich sitze gerade über einer Studie zu Elektromobilität. Bei der Programmierung mit Unipark ist ein Fehler unterlaufen und daher fehlen die Angaben von 27 Fällen (Gesamtstichprobe n=1200) bei 5 Fragen.
Diese Angaben sind aber essentiell um die 27 Fälle zuordnen zu können zu einer Auswertungsgruppe.
(Es werden bei der Auswertung Gruppen gebildet. Elektroauto-Nutzer, Elektroauto-Affine und Nicht-Affine. Diese Gruppen werden aufgrund einer selbstzuteilung des Befragten grundsätzlich angenommen, durch weitere Fragen aber kontrolliert. z. B. Nutzende werden gefragt, ob sie ein E-Auto nutzen. Wenn sie dies bejahen, wird kontrolliert ob sie bei den Fahrzeugen des Haushalts ein E-Auto angeben oder bei Car-Sharing oder sonstwo ein E-Auto überhaupt auftaucht.
Bei den Affinen wird zuerst gefragt, ob sie sich für Elektroautos interessieren. Wenn ja, sind sie affin. so leicht machen wir das natürlich nicht, sondern wir haben eine verhaltensbasierte Abfrage und einen Wissenstest als Kontrolle.
Bei der verhaltensbasierten Abfrage werden Fragen wie „Ich habe mich bereits im Internet über E-Autos informiert, ich bin bereits einmal Probegefahren…“ gefragt um feststellen zu können, wie stark die Person sich tatsächlich schon informiert hat, wenn sie doch angeblich interessiert ist. Das Wissensquiz ist ähnlich, wer angibt sich für E-Autos zu interessieren, der muss auch etwas darüber wissen.
Nun wurden aber allen Befragten, die angaben ein Gasauto im Haushalt zu haben, fälschlicherweise diese verhaltensbasierten Fragen nicht gestellt. Dieser Filter sollte eigentlich die Nutzenden herausfiltern. Wenn ich die Angaben zur Verhaltensbasierung nicht habe, kann ich auch keine Einteilung in die Affinen-Gruppe vornehmen.
Jetzt haben wir uns gedacht, wir könnten schaun, ob ein Zusammenhang zwischen den Affinen-Gasfahrern und den Affinen-Nichtgasfahrern in punkto Wissen besteht, und falls ja, könnten wir die Verhaltensbasierung nachschätzen lassen)
Jetzt meine Fragen:
Wie funktioniert es, dass ich die fehlenden Werte ersetzen lassen kann?
Welche Möglichkeiten gibt es dazu und ist die Funktion „Fehlende Werte ersetzen überhaupt die richtige?“
SPSS 11 bietet mir auch verschiedene Methoden bei „Fehlende WErte ersetzen“ an. Aber ich verstehe nicht ganz, was diese Methoden aussagen, bzw. welche die richtige für mein Problem ist.
Zuerst dachte ich, der „Mittel der Nachpaarpunkte“ wäre sinnvoll, aber ich frage mich, auf welche Nachbarpunkte SPSS zugreift? Hat es dann damit zu tun, wie ich die Fälle gerade sortiert habe?
Am zuverlässigsten erscheint mir die Methode „Linearer Trend an dem Punkt“ wobei ich auch nicht ganz verstehe, wie diese Gerade überhaupt zustandekommt.
Die SPSS-Bücher beschreiben zwar die Methoden aber ich kann die Brücke auf meinen speziellen Fall nicht bauen.
Es wäre lieb, wenn sich jemand auskennt und mir hilft. Herzlichen Dank schon jetzt.
Liebe Grüße
Mareike