Скачать книгу

Daten so gespeichert, lassen sie sich am einfachsten über den Datei-Explorer durchsuchen. Je größer die Datensammlung jedoch wird, desto günstiger ist der Import in geeignete relationale Datenbanksysteme, z. B. Access, Filemaker oder Oracle.

      Excel-Tabellen lassen sich unter „speichern unter“ im CSV-Format abspeichern. CSV ist die Abk. für comma separated value, die Werte in der Tabelle werden also in eine Liste übertragen und dadurch importfähig.

      Das Grundgerüst der Datenbank kann ähnlich strukturiert sein wie die vorbereitete Tabelle. Um einen Datenimport aus der Excel-Tabelle beispielsweise vornehmen zu können, werden oftmals sogenannte CSV-Dateien eingesetzt, die die Angaben in der Tabelle in einen importfähigen Datensatz übersetzen. Zudem müssen beim Einsatz von Datenbanksystemen Ein- und Ausgabemasken sowie Auswerteprogramme, sog. Reports, programmiert werden – eine Aufgabe, die ohne EDV-Kenntnisse schwer zu bewerkstelligen ist.

      Es ist auch möglich, Korpora mit sogenannten Scrapern aufbauen. Grundkenntnisse im Programmieren, z.B. mit Python, sind hierbei von Vorteil.

      Für Studierende ist erfahrungsgemäß die Angabe einer Mindestgröße für eine Belegsammlung von großer Bedeutung. Mit Schlobinski (2011: 133) könnte man dieser Frage folgendermaßen begegnen: „Gegenüber Aussagen, die allein auf der Grundlage der Introspektion gewonnen wurden und somit eine Einerstichprobe darstellen, ist jede auch noch so schmale Datenbasis ein Gewinn. Auf der anderen Seite sollte man generell vorsichtig sein, wenn aufgrund weniger Belege Aussagen über Sprachen oder gar Sprachfamilien getroffen werden, die von Hunderten, Tausenden oder gar Hunderttausenden gesprochen werden“ (Schlobinksi 2011: 133). Es gibt aber auch Ansichten wie: „Kein Korpus ist groß genug, um die Diversität der Daten im Hinblick auf Parameter wie Medium, Thematik, Stilebene, Genre, Textsorte, soziale, areale, dialektale Varietäten, gesprochene vs. geschriebene Texte etc. repräsentativ abzubilden. Versuche, das Problem durch Erweiterung der Stichprobe zu lösen, vergrößern nur die Diversität der Daten im Hinblick auf die bekannten (und möglicherweise noch unbekannte) Variabilitätsfaktoren und damit die Inhomogenität“ (Köhler 2005: 5). Kurzum: Wir können hier keine konkreten Zahlen nennen, als Faustregel gilt jedoch, dass genügend Daten vorhanden sind, sobald sich ein Muster finden lässt.

      Für wissenschaftliche Hausarbeiten und studentische Forschungsprojekte sollte der Aufwand dabei einerseits überschaubar bleiben, andererseits muss die Datensammlung genügend Belege aufweisen, um Aussagen treffen zu können. QualitativeQualitativ Aussagen lassen sich manchmal auch schon mit einem vergleichsweise kleinen Korpus treffen. Allerdings darf dabei dann kein Anspruch auf Repräsentativität erhoben werden. Die Ergebnisse der Analyse eines kleinen Korpus treffen eben auf genau dieses Korpus zu. Generell ist zu beachten, dass Themen für korpusbasierte BA- oder MA-Projekte schon mit dem Vorlauf festgelegt werden sollten, der für die Generierung eines Korpus kalkuliert wird.

      Zwar dürfen Korpora nur mit Zustimmung der Datenurheber*innen veröffentlicht werden, sie sollten jedoch für Ihre*n Prüfer*innen zugänglich sein, z. B. digital in einem geschützten Bereich, für den Sie einzig dem*der Prüfer*in Zugang gewähren.

      1.4.3 Klick ins Feld: Einfach einmal nachfragen?

      Online-Umfragen sind ein beliebtes Instrument in der empirischen Sozialforschung. Im folgenden Abschnitt soll diskutiert werden, inwieweit sie auch für sprachwissenschaftliche Datenerhebungen nutzbar sind. Nicht jede sprachwissenschaftliche Fragestellung ist dazu geeignet, über einen FragebogenFragebogen geklärt zu werden.

       Aufgabe 1-7

      Überlegen Sie sich eine geeignete sprachwissenschaftliche Fragestellung, über die ein Internet-Fragebogen Aufschluss geben kann.

      Der Gebrauch von Lexemen in spezifischen sprachlichen Umgebungen (Kotexten), regionale sprachliche Differenzen oder Grammatikalitätsurteile lassen sich gut über (Online-)Fragebögen erfassen. Möchte man aber z. B. wissen, welchen Einfluss Texte mit hohem Emotionspotenzial auf die Rezeption haben, ist es schwierig, Proband*innen direkt danach zu fragen. Ebenso wenig kann z. B. direkt erfragt werden, wie Menschen beten (vgl. Marx/Damisch 2013). Sobald persönliche Einstellungen oder emotionale Einflüsse auf Textproduktion und -rezeption im Mittelpunkt des Forschungsinteresses stehen, wird die empirische Datenerhebung generell problematisch. Es bedarf einer äußerst geschickten Wahl und Formulierung der Fragen, um sich der Antwort auf solche Forschungsfragen zumindest nähern zu können. In solch diffizilen Fällen, kann der Weg über eine anonyme Online-Befragung möglicherweise fruchtbringend sein. Sogenannte Interview-Effekte werden hier (wie auch bei schriftlichen Befragungen, die nicht online durchgeführt werden) auf ein Minimum reduziert. Die Proband*innen werden nie einer Face-to-Face-Situation ausgesetzt, so dass sie möglicherweise freier agieren, falls sie Antworten bevorzugen, die weder sozialen Normen noch angenommenen Erwartungen entsprechen. Suggestivfragen beherbergen allerdings immer ein Restrisiko für Interview-Effekte auch wenn die Fragen schriftlich präsentiert werden.

      Gegenüber herkömmlichen Befragungen haben Online-Fragebögen den Vorteil, dass sie dank der technologischen Bedingungen schnell auszufüllen und zu versenden sind. Damit kann die Teilnahme an der Befragung in die normalen Abläufe der Bildschirmarbeit integriert werden. Befragungen, die beispielsweise per Post verschickt werden, scheitern oftmals an einer verschwindend geringen Rücklaufquote. Einen Fragebogen aus einem Umschlag zu nehmen, ihn zu lesen, auszufüllen, anschließend wieder in einen Umschlag zu packen, eventuell noch zu frankieren und zum Briefkasten zu tragen, sind Schritte, die Proband*innen nur ungern auf sich nehmen. Angekündigte Befragungen, die in einem vereinbarten Rahmen durchgeführt werden, weisen zwar eine höhere Rücklaufquote auf, weil der*die Leiter*in der Befragung den Rücklauf unmittelbar kontrollieren kann, jedoch ergibt sich hier eine Schwierigkeit, die sich auf das Antwortverhalten auswirken kann: Der*die Proband*in kann nicht selbst entscheiden, wann er*sie die Fragen bearbeitet.

      Im Online-Verfahren hingegen bestimmen die Teilnehmer*innen einer Studie den Zeitpunkt, an dem sie die Fragen bearbeiten, selbst. Versuchsleiter*innen hegen an diesem Punkt zu Recht die Hoffnung auf eine höhere Motivation und Kooperationsbereitschaft auf der Seite der Teilnehmer*innen. Ein weiterer Vorteil ist, dass mit geringem Aufwand eine große Anzahl an Personen ungeachtet geographischer Distanzen erreicht werden kann. Das ist z. B. für sprachkontrastive Fragestellungen interessant. Online-Fragebögen können auch mit einer Sprachauswahl-Option ausgestattet werden, so dass der Fragebogen von Sprecher*innen verschiedener Sprachen ausgefüllt werden kann. Vorteilhaft ist auch, dass alle Daten sofort digital vorliegen und in (Statistik-)Programmen weiterverarbeitet werden können. Damit werden Kosten und Zeit gespart.

       Aufgabe 1-8

      Notieren Sie, welche Nachteile die Methode, Daten über Online-Fragebögen zu erheben, mit sich bringt.

      Die Nachteile von Online-Fragebögen liegen vorwiegend darin, dass nicht kontrolliert werden kann, ob eine Person der Zielgruppe den Fragebogen ausfüllt oder möglicherweise jemand, der die Zielgruppenparameter nicht erfüllt, stellvertretend für eine Person agiert. Es kann ebenso wenig kontrolliert werden, ob nur eine Person den Fragebogen ausfüllt oder die Antworten Ergebnis einer gemeinschaftlichen Beratung im Rahmen einer illustren Partygesellschaft sind.

      Auch die Zusammensetzung der Stichprobe kann nachteilig sein. So nehmen oftmals Personen teil, die einfach Freude an empirischen Erhebungen haben, oder Personen, die die jeweilige Thematik besonders positiv oder besonders negativ tangiert. Die Menge dieser Personen muss nicht notwendigerweise deckungsgleich mit der Stichprobe sein, die für eine repräsentative Aussage benötigt wird. Diese Gefahr kann dadurch eingegrenzt werden, dass Befragungsbögen per E-Mail verschickt werden. Hierfür müssen einer elektronischen Nachricht an eine statistisch ermittelte Auswahl an Adressat*innen lediglich Textdateien hinzugefügt werden. Dieses Vorgehen birgt wiederum eine andere Gefahr – die unsichere Rücklaufquote, weil Proband*innen eine E-Mail mit dem ausgefüllten Fragebogen

Скачать книгу