MigTex – Textressourcen für die Migrations- und Integrationsforschung

Das Ziel des Projekts ist, für die Migrations- und Integrationsforschung relevante Textressourcen (Korpora, Diktionäre, Annotationen, Trainingsdaten) zu identifizieren, diese in nachhaltige Formate zu überführen und für die Forschung bereit zu stellen. Methodisch ist das Projekt im Bereich der eHumanities bzw. Computational Social Sciences angesiedelt. Es wird in einer Kooperation zwischen der Universität Duisburg-Essen (Interdisziplinäres Zentrum für Integrations- und Migrationsforschung / InZentIM) und dem Wissenschaftszentrum Berlin (WZB) durchgeführt. „MigTex“ baut dabei auf der Infrastruktur, der Codebasis und den Zielsetzungen des PolMine-Projekts (www.polmine.de) auf. Als Strukturprojekt trägt „MigTex“ zur Forschungsdateninfrastruktur des Deutschen Zentrums für Migrations- und Integrationsforschung (DeZIM) bei.

Ein zentrales Interesse des Projekts ist die nachhaltige Bereitstellung von Textressourcen für die Migrations- und Integrationsforschung. Diese Textressourcen in nachhaltige Formate (eXtended Markup Language / XML) zu überführen, dient der Reproduzierbarkeit und führt somit zu mehr Transparenz in der Forschung. Aufwändige Doppelarbeiten können vermieden werden. Die Entwicklung einschlägiger Korpora, Diktionäre und Annotationen eröffnet Potenziale für neue Forschungsansätze und Forschungsvorhaben der Migrations- und Integrationsforschung. Hierzu ist es notwendig, sowohl neue Verfahren bei der nachhaltigen Aufbereitung der Textressourcen zu entwickeln, als auch die ‚klassischen’ qualitativen und quantitativen Ansätze der Inhaltsanalyse um Verfahren der eHumanities bzw. Computational Social Sciences zu erweitern.

Der Arbeitsplan des Projekts sieht vor, dass einschlägige Ressourcen identifiziert und Standardisierungen entwickelt werden. Zunächst sollen gemeinfreie Arbeitsmaterialien (Parlaments- und Regierungskommunikation) aufbereitet werden. Im Rahmen des Projekts besteht allerdings auch die Möglichkeit, lizenzrechtlich geschützte Materialien zu erschließen. Im Projekt wird dann die Verbesserung der Zugänglichkeit und die Dissemination der entwickelten Methoden und der aufbereiteten Daten im Vordergrund stehen. Hierzu ist die Bereitstellung einer Analyseumgebung (auf Basis des bereits vorliegenden R-Pakets ‚polmineR’, vgl. https://cran.r-project.org/package=polmineR) ebenso zentral wie die Erstellung von Tutorials und Workshops (November 2018 und September 2019), die der Vermittlung der bereitstehenden Daten und Methoden dienen sollen.

Nach Abschluss des Projektes stehen die Daten wissenschaftlichen NutzerInnen in lizenzrechtlich geklärter Weise zur Verfügung. Eine Analyseumgebung kann genutzt werden, die quelloffen ist und durch adäquate Dokumentation, Tutorials und Schulungsmaterialen eine technisch niedrigschwellige Verwendung dieser Daten erlaubt. Diese Transparenz und Mechanismen des User-Feedbacks dienen der Qualitätssicherung des Projekts.

Laufzeit

01.  Januar 2018 – 31. Oktober 2019

Kooperationspartner

Interdisziplinäres Zentrum für Integrations- und Migrationsforschung (InZentIM)
Wissenschaftszentrum Berlin für Sozialforschung (WZB)