Published December 15, 2022 | Version v1.0.1
Dataset Restricted

NeMig - A Bilingual News Collection and Knowledge Graph about Migration

  • 1. University of Mannheim
  • 2. Télécom Paris, Institute Polytechique de Paris
  • 3. Karlsruhe Institute of Technology

Description

NeMig represents a bilingual news collection and knowledge graphs on the topic of migration. The news corpora in German and English were collected from online media outlets from Germany and the US, respectively. NeMIg contains rich textual and metadata information, sentiment and political orientation annotations, as well as named entities extracted from the articles' content and metadata and linked to Wikidata. The corresponding knowledge graphs (NeMigKG) built from each corpus are expanded with up to two-hop neighbors from Wikidata of the initial set of linked entities.

NeMigKG comes in four flavors, for both the German, and the English corpora:

  • Base NeMigKG: contains literals and entities from the corresponding annotated news corpus;
  • Entities NeMigKG: derived from the Base NeMIg by removing all literal nodes, it contains only resource nodes;
  • Enriched Entities NeMigKG: derived from the Entities NeMig by enriching it with up to two-hop neighbors from Wikidata, it contains only resource nodes and Wikidata triples;
  • Complete NeMigKG: the combination of the Base and Enriched Entities NeMig, it contains both literals and resources.

Information about uploaded files:

(all files are b-zipped and in the N-Triples format.)

A description of the NeMigKG files is provided in the table below:

NeMigKG Files Description
File Description
nemig_${language}_ ${graph_type}-metadata.nt.bz2 Metadata about the dataset, described using void vocabulary.
nemig_${language}_ ${graph_type}-instances_types.nt.bz2 Class definitions of news and event instances.
nemig_${language}_ ${graph_type}-instances_labels.nt.bz2 Labels of instances.
nemig_${language}_ ${graph_type}-instances_related.nt.bz2 Relations between news instances based on one another.
nemig_${language}_ ${graph_type}-instances_metadata_literals.nt.bz2 Relations between news instances and metadata literals (e.g. URL, publishing date, modification date, sentiment label, political orientation of news outlets).
nemig_${language}_ ${graph_type}-instances_content_mapping.nt.bz2 Mapping of news instances to content instances (e.g. title, abstract, body).
nemig_${language}_ ${graph_type}-instances_topic_mapping.nt.bz2 Mapping of news instances to sub-topic instances.

nemig_${language}_ ${graph_type}-instances_sentiment_mapping.nt.bz2

Mapping of news instances to sentiment classes.

emig_${language}_ ${graph_type}-instances_political_orientation_mapping.nt.bz2

Mapping of news outlets instances to political orientation classes.

nemig_${language}_ ${graph_type}-instances_content_literals.nt.bz2 Relations between content instances and corresponding literals (e.g. text of title, abstract, body).

nemig_${language}_ ${graph_type}-instances_sentiment_polorient_literals.nt.bz2

Relations between instances and corresponding sentiment or political orientation literals.

nemig_${language}_ ${graph_type}-instances_metadata_resources.nt.bz2 Relations between news or sub-topic instances and entities extracted from metadata (i.e. publishers, authors, keywords).
nemig_${language}_ ${graph_type}-instances_event_mapping.nt.bz2 Mapping of news instances to event instances.
nemig_${language}_ ${graph_type}-event_resources.nt.bz2 Relations between event instances and entities extracted from the text of the news (i.e. actors, places, mentions).
nemig_${language}_ ${graph_type}-resources_provenance.nt.bz2 Provenance information about the entities extracted from the text of the news (e.g. title, abstract, body).
nemig_${language}_ ${graph_type}-wiki_resources.nt.bz2 Relations between Wikidata entities from news and their k-hop entity neighbors from Wikidata.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

The corresponding user data has been collected through online studies in Germany and the US. We used the participants' implicit feedback regarding their interest in an article to build their click history, and the explicit feedback in terms of news click behaviors to construct the impression logs. To protect user privacy, we assign each user an anonymized ID.

The German and English user datasets are zip-compressed folders, which contain two files each.

NeMig User Dataset File Description
File Description

behaviors.tsv

The click history and impression logs of users.

demographics_politics.tsv

Demographic and political information of users.

The behaviors.tsv file contains the users' news click histories and the impression logs. It has 4 columns divided by the tab symbol:

  • Impression ID: the ID of an impression.

  • User ID: The anonymized ID of an user.

  • Click History: The news click history (list of news IDs) of a user before an impression.

  • Impression Log: List of news displayed to the user in a session and the user's click behavior on them (1 for click, 0 for non-click).

The demographics_politics.tsv file contains detailed information about the users' demographics and political interests. It has columns divided by the tab symbol. An explanation of all the columns and the questions used in the online studies to collect this information is shown in the table below.

Demographic and political user data description
Column Name Question in German study Scale in German Question in English study Scale in English
Demographics        
Gender Bitte geben Sie Ihr Geschlecht an 0 = männlich
1 = weiblich
2 = divers
3 = Keine Angabe
Please indicate your gender. 0 = male
1 = female
2 = other
3 = no answer
Age Bitte geben Sie Ihr Alter an     1-120 Please indicate your age. 1-120
Qualification Welches ist Ihr höchster Bildungsabschluss? 0 = Kein Schulabschluss
1 = Haupt-/Gesamtschulabschluss
2 = Realschulabschluss, Mittlere Reife, Fachschulreife
3 = Fachhochschulreife, Abitur
4 = Studium mit Abschluss
5 = Promotion
6 = Keine Angabe
Please indicate your highest educational qualification. 0 = less than high school
1 = high school/GED
2 = Vo-tech/business school
3 = some college
4 = college degree
5 = university degree
6 = doctoral degree
7 = no answer
Nationality Welche Staatsangehörigkeit besitzen Sie? 0 = Nur die deutsche Staatsangehörigkeit
1 = Die deutsche und eine andere Staatsangehörigkeit
2 = Nur eine andere Staatsangehörigkeit
3 = Keine Angabe
What is your citizenship? 0 = U.S. citizenship
1 = U.S. and another non-U.S. citizenship
2 = Only non-U.S. citizenship
3 = No Answer
BornIn Sind Sie in Deutschland geboren? 0 = Ja
1 = Nein
2 = Keine Angabe
Were you born in the U.S.? 0 = Yes
1 = No
2 = No answer
ParentsBornIn Sind Ihre Eltern in Deutschland geboren? 0 = Mein Vater und meine Mutter sind beide in Deutschland geboren
1 = Mein Vater ist in Deutschland geboren, meine Mutter nicht
2 = Meine Mutter ist in Deutschland geboren, mein Vater nicht
3 = Weder meine Mutter noch mein Vater sind in Deutschland geboren
4 = Keine Angabe
Were your parents born in the U.S.? 0 = My father and my mother were both born in the U.S.
1 = My father was born in the U.S., my mother was not
2 = My mother was born in the U.S., my father was not
3 = Neither my mother nor my father were born in the U.S
4 = No answer
Income Was ist Ihr persönliches monatliches Nettoeinkommen (nach Abzug der Steuern)? Bitte geben Sie eine ungefähre Schätzung an, falls Sie die genaue Zahl nicht kennen. 0 = Weniger als 1000 €
1 = 1001 € bis 2000 €
2 = 2001 € bis 3000 €
3 = 3001 € bis 4000 €
4 = 4001 € bis 5000 €
5 = Mehr als 5000 €
6 = Keine Angabe
What is your personal monthly net income (after taxes)? Please give an approximate estimation in case you are unsure. 0 = Less than 1000 $
1 = 1001 $ to 2000 $
2 = 2001 $ to 3000 $
3 = 3001 $ to 4000 $
4 = 4001 $ to 5000 $
5 = More than 5000 $
6 = No Answer
Empathy Wie sehr stimmen Sie den folgenden Aussagen zu?

7-point Likert scale

1=Trifft überhaupt nicht zu
7=Trifft voll und ganz zu

How strongly do you agree with the following statements? 7-point Likert scale

1=Strongly disagree
7=Strongly agree
EMP1 Wenn jemand anderes erfreut ist, tendiere ich dazu auch erfreut zu sein.   When someone else is feeling excited, I tend to get excited too.  
EMP2 Es regt mich auf, wenn jemand respektlos behandelt wird.   It upsets me to see someone being treated disrespectfully.  
EMP3 Es macht mir Freude, andere aufzumuntern.   I enjoy making other people feel better.  
EMP4 Ich bin besorgt um Personen, die weniger Glück haben als ich.   I have tender, concerned feelings for people less fortunate than me.  
EMP5 Ich fühle, wenn andere traurig sind, selbst wenn sie nichts sagen.   I can tell when others are sad even when they do not say anything.  
EMP6 Meistens bin ich mit den Stimmungen anderer Leute im Einklang.   I find that I am “in tune” with other people’s moods.  
EMP7 Ich empfinde einen starken Drang zu helfen, wenn ich jemanden sehe, der aufgebracht ist.   I get a strong urge to help when I see someone who is upset.  
EMP8 Wenn ich jemanden sehe, der ausgenutzt wird, möchte ich die Person beschützen.   When I see someone being taken advantage of, I feel kind of protective towards him\her.  
Big5 Ich bin...

7-point Likert scale

0 = Sehr
1 = Ziemlich
2 = Etwas
3 = Teils=Teils
4 = Etwas
5 = Zeimlich
6 = Sehr

I see myself as...

7-point Likert scale

1=Strongly disagree
7=Strongly agree

BIG1 extrovertiert -- introvertiert   ...extroverted, enthusiastic  
BIG2 emotional -- ausgeglichen   ...critical, quarrelsome  
BIG3 aufgeschlossen -- festgelegt   ...dependable, self-disciplined  
BIG4 barsch -- umgänglich   ...anxious, easily upset  
BIG5 gewissenhaft -- nachlässig   ...open to new experiences, complex  
BIG6 -   ...reserved, quiet  
BIG7 -   ...sympathetic, warm  
BIG8 -   ...disorganized, careless  
BIG9 -   ..calm, emotionally stable  
BIG10 -   ...conventional, uncreative  
Ideological Polarization Im Folgenden sehen Sie eine Reihe von gegensätzlichen Aussagen.
Bitte geben Sie jeweils an, wie sehr Sie der Aussage zustimmen oder diese ablehnen.
Es gibt keine richtigen oder falschen Antworten.

7-point Likert scale

0 = Sehr
1 = Ziemlich
2 = Etwas
3 = Teils=Teils
4 = Etwas
5 = Zeimlich
6 = Sehr

In the following, you will see a series of opposing statements.
Please indicate how strongly you agree or disagree with the statements.
There are no right or wrong answers.

7-point Likert scale

1=Strongly disagree
7=Strongly agree

IPO1 Deutschland sollte mehr Geflüchtete aufnehmen.   The U.S. should take in more refugees.  
IPO2 Deutschland hat schon zu viele Flüchtlinge aufgenommen.   The U.S. should take in more refugees.  
IPO3 Deutschland sollte sich für sichere und einfache Fluchtwege nach Europa einsetzen.   The U.S. should advocate safe and easy escape routes to North America.  
IPO4 Deutschland sollte sich dafür einsetzen, dass Flüchtlinge nicht einfach nach Europa kommen können.   The U.S. should work to ensure that refugees cannot easily come to North America.  
IPO5 Immigranten bemühen sich um ein friedliches Zusammenleben mit Deutschen.   Immigrants strive for peaceful cohabitation with U.S.-Americans.  
IPO6 Immigranten treten den Deutschen feindselig gegenüber.   Immigrants are hostile toward U.S.-Americans.  
IPO7 Immigranten wollen auf Kosten des deutschen Wohlstands leben.   Immigrants want to live at the expense of U.S.-American prosperity.  
IPO8 Immigranten helfen dabei, den deutschen Wohlstand zu sichern.   Immigrants help in securing U.S.-American prosperity.  
IPO9 Immigranten bedrohen die deutsche Kultur und Lebensweise.   Immigrants threaten the U.S.-American culture and lifestyle.  
IPO10 Immigranten bereichern die deutsche Kultur und Lebensweise.   Immigrants enrich the U.S.-American culture and lifestyle.  
IPO11 Immigranten sind krimineller und gewalttätiger als Deutsche.   Immigrants are more criminal and more violent than U.S.-Americans.  
IPO12 Immigranten sind nicht krimineller oder gewalttätiger als Deutsche.   Immigrants are not more criminal and violent than U.S.-Americans.  
Emotions Welche Emotionen empfinden Sie gegenüber Geflüchteten und Immigranten in Deutschland? 7-point Likert Scale

1 = Stimme überhaupt nicht zu
7 = Stimme voll zu
Which emotions do you feel towards refugees and immigrants in the USA? 7-point Likert Scale

1=Strongly disagree
7=Strongly agree
EMO1 Wut   Anger  
EMO2 Angst   Fear  
EMO3 Verachtung   Contempt  
EMO4 Trauer   Grief  
EMO5 Ekel   Disgust  
EMO6 Neid   Envy  
EMO7 Schadenfreude   Gloat  
EMO8 Mitleid   Pity  
EMO9 Mitgefühl   Compassion  
EMO10 Bewunderung   Admiration  
EMO11 Freude   Joy  
EMO12 Hoffnung   Hope  
EMO13 Dankbarkeit   Gratitude  
EMO14 Ehrfurcht   Awe  
Media Usage Informationen über die deutsche Politik bekomme ich aus/von: 7-point Likert Scale

1=Nie
7=Sehr häufig
I receive information about US-American politics via: 7-point Likert Scale

1=Never
7=Very Often
MED1 Zeitungen und Magazinen oder deren Internet-Angeboten (z.B. BILD-Zeitung/ bild.de, Der Spiegel/spiegel.de, ...)       newspapers and magazines or their websites (e.g. New York Times, The Wallstreet Journal, ...)  
MED2 dem Fernsehen oder deren Internet-Angeboten (z.B. ARD/ard.de, RTL /rtl.de, ...)   TV networks or their websites (e.g. Fox News, CNN... )  
MED3 dem Radio deren Internet-Angeboten (z.B. Energy/energy.de, Deutschlandfunk/deutschlandfunk.de, …)       radio stations or their websites (e.g. WHTZ-FM, KIIS-FM, … )  
MED4 Facebook (zur politischen Information)   Facebook (for political information)  
MED5 Twitter (zur politischen Information)   Twitter (for political information)  
MED6 Instagram (zur politischen Information)   Instagram (for political information)  
MED7 Messenger Diensten wie z.B. WhatsApp und Telegram (zur politischen Information)   messenger services such as WhatsApp or Telegram (for political information)  
MED8 YouTube (zur politischen Information)   YouTube (for political information)  
MED9 Politischen Blogs und/oder speziellen Nachrichtenanbietern, die es nur im Internet gibt   political blogs and/or alternative news providers, which can only be found online  
Participation Können Sie sich vorstellen, in naher Zukunft… 7-point Likert Scale

1=Kann ich mir gar nicht vorstellen

7=Kann ich mir gar nicht vorstellen
Please indicate how likely it is that you will engage in the following activities in the near future. 7-point Likert Scale

1=Not likely at all

7=Very likely
PPA1 … an einer politische Onlinediskussion zum Thema Immigration in Deutschland teilzunehmen?   Participating in an online political discussion on the topic of immigration to the U.S.  
PPA2 … eine politische Onlinepetition zum Thema Immigration in Deutschland zu unterschreiben?   Signing an online political petition on the topic of immigration to the U.S.  
PPA3 … eine/n Politiker/in in Deutschland zum Thema Immigration mit einer E-Mail oder über Social Media zu kontaktieren?   Contacting a U.S.-American politician on the topic of immigration via e-mail or social media.  
PPA4 … einer politischen Partei oder Gruppe auf Social Media zu folgen, die sich besonders im Themenfeld Immigration in Deutschland engagiert?   Following a party or group on social media, that is particularly engaged in the field of immigration to the U.S.  
PPA5 … einer politischen Partei oder Gruppe Geld zu spenden, die sich besonders im Themenfeld Immigration in Deutschland engagiert?   Donating money to a political party or group that is especially involved in the field of immigration to the U.S.  
PPA6 … an einer politischen Demonstration zum Thema Immigration in Deutschland teilzunehmen?   Participating in a political demonstration on the topic of immigration to the U.S.  
PPA7 … einer politischen Partei oder einer Gruppe beizutreten, die sich besonders im Themenfeld Immigration in Deutschland engagiert?   Joining a political party or group that is especially involved in the field of immigration to the U.S.  
PPA8 … für eine politische Partei, oder einer Gruppe Freiwilligenarbeit zu leisten, die sich besonders im Themenfeld Immigration in Deutschland engagiert?   Volunteering for a political party or group that is especially involved in the field of immigration.  
Perceived Polarization Wie bewerten Sie folgende Aussagen? 7-point Likert Scale

1 = Stimme überhaupt nicht zu
7 = Stimme voll zu
How strongly do you agree or disagree with the following statements?

7-point Likert Scale

1=Strongly disagree
7=Strongly agree

PRO1 Die Anhänger der verschiedenen politischen Parteien in Deutschland stehen sich immer feindseliger gegenüber.   Democratic and Republican partisans in the U.S. are increasingly hostile to one another.      
PRO2 Die Anhänger der verschiedenen politischen Parteien in Deutschland haben sich immer weniger zu sagen.   There is less and less common meeting ground between Democratic and Republican partisans in the U.S.  
PRO3 Die Anhänger der verschiedenen politischen Parteien in Deutschland sind sehr polarisiert.   Democratic and Republican partisans in the U.S. are very polarized.  
PRO4 Die Meinungen zum Thema Immigration gehen in der deutschen Bevölkerung immer weiter auseinander.   Opinions about immigration issues are increasingly diverging in U.S. society.  
PRO5 Es wird immer schwieriger, in der deutschen Bevölkerung Einigung zu Fragen der Immigration zu erreichen.   It is becoming increasingly difficult to reach agreement on immigration issues among the U.S. population.  
PRO6 Das Thema Immigration spaltet die Menschen in Deutschland.   Immigration issues are dividing the people in the U.S.  
Affective polarization Hier sehen Sie die Liste aller im Bundestag vertretenen Parteien.
Bitte markieren Sie auf jeder der Skalen wie positiv oder negativ Sie für die jeweilige Partei empfinden.
0 (negative) to 100 (positive) In the following we would like to know about your party identification.
Please mark on the scale how warm or cold you feel towards the respective parties.
0 (negative) to 100 (positive)
CDU / Rep CDU   Republican      
SPD / Dem SPD   Democrat  
GRU GRU   -  
FDP FDP   -  
LIN LIN   -  
AFD AFD   -  
Political Scale (POL1) Wo würden Sie Ihren eigenen politischen Standpunkt auf der folgenden Skala einordnen? 11-point Likert Scale

1 = Links
6 = Mitte
11 = Rechts
Where on the scale would you place your political point of view? 11-point Likert Scale

1 = Left
6 = Center
11 = Right
Political Topics Bitte geben Sie an, inwiefern die folgenden Aussagen auf Sie zutreffen? 7-point Likert Scale

1 = Trifft überhaupt nicht zu
7 = Trifft voll und ganz zu
Please indicate how strongly you agree or disagree with the following statements. 7-point Likert Scale

1 = Strongly disagree
7 = Strongly agree
POL2 Ich interessiere mich im Allgemeinen sehr für Politik.   I am generally very interested in politics.  
POL3 Ich informiere mich regelmäßig über das aktuelle politische Geschehen in Deutschland.   I regularly inform myself about current political affairs in the U.S..  
POL4 Mir ist es wichtig, über das aktuelle politische Geschehen in Deutschland informiert zu sein.   It is important to me to be informed about current political affairs in the U.S..  
POL5 Ich lese viele politische Nachrichtenartikel.   I read many political news articles.  
POL6 Im Vergleich zu meinen Freunden bin ich ein Experte für das aktuelle politische Geschehen.   Compared to my friends, I am an expert on current political affairs.  
POL7 Ich interessiere mich sehr für das Thema Immigration und die Immigrationspolitik in Deutschland.   I am very interested in the topic of immigration and U.S. immigration policy.  
POL8 Ich informiere mich regelmäßig über Neuigkeiten zum Thema Immigration und Immigrationspolitik in Deutschland.   I try to keep up-to-date with news about immigration and U.S. immigration policy.  
POL9 Mir ist es wichtig, über die aktuellen Entwicklungen zum Thema Immigration und Immigrationspolitik in Deutschland informiert zu sein.   It is important to me to be informed about current developments in the field of immigration and U.S. immigration policy.  
Prosocial behavior Bitte geben Sie nachfolgend an wie sehr Sie den Aussagen zustimmen.   Please indicate how strongly you agree or disagree with the following statements.      
PRO1 Ich wäre bereit, Gegenstände (z. B. Kleidung, Spielzeug, Möbel, Elektrogeräte) für Geflüchtete in Deutschland zu spenden. 7-point Likert Scale

1 = Stimme überhaupt nicht zu
7 = Stimme voll zu
I would be willing to donate items (e.g. clothing, toys, furniture, electronics) to refugees living in the U.S. 7-point Likert Scale

1 = Strongly disagree
7 = Strongly agree
PRO2 Ich wäre dazu bereit, Geflüchtete im Alltag zu unterstützen (z. B. Behördengänge begleiten, Deutschunterricht geben, eine gemeinsame Freizeitaktivität unternehmen). 7-point Likert Scale

1 = Stimme überhaupt nicht zu
7 = Stimme voll zu
I would be willing to support refugees living in the U.S. with their everyday life (e.g. support with bureaucratic procedures, teaching English, leisure activities). 7-point Likert Scale

1 = Strongly disagree
7 = Strongly agree
PRO3 Ich wäre bereit __ € für Geflüchtete in Deutschland zu spenden. float number >= 0 I am willing to make a one-time donation of __$ for refugees in the U.S. float number >= 0
PRO4 Wie häufig haben Sie beruflich (z. B. auf der Arbeit, im Studium) Kontakt mit Menschen mit Migrationshintergrund?

7-point Likert Scale

1 = Nie
7 = Sehr häufig

How often do you have professional contact (e.g. at work or at school) with immigrants?

7-point Likert Scale

1 = Never
7 = Very often

PRO5 Wie häufig haben Sie privat (z. B. Freunde, Verwandte, Bekannte) Kontakt mit Menschen mit Migrationshintergrund?

7-point Likert Scale

1 = Nie
7 = Sehr häufig

How often do you have private contact (e.g. friends, relatives, acquaintances) with immigrants?

7-point Likert Scale

1 = Never
7 = Very often

 

Files

Restricted

The record is publicly accessible, but files are restricted to users with access.

Request access

If you would like to request access to these files, please fill out the form below.

You need to satisfy these conditions in order for this request to be accepted:

The data is available for research purposes and licensed under the  Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License. Please submit a short statement on the research work you want to conduct in order to gain access to the files.

You are currently not logged in. Do you have an account? Log in here