d-Romane-Romantik (d-RoRo)
Contributors
Data curators:
- 1. Technische Universität Darmstadt
Description
Das Korpus „d-Romane-Romantik“ (d-RoRo) ist eine homogene Sammlung aus 115 deutschsprachigen Romanen, die für die Epoche der Romantik bedeutsam sind, und umfasst insgesamt 12.659.897 Tokens. Das Korpus enthält sowohl kanonisierte als auch nicht-kanonisierte Texte und Autor:innen. Es wurde 2020-22 im forTEXT-Lab an der Technischen Universität Darmstadt literaturwissenschaftlich kuratiert. Das Korpus ist in drei Teilkorpora gegliedert:
1. Kernkorpus (26 Texte / 2.838.041 Tokens)
2. Ergänzungskorpus I (48 Texte / 5.305.017 Tokens)
3. Ergänzungskorpus II (41 Texte / 4.516.839 Tokens)
Die Zuordnung von Texten und Autor:innen zur Epoche der Romantik wurde aufgrund von Recherchen im Kindler Literatur-Lexikon (Arnold 2009), im Killy-Literaturlexikon (Killy / Kühlmann 2008), in den Annalen der Deutschen Literatur (Burger 1952) und im Romantik-Handbuch (Schanze 1994) vorgenommen. Der Roman wird als epische Langform verstanden, die häufig in Untereinheiten wie Kapitel und / oder Bücher strukturiert ist. Im Korpus befinden sich sowohl vollendete Romane als auch Fragmente. Die Texte haben eine Länge zwischen 8.406 und 386.188 Tokens. Die Zahl der Tokens im Text wurde mit Quanteda für R (Benoit et al. 2018) berechnet.
Kritisch ist in diesem Zusammenhang besonders die Zuordnung der Texte zur Romantik, die hier mithilfe der Standard Literaturlexika Kindler Literatur-Lexikon (KLL) (Arnold 2009), Killy-Literaturlexikon (Killy) (Killy / Kühlmann 2008) und Annalen der Deutschen Literatur (ADLG) (Burger 1952) sowie des Romantik-Handbuchs (Schanze 1994) vorgenommen wurde. Generell fallen alle enthaltenen Texte in die Entstehungszeit der klassisch-romantischen Kunstperiode (Bär 2010ff). Der Beginn der Epoche der Romantik wird übereinstimmend auf das Jahr 1790 datiert (vgl. Schanze 1994, 36, Kremer 1997, 6, Schmitz-Emans 2016, 7). Bei der Bestimmung des Epochenendes herrscht hingegen weniger Einigkeit. Mögliche Endpunkte sind die 1830er (Kremer 1997, 6), 1841 (Schmitz-Emans 2016, 7) und 1850 (Schanze 1994, 69). Darauf aufbauend befinden sich im Kernkorpus insgesamt 26 Texte, deren Erstdruck in die Zeit zwischen 1792 und 1833 fallen und die in mindestens einem der Standard-Literaturlexika KLL, Killy oder ADLG oder im Romantik-Handbuch der Romantik zugeordnet werden. Im Ergänzungskorpus I befinden sich insgesamt 48 Texte, die zum ersten Mal zwischen 1791 und 1841 erschienen. Es handelt sich um Romane, von Autor:innen, die in mindestens einem der oben erwähnten Werke der Romantik zugeordnet wurden. Im Ergänzungskorpus II sind insgesamt 41 Texte enthalten, die zwischen 1776 und 1854 erstveröffentlicht wurden. Die in Ergänzungskorpus II hinzugefügten Daten lassen sich in drei Gruppen untergliedern: (1) Romane, die als prägend für die romantische Romanschriftstellerei gelten wie z.B. Goethes Wilhelm Meister oder Schillers Geisterseher, (2) Romane deren Autor:innen der Romantik zugeordnet wurden und die sowohl in der Kernzeit der Romantik als auch kurz davor und danach erstpubliziert wurden und (3) Romane von Autor:innen, die in der Kernzeit der Romantik publiziert wurden und sich oft großer Beliebtheit erfreuten, die aber aufgrund ihres Genres, wie z.B. historischer Roman oder Ritterroman, oder des Stils in der Literaturwissenschaft als Trivial- oder Populärliteratur klassifiziert wurden.
Im Kernkorpus sind mit zwei Ausnahmen Romane kanonisierter Autor:innen vertreten. In den Ergänzungskorpora I und II sind sowohl kanonisierte als auch nicht-kanonisierte Autor:innen erfasst. Der Kanonisierungsstatus von Text und/oder Autor*in wird hier als erreicht betrachtet, wenn es einen eigenen Eintrag im Kindler Literatur-Lexikon (Arnold 2009) gibt.
Die Textdateien wurden dem TextGrid Repositorium (Neuroth/Rapp/Söring 2015) oder Gutenberg-de (Reuters 2017) entnommen. Sie liegen als Reintextdateien mit einer dazugehörigen Metadatentabelle vor. Für die Metadatentabelle wurden aus den Ursprungsrepositorien Informationen extrahiert über
-
Autor:innenname,
-
Titel des Werks,
-
die Ausgabe, die als Vorlage diente,
-
Angaben zum Erstdruck.
Diese Daten wurden ergänzt durch Informationen zu
-
Lebensdaten- und Gender von Autor*innen
-
Gattungszugehörigkeit der Texte
-
Anzahl der Wörter
Referenzen
-
Arnold, Heinz-Ludwig (Hg.) (2009): Kindlers Literatur-Lexikon KLL. Springer Nature Switzerland. Abrufbar unter: http://dbis.uni-regensburg.de/frontdoor.php?titel_id=2562.
-
Benoit, Kenneth / Watanabe, Kohei / Wang, Haiyan / Nulty, Paul / Obeng, Adam / Müller, Stefan / Matsuo, Akitaka (2018): "quanteda: An R package for the quantitative analysis of textual data". Journal of Open Source Software 3 (30): 774. https://doi.org/10.21105/joss.00774.
-
Burger, Heinz Otto (1952): Annalen der Deutschen Literatur: Geschichte der Deutschen Literatur von den Anfängen bis zur Gegenwart eine Gemeinschaftsarbeit Zahlreicher Fachgelehrter. Stuttgart: J.B. Metzler. Available at: https://doi.org/10.1007/978-3-476-99181-2.
-
Killy, Walther / Kühlmann, Wilhelm (Hrsg.) (2008): Killy-Literaturlexikon. 2., vollst. überarb. Aufl. de Gruyter. DOI: https://doi.org/10.1515/9783110209334.
-
Kremer, D. (1997) Prosa der Romantik. J.B. Metzler (Sammlung Metzler). Available at: https://www.springer.com/gp/book/9783476102980 (Accessed: 17 June 2021).
-
Neuroth, Heike / Rapp, Andrea / Söring, Sibylle (Hrsg.) (2015): TextGrid: Von der Community — für die Community. Eine Virtuelle Forschungsumgebung für die Geisteswissenschaften. Universitätsverlag Göttingen, Verlag Werner Hülsbusch, Glückstadt.
-
Reuters, Hella (Hrsg.) (2017): Projekt Gutenberg-DE, Die weltweit größte kostenlose deutschsprachige Volltext-Literatursammlung. https://www.projekt-gutenberg.org/ [03.12.2020].
-
Schanze, H. (ed.) (1994) Romantik-Handbuch. Stuttgart: A. Kröner.
Files
Romane.zip
Files
(47.9 MB)
Name | Size | Download all |
---|---|---|
md5:5dda7e2643084d59a414aa1687971361
|
47.9 MB | Preview Download |