% Forschungsdaten zum Text "Zahlen erzählen" % CMS % September 2019
Die in diesem Verzeichnis abgelegten Daten gehören zum Text "Zahlen erzählen". Sie sind ohne den kultur- und wissensgeschichtlichen Hintergrund im Text kaum nützlich.
Der Text erscheint in einem Sammelband, Elisabetta Mengaldo und Michael Bies (Hg.): Poetik des Kapitals (Arbeitstitel), Göttingen: Wallstein 2020.
Die ergänzten bibliografischen Daten des Sammelbands werden, falls möglich, hier noch nachgetragen.
Für die Erforschung der Frage, welche narrativen Funktionen Zahlen und Statistiken in Karl Marx: Das kapital, Bd. 1, übernehmen, wurde für jede Seite des Texts der Anteil von Ziffern berechnet. In den hier abgelegten Forschungsdaten sind zwei unterschiedliche diagrammatische Ergebnisse zu finden. Im ersten Schritt wurde die Textfassung aus dem Deutschen Textarchiv verwendet, in der die tabellarischen Daten nicht erfasst sind. Diese Textfassung wurde dann mit den tabellarischen Daten aus einer digitalen Textfassung von mlwerke.de ergänzt. Aus Copyright-Gründen sind im Ordner texte
die DTA-Fassung (vollständig) sowie die aus der MLWerke-Fassung nach manuellem Abgleich extrahierten Tabellendaten abgelegt.
Die vollständige Textfassung von Karl Marx: Das Kapital, Erster Band, von der Seite mlwerke.de, die für die hier dokumentierte Analyse verwendet wurde, liegt mir in der von mir verwendeten Fassung vollständig vor, auf Wunsch stelle ich diese Daten gerne zur Verfügung.
Die aggregierte Textfassung wurde computergestützt mit einer interaktiven IPython-Shell hergestellt und im json-Format im Ordner misc
gespeichert.
Die für die Herstellung des Diagramms abschließend verwendeten Textdaten finden sich in der Datei pages5.json (DTA-Text mit fehlenden Tabellendaten und Umwandlung von Zahlwörtern in Ziffern).
- ./text/marx_kapital01_1867
- Bibliografische Angaben: Marx, Karl: Das Kapital. Buch I: Der Produktionsprocess des Kapitals. Hamburg, 1867. In: Deutsches Textarchiv http://www.deutschestextarchiv.de/marx_kapital01_1867, abgerufen am 22.04.2019.
- Lizenz: CC-BY-NC https://creativecommons.org/licenses/by-nc/3.0/de/
- die vollständigen Daten können aus Copyrightgründen hier nicht veröffentlicht werden, lieben aber vor und werden bei begründetem Bedarf zur Verfügung gestellt.
- URL: http://www.mlwerke.de/me/me23/me23_000.htm
- Archiviert: https://web.archive.org/web/20190422212843/http://www.mlwerke.de/me/me23/me23_000.htm
Für die Zählung der Zahlen wurden Ziffern in Worten in Zahlen rückübersetzt (Millionen, Tausend, Hundert, Dutzend), ebenso wurden Brüche berücksichtigt (½, ⅓, ⅔, ¼, ¾, ⅕, ⅖, ⅗, ⅘). Das entsprechende Python-Dictionary findet sich in der Datei misc/digits.json. Im gleichen Verzeichnis finden sich auch verschiedene Stufen der Textprozessierung, sie sind nur der Vollständigkeit halber dokumentiert.
Die im Lauf des Arbeitsprozesses erstellen Diagramme liegen im Ordner viz
. Es handelt sich um Varianten von nur zwei unterschiedlichen Diagrammen. Die explorativen Ergebnisse sind nummeriert, wobei Fassung 1 und 2 auf dem noch nicht ergänzten DTA-Text basiert, Fassung 3 basiert auf dem ergänzten Text. Die beiden TIFF-Dateien wurden dem Verlag für den Druck zur Verfügung gestellt und unterscheiden sich nur farblich.
Sämtliche interaktive Sessions sind im Ordner sessions
vollständig dokumentiert.
Für Rückfragen stehe ich, zumindest in der absehbaren Zeit nach der Veröffentlichung des Texts, gerne zur Verfügung: