Skip to content

esthet1cs/marx_zahlen

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

% Forschungsdaten zum Text "Zahlen erzählen" % CMS % September 2019

Die in diesem Verzeichnis abgelegten Daten gehören zum Text "Zahlen erzählen". Sie sind ohne den kultur- und wissensgeschichtlichen Hintergrund im Text kaum nützlich.

Der Text erscheint in einem Sammelband, Elisabetta Mengaldo und Michael Bies (Hg.): Poetik des Kapitals (Arbeitstitel), Göttingen: Wallstein 2020.

Die ergänzten bibliografischen Daten des Sammelbands werden, falls möglich, hier noch nachgetragen.

Textbasis

Für die Erforschung der Frage, welche narrativen Funktionen Zahlen und Statistiken in Karl Marx: Das kapital, Bd. 1, übernehmen, wurde für jede Seite des Texts der Anteil von Ziffern berechnet. In den hier abgelegten Forschungsdaten sind zwei unterschiedliche diagrammatische Ergebnisse zu finden. Im ersten Schritt wurde die Textfassung aus dem Deutschen Textarchiv verwendet, in der die tabellarischen Daten nicht erfasst sind. Diese Textfassung wurde dann mit den tabellarischen Daten aus einer digitalen Textfassung von mlwerke.de ergänzt. Aus Copyright-Gründen sind im Ordner texte die DTA-Fassung (vollständig) sowie die aus der MLWerke-Fassung nach manuellem Abgleich extrahierten Tabellendaten abgelegt. Die vollständige Textfassung von Karl Marx: Das Kapital, Erster Band, von der Seite mlwerke.de, die für die hier dokumentierte Analyse verwendet wurde, liegt mir in der von mir verwendeten Fassung vollständig vor, auf Wunsch stelle ich diese Daten gerne zur Verfügung. Die aggregierte Textfassung wurde computergestützt mit einer interaktiven IPython-Shell hergestellt und im json-Format im Ordner misc gespeichert. Die für die Herstellung des Diagramms abschließend verwendeten Textdaten finden sich in der Datei pages5.json (DTA-Text mit fehlenden Tabellendaten und Umwandlung von Zahlwörtern in Ziffern).

DTA-Textfassung:

mlwerke.de:

Methodik

Für die Zählung der Zahlen wurden Ziffern in Worten in Zahlen rückübersetzt (Millionen, Tausend, Hundert, Dutzend), ebenso wurden Brüche berücksichtigt (½, ⅓, ⅔, ¼, ¾, ⅕, ⅖, ⅗, ⅘). Das entsprechende Python-Dictionary findet sich in der Datei misc/digits.json. Im gleichen Verzeichnis finden sich auch verschiedene Stufen der Textprozessierung, sie sind nur der Vollständigkeit halber dokumentiert.

Visualisierungen

Die im Lauf des Arbeitsprozesses erstellen Diagramme liegen im Ordner viz. Es handelt sich um Varianten von nur zwei unterschiedlichen Diagrammen. Die explorativen Ergebnisse sind nummeriert, wobei Fassung 1 und 2 auf dem noch nicht ergänzten DTA-Text basiert, Fassung 3 basiert auf dem ergänzten Text. Die beiden TIFF-Dateien wurden dem Verlag für den Druck zur Verfügung gestellt und unterscheiden sich nur farblich.

Interaktive Programmierung

Sämtliche interaktive Sessions sind im Ordner sessions vollständig dokumentiert.

Kontakt

Für Rückfragen stehe ich, zumindest in der absehbaren Zeit nach der Veröffentlichung des Texts, gerne zur Verfügung:

| https://esthet1cs.net | post@esthet1cs.net

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages