Software

Als Programmierer entwickle ich kleinere und größere Tools sowohl zur Erleichterung alltäglicher Aufgaben als auch für die wissenschaftliche Arbeit mit Texten. Dabei ist das Ziel, Anwendungen für korpuslinguistische Verfahren so aufzubereiten, dass sie in Forschung und Lehre ohne größere Programmierkenntnisse eingesetzt werden können.

Die Nutzung der nachfolgenden Freeware ist für nicht-kommerzielle Zwecke kostenlos; für eine Rückmeldung (Fehleranalyse), Kritik und Anregungen bin ich immer offen und dankbar.

Hinweis: Für den Gebrauch der hier zum Download angebotenen Tools gelten die Bestimmungen der Creative Commons Licence . Ferner übernehme ich keinerlei Haftung für etwaige Folgeschäden; die Nutzung erfolgt auf eigene Gefahr.


 

 

Das LDA-Toolkit (derzeit in der beta-Version 2.7 unter Windows) ist eine mittlerweile komplexe Toolsammlung, die vor allem für linguistische Diskurs- und Imageanalysen entwickelt wurde, jedoch auch für andere linguistische Fragestellungen von Interesse sein kann. Der Fokus der Tools liegt in der kontrastiven Ermittlung systematischer Ko(n)textprofile als sedimentierte Hinweise für kognitive Konzepte (Stereotype, Frames usw.) in Diskursen.

Corpustransfer ist ein kleines, aber wirksames Windows-Tool, um Korpora automatisch zu lemmatisieren und/oder zu Wortart-taggen. Dabei wird im Hintergrund auf TreeTagger (Helmut Schmid, Stuttgart) zuückgegriffen, dessen Listenergebnisse ausgewertet und nach verschiedenen Filteroptionen wieder zu Volltext-Korpora transformiert.

TextKey (2009) ist ein kleines Windows-Tool, um die Zusammenstellung individueller Text-Korpora zu erleichtern. Mit Hilfe von globalen Hotkeys (Vordefinierten Tastenkombinationen) können markierte Textteile in anderen Programmfenstern (z.B. im Internetexplorer) direkt in TextKey kopiert und vorannotiert werden. Die Auszeichnung der verschiedenen Textteile erlaubt anschließend eine automatische Aufnahme in Datenbanken oder sonstige Weiterverarbeitungen.

KontraKorp ist ein kleines Tool zur kontrastiven Auswertung von Belegfrequenzen und Belegfrequenzlisten mit Hilfe statistischer Maße (Signifikanztests).