Hier stehen verschiedene kleine, von mir programmierte Tools zum Download und unter den Bedingungen der Creative Commons Licence (nicht-kommerzielle) Nutzung zur Verfügung. Die meisten Helferlein haben eine sehr spezialisierte Funktion und finden Einsatz in der Lehre.

LexisNexis-Textteiler

Der LN-Textteiler dient zur Wieder-Aufsplittung von Paketdateien (*.txt mit vielen Einzeltexten) in einzelne Textdateien. Die LexisNexis-Textdateien müssen nach dem Export bzw. Herunterladen als TXT-File lediglich in ein Verzeichnis gelegt und im Tool geladen werden. Der LN-Textteiler zerlegt diese Dateien anschließend nach einem voreingestellten (aber individuell anpassbaren) Teilerschlüssel, extrahiert Medium und Erscheinungsdatum und speichert letztere im Dateinamen wahlweise im UTF8- oder ANSI-Format ab.

Das Tool funktioniert derzeit mit allen LexisNexis-TXT-Exporten (Stand: 19.11.2012). Sollte es einmal nicht mehr funktionieren (z.B. weil LexisNexis den Formatstandard verändert hat), wäre ich für einen Hinweis sehr dankbar. Generell übernehme ich keinerlei Garantie oder Haftung im Falle von Schäden bei Anwendung der hier zur Verfügung gestellten Freeware.

Das Tool kann hier als Stand-Alone-EXE von meinem Server heruntergeladen werden.

Bekannte Bugs und ihre Lösung:

  • Fehlermeldung: "Datei XYZ kann nicht gespeichert werden". - Das Tool bricht ab und muss neu gestartet werden. Lösung: Das Tool zerteilt die Texte anhand des Textteilers und filtert dann Medientitel und Erscheinungsdatum heraus als Teil des jeweiligen Dateinamens. Wenn in einem der Medientitel irgendwo ein Zeichen ist, das für Dateinamen nicht zulässig ist (insb. "/" oder "\"), dann entsteht diese Meldung. Daher schauen Sie, bei welchen Dateien (und Titeln) die Fehlermeldung genau kommt und suchen und ändern Sie in den Quell-TXT-Dateien die entsprechenden Medientitel mit Copy&Paste (z.B. "/" durch "_" ersetzen). Anschließend starten Sie das Programm neu.
    Update: Die neue Version (1.5) umgeht das Problem, in dem derartige Dateien automatisch abgespeichert werden als "MetadataEncoding_failed".

ANSI-UTF8-Text-Codierer

Das Tool speichert alle TXT-Dateien eines Verzeichnisses in dem Format ANSI, UF8, Unicode oder ASCII. Die Anwendung ist selbsterklärend. Da die Dateien einfach überschrieben werden, empfielt sich vor Anwendung ggf. eine Sicherungskopie der Originaldateien.

Das Tool kann hier als Stand-Alone-EXE von meinem Server heruntergeladen werden.


CDI-Subkorpus-Bilder

Ein inzwischen recht umfangreiches und stabiles Tool, mit dessen Hilfe sich sehr große Textmengen in kleinere, thematisch relevante Subkorpora zerteilen und bei Bedarf direkt in AntConc laden lassen.

Das Tool kann hier als Stand-Alone-EXE von meinem Server heruntergeladen (32bit-Version / 64bit-Version) werden.


 

Die weiteren tools werden in der kommenden Zeit hochgeladen...

 

Bildrechte: „Agarre de un bifaz“ von José-Manuel Benito Álvarez (España) —> Locutus Borg - Eigenes Werk. Lizenziert unter Gemeinfrei über Wikimedia Commons - https://commons.wikimedia.org/wiki/File:Agarre_de_un_bifaz.png#/media/File:Agarre_de_un_bifaz.png