Augmentext: eine Textaugmentationsbibliothek

#Data Science and Business Analytics (BA)

Das Ziel des Projekts war die Entwicklung eines Textaugmentationspakets mit Schwerpunkt auf frei verfügbare medizinische Texte.

Augmentext ist eine umfangreiche, allgemeine Textaugmentationsbibliothek für Python, die durch Datenerweiterung erstellt wurde.

Datenerweiterung (auch: Datenaugmentation) ist ein Prozess, durch den weitere Daten aus bestehenden Daten generiert werden. Obwohl die Technik am häufigsten in der Bildverarbeitung angewandt wird, wo Bilder gedreht, verändert und gespiegelt werden, um neue Daten zu generieren, kann Datenaugmentation auch zur Erweiterung von Textdaten verwendet werden.