Nlp

In der Computerlinguistik (auf Englisch natural language processing oder kurz NLP) wird Sprache (beispielsweise in Form von Text) algorithmisch verarbeitet.

Das Nlp-Paket bietet einen kleinen Einblick in grundlegende Verfahren der Computerlinguistik: Es können Texte in ihre Wörter bzw. Token zerlegt werden (Tokenisierung), um ein sogenanntes Bag-of-Words zu generieren. Dies ist eine Voraussetzung, um anschließend beliebige Sätze bzw. Texte als Vektor beschreiben sowie algorithmisch verarbeiten zu können.

Übersicht
Das Nlp-Paket stellt folgende Befehle und Funktionen zur Verfügung:
Beispiel
Anhand von drei kurzen Sätzen wird ein Bag-of-Words erstellt. Anschließend wird dieses ausgegeben.