Nlp
In der Computerlinguistik (auf Englisch natural language processing oder kurz NLP) wird Sprache (beispielsweise in Form von Text) algorithmisch verarbeitet.
Das Nlp-Paket bietet einen kleinen Einblick in grundlegende Verfahren der Computerlinguistik: Es können Texte in ihre Wörter bzw. Token zerlegt werden (Tokenisierung), um ein sogenanntes Bag-of-Words zu generieren. Dies ist eine Voraussetzung, um anschließend beliebige Sätze bzw. Texte als Vektor beschreiben sowie algorithmisch verarbeiten zu können.