NLP & Textverarbeitung

Bibliotheken und Toolkits für die Verarbeitung natürlicher Sprache.

Repositories

hankcs / HanLP

HanLP: Ein mehrsprachiges NLP-Toolkit für industrielle Anwendungen, das chinesische Wortsegmentierung, POS-Tagging, Erkennung benannter Entitäten, Dependency Parsing und mehr mit Deep-Learning- und statistischen Modellen bietet.

Python

36.4k

8 months ago

fxsjy / jieba

Jieba ist eine leistungsstarke chinesische Textsegmentierungsbibliothek für Python, die mehrere Segmentierungsmodi, Wortartmarkierung, Schlüsselwortextraktion und benutzerdefinierte Wörterbücher unterstützt. Ideal für NLP und Suchmaschinenanwendungen.

Python

35.1k

2 years ago

explosion / spaCy

spaCy ist eine fortschrittliche Bibliothek für natürliche Sprachverarbeitung (NLP) in Python und Cython. Sie bietet state-of-the-art Geschwindigkeit und neuronale Netzwerkmodelle für Tokenisierung, Named-Entity-Recognition, Textklassifikation und Dependency-Parsing in über 70 Sprachen. Zusätzlich unterstützt spaCy Transformer wie BERT, ein produktionsreifes Trainingssystem und einfache Modellbereitstellung.

Python

33.7k

2 months ago

facebookresearch / fastText

FastText ist eine effiziente Bibliothek zum Lernen von Wortdarstellungen und Textklassifizierung, entwickelt von Facebook Research. Unterstützt die Verarbeitung von Teilwortinformationen, mehrsprachige Modelle und bietet vortrainierte Vektoren für 157 Sprachen, ideal für NLP-Aufgaben wie Stimmungsanalyse.

HTML

26.5k

2 years ago

sebastianruder / NLP-progress

Umfassendes Repository zur Verfolgung des Fortschritts in der natürlichen Sprachverarbeitung mit 50+ NLP-Aufgaben in mehreren Sprachen, Benchmark-Datensätzen, Leistungsmetriken und Spitzenforschung für ML-Praktiker.

Python

23.0k

2 years ago

Collections

NLP & Textverarbeitung

Repositories

hankcs / HanLP

fxsjy / jieba

explosion / spaCy

facebookresearch / fastText

sebastianruder / NLP-progress

Graph