NLP & Textverarbeitung

Bibliotheken und Toolkits für die Verarbeitung natürlicher Sprache.

Repositories

spaCy ist eine fortschrittliche Bibliothek für natürliche Sprachverarbeitung (NLP) in Python und Cython. Sie bietet state-of-the-art Geschwindigkeit und neuronale Netzwerkmodelle für Tokenisierung, Named-Entity-Recognition, Textklassifikation und Dependency-Parsing in über 70 Sprachen. Zusätzlich unterstützt spaCy Transformer wie BERT, ein produktionsreifes Trainingssystem und einfache Modellbereitstellung.

Python
33.3k
hankcs/HanLP

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

Python
36.2k

结巴中文分词

Python
34.8k

Library for fast text representation and classification.

HTML
26.5k

Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.

Python
23.0k