Procesamiento del lenguaje natural y texto

Bibliotecas y kits de herramientas para el procesamiento del lenguaje natural.

Repositories

spaCy es una biblioteca avanzada de procesamiento de lenguaje natural (NLP) para Python y Cython, que ofrece modelos de redes neuronales de última generación para tareas como tokenización, reconocimiento de entidades nombradas, clasificación de texto y análisis de dependencias en más de 70 idiomas. Incluye soporte para transformers como BERT, un sistema de entrenamiento listo para producción y herramientas para desplegar modelos.

Python
33.3k
hankcs/HanLP

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

Python
36.2k

结巴中文分词

Python
34.8k

Library for fast text representation and classification.

HTML
26.5k

Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.

Python
23.0k