自然言語処理とテキスト処理

自然言語処理用のライブラリとツールキット。

Repositories

spaCyは、PythonおよびCython用の高度な自然言語処理ライブラリで、70以上の言語に対応したトークン化、固有表現認識、テキスト分類、依存関係解析などのタスクを、最先端の速度とニューラルネットワークモデルで処理します。BERTなどのトランスフォーマーモデルや、本番対応のトレーニングシステム、モデルのデプロイ機能も備えています。

Python
33.3k
hankcs/HanLP

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

Python
36.2k

结巴中文分词

Python
34.8k

Library for fast text representation and classification.

HTML
26.5k

Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.

Python
23.0k