自然語言處理與文字處理

自然語言處理函式庫與工具包。

Repositories

spaCy 是一個用於 Python 和 Cython 的高級自然語言處理庫,具備業界領先的速度和神經網絡模型,支持 70 多種語言的斷詞、命名實體識別、文本分類和依存句法分析等任務。它兼容 BERT 等預訓練 Transformer 模型,提供生產級訓練系統,並支持便捷的模型部署與工作流管理。

Python
33.3k
19 hours ago
hankcs/HanLP

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

Python
36.2k
4 months ago

结巴中文分词

Python
34.8k
2 years ago

Library for fast text representation and classification.

HTML
26.5k
2 years ago

Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.

Python
23.0k
2 years ago