자연어 처리 및 텍스트 처리

자연어 처리를 위한 라이브러리 및 도구 모음입니다.

Repositories

spaCy 는 Python 및 Cython 용 고급 자연어 처리 (NLP) 라이브러리로, 70 개 이상 언어에 대해 토큰화, 개체명 인식, 텍스트 분류, 구문 분석 등을 위한 최첨단 속도와 신경망 모델을 제공합니다. BERT 와 같은 트랜스포머 모델 지원, 프로덕션용 학습 시스템 및 모델 배포 도구를 갖추고 있습니다.

Python
33.3k
hankcs/HanLP

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

Python
36.2k

结巴中文分词

Python
34.8k

Library for fast text representation and classification.

HTML
26.5k

Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.

Python
23.0k