Repository navigation

#

corpus

A collection of small corpuses of interesting data for the creation of bots and similar stuff.

JavaScript
4987
1 年前

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard

Python
4113
1 年前

中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。

4103
1 年前

Deep Learning and deep reinforcement learning research papers and some codes

2902
1 年前

Final Weibo Crawler Scrap Anything From Weibo, comments, weibo contents, followers, anything. The Terminator

Python
2314
5 年前

Awesome Chatbot Projects,Corpus,Papers,Tutorials.Chinese Chatbot =>:

Python
2078
1 年前

用于训练中英文对话系统的语料库 Datasets for Training Chatbot System

Python
2045
5 年前

A multilingual dialog corpus

Python
1395
1 个月前

非常全的文言文(古文)-现代文平行语料

Python
1312
1 年前

公司名语料库。机构名语料库。公司简称,缩写,品牌词,企业名。可用于中文分词、机构名实体识别。

1260
1 年前

Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料

953
3 年前

Collections of Chinese NLP corpus

Python
900
4 年前

ChatGPT 中文语料库 对话语料 小说语料 客服语料 用于训练大模型

892
1 年前

An R package for the Quantitative Analysis of Textual Data

R
853
3 天前

高质量中文预训练模型集合:最先进大模型、最快小模型、相似度专门模型

Python
816
5 年前