Repository navigation

#

corpus

A collection of small corpuses of interesting data for the creation of bots and similar stuff.

JavaScript
5025
5 天前

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard

Python
4175
1 年前

中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。

4171
1 年前

Deep Learning and deep reinforcement learning research papers and some codes

2935
1 年前

Final Weibo Crawler Scrap Anything From Weibo, comments, weibo contents, followers, anything. The Terminator

Python
2321
6 年前

Awesome Chatbot Projects,Corpus,Papers,Tutorials.Chinese Chatbot =>:

Python
2120
1 年前

用于训练中英文对话系统的语料库 Datasets for Training Chatbot System

Python
2048
5 年前

A multilingual dialog corpus

Python
1403
2 个月前

非常全的文言文(古文)-现代文平行语料

Python
1363
1 年前

公司名语料库。机构名语料库。公司简称,缩写,品牌词,企业名。可用于中文分词、机构名实体识别。

1275
1 年前

Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料

980
3 年前

ChatGPT 中文语料库 对话语料 小说语料 客服语料 用于训练大模型

909
1 年前

Collections of Chinese NLP corpus

Python
908
5 年前

An R package for the Quantitative Analysis of Textual Data

R
863
24 天前

高质量中文预训练模型集合:最先进大模型、最快小模型、相似度专门模型

Python
815
5 年前