Repository navigation

#

chinese-corpus

A LITE BERT FOR SELF-SUPERVISED LEARNING OF LANGUAGE REPRESENTATIONS, 海量中文预训练ALBERT模型

Python
3969
2 年前

Language Understanding Evaluation benchmark for Chinese: datasets, baselines, pre-trained models,corpus and leaderboard

Python
1780
2 年前

Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料

953
3 年前

地球上最全的华语现代诗歌语料库,3k+诗人,80K+诗歌,15M+字

Python
684
4 个月前

An Implementation of 'Attention is all you need' with Chinese Corpus

Python
131
1 年前

Corpus creator for Chinese Wikipedia

Python
41
4 年前

搜狗细胞词库到普通文本的转换提取工具。提取词汇表,用于深度学习做数据生成和字典特征

Python
23
6 年前

Law Corpus for NER Experiment

6
7 年前

基于4-tag标注好的2019中文维基语料库,使用hanlp进行标注

Python
5
2 年前

Predicting Audience’s Response from Sketch Comedy and Crosstalk Scripts (A Corpus Supporting Comedy Writers)

3
4 年前

20201124到20220710期间的微博热搜中出现过的姓名 (主要为明星、政客、名人、网红、企业家等)

2
3 年前