Repository navigation

#

baichuan2

雅意信息抽取大模型:在百万级人工构造的高质量信息抽取数据上进行指令微调,由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)

300
8 个月前
C++
242
1 年前

一个基于HuggingFace开发的大语言模型训练、测试工具。支持各模型的webui、终端预测,低参数量及全参数模型训练(预训练、SFT、RM、PPO、DPO)和融合、量化。

Python
215
1 年前

Scripts of LLM pre-training and fine-tuning (w/wo LoRA, DeepSpeed)

Python
79
1 年前

[ACL 2024] Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models

Python
37
1 年前

基于星火大模型的博物百科小程序

JavaScript
5
1 年前

to train a wechat version of yourself. 用微信聊天数据训练微信版的你, aka wechat-me. 支持Qwen1.5, Yi, InterLM2, ChatGLM3, Baichuan2等。

Python
5
1 年前

使用Python, requests,用于快速将百川智能大语言模型接入项目

Python
3
1 年前