大規模言語モデル (LLMs)
大規模言語モデル (LLMs) 向けのフレームワーク、ツール、リソース。トレーニング、推論(vLLM、llama.cpp)、および RAG を網羅しています。
Repositories
DeepSeek-V3 は、総パラメータ数 671B、トークンあたり 37B を活性化させる強力な Mixture-of-Experts(MoE)言語モデルです。マルチヘッド潜在アテンション、FP8 訓練、マルチトークン予測を採用し、主要なクローズドソースモデルと同等の性能を達成しながら、効率的で安定した訓練を実現します。
DeepSeek-R1 は、数学、コード、推論タスクで OpenAI-o1 と同等の性能を達成した第一世代の推論モデルです。6710 億パラメータの MoE アーキテクチャを採用し、MIT ライセンスでオープンソース化されています。
Qwen3 is the large language model series developed by Qwen team, Alibaba Cloud.
Ollama は、オープンソースの大規模言語モデルをローカルで実行・管理するための軽量フレームワークです。シンプルな CLI と REST API を提供し、Llama、Gemma、Mistral などのモデルをサポートし、さまざまなツールやプラットフォームに簡単に統合できます。
vLLM は、LLM 推論とサービングのための高速で使いやすいライブラリです。UC バークレーで開発され、PagedAttention による効率的なメモリ管理、連続バッチ処理、Hugging Face モデルとのシームレスな統合を特徴としています。
LangChain は、エージェントや LLM を活用したアプリケーションを構築するためのフレームワークです。相互運用可能なコンポーネントとサードパーティ統合を連鎖させ、AI アプリケーション開発を簡素化します。
The definitive Web UI for local AI, with powerful features and easy setup.
Open WebUI は、完全にオフラインで動作するように設計された、拡張可能で機能豊富、ユーザーフレンドリーな自己ホスト型 AI プラットフォームです。Ollama や OpenAI 互換 API など、さまざまな LLM ランナーをサポートし、RAG 用の組み込み推論エンジンを備えています。
GPT4All は、一般的なデスクトップやラップトップで大規模言語モデル(LLM)をプライベートに実行できるオープンソースエコシステムです。API 呼び出しや GPU は不要で、アプリをダウンロードするだけでローカル AI モデルとのチャットを開始できます。
为GPT/GLM等LLM大语言模型提供实用化交互接口,特别优化论文阅读/润色/写作体验,模块化设计,支持自定义快捷按钮&函数插件,支持Python和C++等项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, moss等。