GPT-4O UPDATED // CLAUDE 3.5 SONNET TRENDING // NEW VECTOR DB RELEASED: CHROMA V0.5 // CURSOR RAISED $60M // GEMINI 1.5 PRO AVAILABLE // GPT-4O UPDATED // CLAUDE 3.5 SONNET TRENDING // NEW VECTOR DB RELEASED
Score: 95/100
Open Source
LANG: ZH

Llama Factory

"微调100多种大语言模型的终极工具包"

什么是 Llama Factory?

Llama Factory 是一个开源项目,旨在使大型语言模型 (LLM) 的微调变得易于访问和高效。它提供了一个统一的平台,支持广泛的模型和微调技术。它的与众不同之处在于其用户友好的 Web UI,允许用户在不编写任何代码的情况下训练模型,同时为更高级的用户提供了强大的命令行界面。它集成了最先进的优化方法,以确保训练既快速又节省内存。

主要特点

  • 广泛的模型支持: 统一为 100 多种 LLM 提供高效微调,包括 LLaMA、Mistral、Mixtral、Qwen、Yi 和 Gemma 等流行模型。
  • 多种微调方法: 支持多种参数高效微调 (PEFT) 方法,如 LoRA 和 QLoRA,以及全参数微调。
  • 先进的训练技术: 实现了直接偏好优化 (DPO) 和近端策略优化 (PPO) 等先进的对齐技术。
  • 用户友好的图形界面: 具有基于 Gradio 的 Web UI,允许用户通过简单的界面选择模型、数据集和训练参数。
  • 性能优化: 集成了 FlashAttention-2、Unsloth 和 RoPE 缩放等工具,以加速训练并减少内存使用。
  • 模型管理: 提供合并 LoRA 适配器和导出模型以供推理的功能。

使用案例

  • 自定义聊天机器人: 在特定数据集上微调基础模型,以创建具有独特性格或领域知识的聊天机器人。
  • 专业 AI 助手: 通过在相关数据上进行微调,开发用于代码生成、法律文件分析或医疗转录等任务的 AI 助手。
  • 研究与教育: 为了学术或个人学习目的,轻松地试验不同的模型、数据集和微调方法。
  • 普及 LLM 训练: 使没有大量 GPU 资源或深度学习专业知识的个人和小型团队能够构建自定义模型。

入门指南

这是一个使用 Web UI 开始使用 Llama Factory 的简单指南。

1. 克隆仓库并安装依赖项:

```bash git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e .[torch,bitsandbytes]

2. 启动 Web UI:

您可以使用 Gradio 或 Streamlit 来启动 UI。

对于 Gradio: ```bash gradio src/train_web.py

对于 Streamlit (测试版): ```bash streamlit run src/train_web_demo.py

3. 微调模型:

  • 在浏览器中打开提供的本地 URL (例如, http://127.0.0.1:7860)。
  • 在 UI 中,从 Model name 下拉菜单中选择一个模型 (例如, meta-llama/Llama-2-7b-chat-hf)。
  • 选择一种微调方法 (例如, lora)。
  • 选择一个数据集 (例如, identity_multiturn)。
  • 如果需要,在 Train 选项卡中调整超参数。
  • 点击 Start 开始微调过程。
  • 您可以在 Monitor 选项卡中监控训练进度。

定价

Llama Factory 是完全免费和开源的,根据 Apache 2.0 许可证发布。您只需承担运行训练所需的计算资源(例如 GPU)的成本。

System Specs

License
Apache 2.0
Release Date
2026-01-21
Social
hiyouga
Sentiment
非常积极

Tags

微调 / 大语言模型 / LoRA / QLoRA / 开源 / 图形界面

Alternative Systems

  • Axolotl
    A powerful and flexible CLI-first tool for fine-tuning LLMs.
  • Hugging Face PEFT
    A library for Parameter-Efficient Fine-Tuning of models.
  • Unsloth
    An optimization library for significantly faster LLM fine-tuning.
  • AutoTrain Advanced
    Hugging Face's no-code solution for training AI models.
  • Ludwig
    A low-code framework for building custom AI models.