当前位置：首页 > 系统教程 > 正文

LLaMA-Factory快速入门（一）

主机测评网
系统教程
2026-03-12
574

欢迎来到LLaMA-Factory快速入门系列的第一篇文章！本文将带你从零开始，在Mac系统上完成大模型的微调与部署。无论你是AI初学者还是希望本地化部署大模型的开发者，都能通过本教程轻松上手。我们将重点介绍LLaMA-Factory这一强大工具，并详细展示如何在Mac环境下进行Mac大模型微调和大模型部署，最终实现Mac本地大模型的运行。

LLaMA-Factory快速入门（一） LLaMA-Factory Mac大模型微调大模型部署 Mac本地大模型第1张

一、什么是LLaMA-Factory？

LLaMA-Factory是一个基于LLaMA模型的高效微调框架，它简化了从数据准备到模型部署的全流程。通过LLaMA-Factory，你可以在本地Mac上对预训练大模型进行指令微调，从而让模型更好地适应特定任务。结合Mac本地大模型的优势，你可以保护数据隐私，并实现离线使用。

二、环境准备：Mac下的依赖安装

在开始Mac大模型微调之前，需要确保Mac已安装必要的软件和库。推荐使用conda或venv创建虚拟环境，避免依赖冲突。打开终端，执行以下命令：

    # 创建虚拟环境（Python 3.9+）conda create -n llama-factory python=3.9conda activate llama-factory# 安装PyTorch（根据你的Mac是否支持MPS选择版本）pip install torch torchvision torchaudio# 克隆LLaMA-Factory仓库并安装依赖git clone https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factorypip install -r requirements.txt

如果你使用的是Apple Silicon芯片（M1/M2/M3），可以利用MPS加速训练，安装时注意选择适配版本。更多细节可参考官方文档。

三、下载基础模型

LLaMA-Factory支持多种基座模型，如LLaMA、Alpaca、Vicuna等。你可以从Hugging Face或ModelScope下载模型权重。例如，下载LLaMA-2-7B-chat模型：

    # 使用huggingface_hub下载（需要先安装huggingface_hub）pip install huggingface_hubhuggingface-cli download meta-llama/Llama-2-7b-chat-hf --local-dir ./models/llama-2-7b-chat

下载完成后，将模型路径记录下来，后续微调时会用到。

四、准备微调数据集

Mac大模型微调需要高质量的指令数据集。你可以使用公开数据集（如Alpaca格式的JSON文件），或根据业务需求自己构建。数据集通常包含instruction、input和output字段。将数据集放置在LLaMA-Factory/data目录下，并修改dataset_info.json注册你的数据集。

五、配置微调参数

LLaMA-Factory提供了灵活的配置方式。你可以在examples目录下找到多个示例配置文件。根据你的硬件（Mac内存大小）选择合适的配置。比如使用LoRA进行轻量级微调，可以修改lora.yaml文件：

    model_name_or_path: ./models/llama-2-7b-chatdataset: your_dataset_name  # 对应dataset_info.json中的名称finetuning_type: loralora_target: q_proj,v_projoutput_dir: ./output/lorado_train: trueper_device_train_batch_size: 1max_steps: 1000learning_rate: 5e-5logging_steps: 10save_steps: 500

六、开始微调

配置完成后，执行以下命令启动微调：

    python src/train_bash.py \n    --stage sft \n    --model_name_or_path ./models/llama-2-7b-chat \n    --do_train \n    --dataset your_dataset_name \n    --finetuning_type lora \n    --output_dir ./output/lora \n    --overwrite_cache \n    --per_device_train_batch_size 1 \n    --gradient_accumulation_steps 4 \n    --lr_scheduler_type cosine \n    --logging_steps 10 \n    --save_steps 500 \n    --learning_rate 5e-5 \n    --num_train_epochs 3.0 \n    --plot_loss \n    --fp16  # 如果Mac不支持，可去掉fp16

训练过程中，终端会输出loss变化，并定期保存checkpoint。根据你的数据集大小和Mac性能，训练时间可能从几分钟到几小时不等。

七、模型部署与测试

微调完成后，你可以将LoRA权重与基础模型合并，或直接加载LoRA进行推理。以下是使用命令行进行交互式对话的示例：

    python src/cli_demo.py \n    --model_name_or_path ./models/llama-2-7b-chat \n    --adapter_name_or_path ./output/lora \n    --finetuning_type lora \n    --template default

启动后，你可以输入问题，模型会基于微调后的知识进行回答。如果需要大模型部署为API服务，LLaMA-Factory也提供了基于FastAPI的部署脚本：

    python src/api_demo.py \n    --model_name_or_path ./models/llama-2-7b-chat \n    --adapter_name_or_path ./output/lora \n    --finetuning_type lora \n    --template default \n    --port 8000

访问http://localhost:8000/docs即可查看API文档，轻松集成到你的应用中。

八、总结与展望

通过本文，你已经掌握了在Mac上使用LLaMA-Factory进行Mac大模型微调和大模型部署的基本流程。从环境配置、数据准备、微调训练到最终部署，每一步都力求简单清晰。接下来，你可以尝试调整数据集和超参数，探索更复杂的微调场景，或者将微调后的Mac本地大模型应用到实际项目中。下期我们将深入讲解如何优化训练速度和处理更大规模的模型，敬请期待！

—— 本文关键词：LLaMA-Factory、Mac大模型微调、大模型部署、Mac本地大模型