日博365娱乐场

【分享】Llama-factory使用甄嬛传数据集微调

📁 日博365娱乐场 ⌚ 2026-06-13 13:52:26 👤 admin 👁️ 6153 ❤️ 200

一、准备工作

Llama-factory安装（省略）

模型：LLaMA3-8B （在魔塔社区下载）

数据集下载地址：

https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json

二、使用命令行直接开始训练

Llama-factory训练命令及参数设置如下：

‘’‘

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train

--stage sft

--do_train True

--model_name_or_path /home/liuyang/.cache/modelscope/hub/LLM-Research/Meta-Llama-3-8B-Instruct/

--adapter_name_or_path saves/LLaMA3-8B/lora/llama3_2024-05-23-11-02-02

--preprocessing_num_workers 16

--finetuning_type lora

--quantization_bit 4

--template llama3

--flash_attn auto

--dataset_dir data

--dataset huanhuan_zh

--cutoff_len 1024

--learning_rate 0.0001

--num_train_epochs 3.0

--max_samples 100000

--per_device_train_batch_size 4

--gradient_accumulation_steps 4

--lr_scheduler_type cosine

--max_grad_norm 1.0

--logging_steps 10

--save_steps 100

--warmup_steps 0

--optim adamw_torch

--packing False

--report_to none

--output_dir saves/LLaMA3-8B/lora/llama3_2024-05-23-11-02-02

--fp16 True

--plot_loss True

--lora_rank 8

--lora_alpha 32

--lora_dropout 0.1

--use_dora True

--lora_target all

’‘’

三、效果

收敛情况：

对话测试：

（收敛情况不是特别好，好在功能要求不高对话效果还可以）

## 一、准备工作

**Llama-factory安装（省略）**

**模型：LLaMA3-8B （在魔塔社区下载）**

**数据集下载地址：**

https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json

## 二、使用命令行直接开始训练

**Llama-factory训练命令及参数设置如下：**

‘’‘

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \

--stage sft \

--do_train True \

--model_name_or_path /home/liuyang/.cache/modelscope/hub/LLM-Research/Meta-Llama-3-8B-Instruct/ \

--adapter_name_or_path saves/LLaMA3-8B/lora/llama3_2024-05-23-11-02-02 \

--preprocessing_num_workers 16 \

--finetuning_type lora \

--quantization_bit 4 \

--template llama3 \

--flash_attn auto \

--dataset_dir data \

--dataset huanhuan_zh \

--cutoff_len 1024 \

--learning_rate 0.0001 \

--num_train_epochs 3.0 \

--max_samples 100000 \

--per_device_train_batch_size 4 \

--gradient_accumulation_steps 4 \

--lr_scheduler_type cosine \

--max_grad_norm 1.0 \

--logging_steps 10 \

--save_steps 100 \

--warmup_steps 0 \

--optim adamw_torch \

--packing False \

--report_to none \

--output_dir saves/LLaMA3-8B/lora/llama3_2024-05-23-11-02-02 \

--fp16 True \

--plot_loss True \

--lora_rank 8 \

--lora_alpha 32 \

--lora_dropout 0.1 \

--use_dora True \

--lora_target all

’‘’

## 三、效果

**收敛情况：**

![image](/attachments/067e2404-af4f-4f1c-9c39-2bbff050222e)

**对话测试：**

![image](/attachments/ce6e90de-8bda-42d9-9f3e-73766b36f306)

（收敛情况不是特别好，好在功能要求不高对话效果还可以）

image.png

38 KiB

image.png

75 KiB

← 2026世界杯比赛趋势观察：数据揭示的5大核心规律 - 2026国际足联世界杯-搜狐体育涯字组词 →

【分享】Llama-factory使用甄嬛传数据集微调

相关数据

搭配 AirPods 使用控制和手势

干货 | 适合你的英语词典，怎么选？(文末有彩蛋)

WPS文档里如何插入线条

友情链接