标签搜索

LLM

wxb
wxb
2026-04-01 / 0 评论 / 5 阅读 / 正在检测是否收录...

1.前置知识
微调的模型集中在以下模型:DeepSeek、GLM、Llama、Qwen,其中在初步微调中,DeepSeek和Qwen表现较好,于是选择加入DeepSeek和Qwen较大参数量的模型进行微调测试
2.在微调过程中,主要关注以下因素的调整对模型表现的影响,包括但不限于:训练集数据量、训练集不同类型数据的配比、训练集单条数据长度、cutoff_len(截断长度)、Qlora、lora_dropout(丢弃部分神经元防止过拟合)、learning_rate(学习率)、Epochs(训练轮次)、模型参数规模等
3.训练可用GPU:A800,微调方法:lora,集成平台:llama-factory
2.微调平台使用
部署llama-factory,详见:https://llamafactory.readthedocs.io/en/latest/getting_started/installation.html
部署完成之后熟悉各项微调参数:

![配置图](https://file.epoch42.cn/f/DYi0/%E5%89%AA%E8%B4%B4%E6%9D%BF%201775012385776.png) 

3.以微调材料大模型的经验,以下微调参数比较重要:训练集数据量、训练集不同类型数据的配比、训练集单条数据长度、cutoff_len(截断长度)、Qlora(参数精度:16、8、4)、lora_dropout(丢弃部分神经元防止过拟合)、learning_rate(学习率)、Epochs(训练轮次)、模型参数规模
注意:
(1)部分微调参数调整需要补充环境,比如qlora
(2)模型参数规模受限于gpu,要选择合适的模型和相应的参数规模
(3)可以在微调前后使用llama-factory的评估来测试模型在测试集上各个指标的提升,所以在准备数据集的时候既需要准备训练集也需要测试集

0

评论 (0)

取消