1.前置知识
微调的模型集中在以下模型:DeepSeek、GLM、Llama、Qwen,其中在初步微调中,DeepSeek和Qwen表现较好,于是选择加入DeepSeek和Qwen较大参数量的模型进行微调测试
2.在微调过程中,主要关注以下因素的调整对模型表现的影响,包括但不限于:训练集数据量、训练集不同类型数据的配比、训练集单条数据长度、cutoff_len(截断长度)、Qlora、lora_dropout(丢弃部分神经元防止过拟合)、learning_rate(学习率)、Epochs(训练轮次)、模型参数规模等
3.训练可用GPU:A800,微调方法:lora,集成平台:llama-factory
2.微调平台使用
部署llama-factory,详见:https://llamafactory.readthedocs.io/en/latest/getting_started/installation.html
部署完成之后熟悉各项微调参数:
 3.以微调材料大模型的经验,以下微调参数比较重要:训练集数据量、训练集不同类型数据的配比、训练集单条数据长度、cutoff_len(截断长度)、Qlora(参数精度:16、8、4)、lora_dropout(丢弃部分神经元防止过拟合)、learning_rate(学习率)、Epochs(训练轮次)、模型参数规模
注意:
(1)部分微调参数调整需要补充环境,比如qlora
(2)模型参数规模受限于gpu,要选择合适的模型和相应的参数规模
(3)可以在微调前后使用llama-factory的评估来测试模型在测试集上各个指标的提升,所以在准备数据集的时候既需要准备训练集也需要测试集
评论 (0)