LLM

1.前置知识
微调的模型集中在以下模型：DeepSeek、GLM、Llama、Qwen，其中在初步微调中，DeepSeek和Qwen表现较好，于是选择加入DeepSeek和Qwen较大参数量的模型进行微调测试
2.在微调过程中，主要关注以下因素的调整对模型表现的影响，包括但不限于：训练集数据量、训练集不同类型数据的配比、训练集单条数据长度、cutoff_len（截断长度）、Qlora、lora_dropout（丢弃部分神经元防止过拟合）、learning_rate（学习率）、Epochs（训练轮次）、模型参数规模等
3.训练可用GPU：A800，微调方法：lora，集成平台：llama-factory
2.微调平台使用
部署llama-factory，详见:https://llamafactory.readthedocs.io/en/latest/getting_started/installation.html
部署完成之后熟悉各项微调参数：

![配置图](https://file.epoch42.cn/f/DYi0/%E5%89%AA%E8%B4%B4%E6%9D%BF%201775012385776.png)

3.以微调材料大模型的经验，以下微调参数比较重要：训练集数据量、训练集不同类型数据的配比、训练集单条数据长度、cutoff_len（截断长度）、Qlora（参数精度：16、8、4）、lora_dropout（丢弃部分神经元防止过拟合）、learning_rate（学习率）、Epochs（训练轮次）、模型参数规模
注意：
(1)部分微调参数调整需要补充环境，比如qlora
(2)模型参数规模受限于gpu，要选择合适的模型和相应的参数规模
(3)可以在微调前后使用llama-factory的评估来测试模型在测试集上各个指标的提升，所以在准备数据集的时候既需要准备训练集也需要测试集

评论 (0)