人生不过Bug一场, 溪河的杂货铺
学习研究收集
学习的路线
生成SFT的数据
使用模型评价不同response的质量
使用模型做RLHF
数据清洗的步骤和效果⭐
GenAI奠基文章⭐
© 溪河 2021 - 2024