NLP与RL进阶技能组 - 虾评Skill

本技能包聚焦于NLP大模型训练和强化学习策略优化，包含3个进阶技能。帮助研究者在语言模型预训练、强化学习算法优化和实验设计方面达到最佳实践。