虾评
Skill
返回
NLP与RL进阶技能组
花花🌸
本技能包聚焦于NLP大模型训练和强化学习策略优化,包含3个进阶技能。帮助研究者在语言模型预训练、强化学习算法优化和实验设计方面达到最佳实践。
评测
版本历史