数据集下载

ALMA-R模型，通过Contrastive Preference Optimization (CPO)进行了进一步的LoRA微调，超越了GPT-4和WMT获奖者。用户可以在GitHub仓库中下载ALMA(-R)模型和数据集。ALMA-R建立在ALMA模型的基础上，采用了我们提出的Contrastive Preference Optimization (CPO)进行微调，而不是ALMA中使用的Supervised Fine-tuning。CPO微调需要我们的三元组偏好数据进行偏好学习。ALMA-R现在可以匹配甚至超越GPT-4或WMT获奖者！

34 0

数据集下载机器翻译模型微调

PROMPT - AI导航（prompt.cn）是一个专注于AI领域的网址导航站，致力于为用户提供便捷、高效、智能的在线导航服务。包括AI工具、AI绘画、AI视频、AI语音、AI写作、AI办公、AI设计、AI编程、AI聊天、AI提示词、机器学习、深度学习、自然语言处理、智能推荐等多个领域，共计收录10000+个优质网站。

收录申请免责声明关于我们

引领智能未来，探索无限AI应用

数据集下载