ALMA-13B-R - PROMPT

ALMA-R模型，通过Contrastive Preference Optimization (CPO)进行了进一步的LoRA微调，超越了GPT-4和WMT获奖者。用户可以在GitHub仓库中下载ALMA(-R)模型和数据集。ALMA-R建立在ALMA模型的基础上，采用了我们提出的Contrastive Preference Optimization (CPO)进行微调，而不是ALMA中使用的Supervised Fine-tuning。CPO微调需要我们的三元组偏好数据进行偏好学习。ALMA-R现在可以匹配甚至超越GPT-4或WMT获奖者！

数据统计

相关导航

slAItor

slAItor是一款AI翻译助手，通过人工智能的技术进步，提供了超越传统翻译系统的功能。slAItor支持逐步翻译、改变翻译风格、提供翻译替代方案、解释翻译并纠正翻译错误。它还有一个样式校准器，可以让你根据不同的上下文适应翻译。slAItor支持28种语言对。

Image/Manga Translator

该项目可以将漫画/图片中的文字进行翻译,主要功能包括文本检测、光学字符识别(OCR)、机器翻译和图像修补。它支持多种语言如日语、中文、英语和韩语等,可实现近乎完美的翻译效果。该项目主要面向漫画爱好者和图像处理工作者,可以方便地阅读外语漫画或进行图像的多语言处理。此外,它还提供Web服务、在线演示和命令行工具等多种使用方式,具有良好的可用性。该项目代码开源,欢迎大家一起完善和贡献。

LLaVA-3b

LLaVA-3b是一种基于Dolphin 2.6 Phi进行微调的模型，使用SigLIP 400M的视觉塔以LLaVA方式进行微调。模型具有多个图像标记、使用视觉编码器的最新层输出等特点。此模型基于Phi-2，受微软研究许可证约束，禁止商业使用。感谢ML Collective提供的计算资源积分。

XTuner

XTuner是一个为大型模型（如InternLM, Llama, Baichuan, Qwen, ChatGLM）设计的高效、灵活且功能齐全的微调工具包。它支持在几乎所有GPU上进行LLM和VLM的预训练和微调，能够自动调度高性能操作，如FlashAttention和Triton内核，以提高训练吞吐量。XTuner与DeepSpeed兼容，支持多种ZeRO优化技术。它还支持各种LLMs和VLM（如LLaVA），并设计了良好的数据管道，能够适应任何格式的数据集。此外，XTuner支持多种训练算法，包括QLoRA、LoRA和全参数微调，使用户能够选择最适合其需求的解决方案。

TinyGPT-V

TinyGPT-V 是一种高效的多模态大型语言模型，通过使用小型骨干网络来实现。它具有强大的语言理解和生成能力，适用于各种自然语言处理任务。TinyGPT-V 采用 Phi-2 作为预训练模型，具备出色的性能和效率。