Astraios是一个提供大型语言模型Fine-tuning的平台,提供了多种参数高效Fine-tuning方法,以及多种规模的模型选择。用户可以在该平台上进行大规模语言模型的Fine-tuning,并获得最...
Backengine是一个无代码AI后端API平台,可帮助您快速构建和部署复杂的应用逻辑。它由大型语言模型提供支持,无需编写任何代码或搭建基础设施。您可以描述API响应示例,以及使用自然语言定义API端点逻辑。您可以在测试环境中测试API端点,并微调提示和请求结构。一键部署API端点并集成到您的应用程序中。Backengine的功能包括快速构建和部署应用逻辑、零代码工作空间、无需个别语言模型账户、零基础设施、安全保护、团队协作等。
TOFU数据集包含根据不存在的200位作者虚构生成的问答对,用于评估大型语言模型在真实任务上的遗忘性能。该任务的目标是遗忘在各种遗忘集比例上经过微调的模型。该数据集采用问答格式,非常适合用于流行的聊天模型,如Llama2、Mistral或Qwen。但是,它也适用于任何其他大型语言模型。对应的代码库是针对Llama2聊天和Phi-1.5模型编写的,但可以轻松地适配到其他模型。
这篇论文系统评估了大型语言模型(LLMs)生成和识别逐渐复杂的视觉概念的能力,并展示了如何使用文本模型训练初步的视觉表示学习系统。虽然语言模型不能直接处理像素级的视觉信息,但使用代码表示图像进行研究。LLM 生成的图像虽然不像自然图像,但在图像生成和纠正方面的结果表明,准确建模字符串可以教会语言模型许多关于视觉世界的方面。此外,利用文本模型生成的图像进行自监督视觉表示学习的实验,突出了只使用 LLMs 就能训练能够对自然图像进行语义评估的视觉模型的潜力。
MLC Chat允许用户在iPad和iPhone上本地与开源语言模型进行聊天。在将模型下载到应用程序后,一切都在本地运行,无需服务器支持,而且无需互联网连接,不记录任何信息。由于模型在本地运行,它仅适用于具有足够VRAM的设备,具体取决于所使用的模型。MLC Chat是开源项目MLC LLM的一部分,允许在各种硬件后端和本机应用程序上本地部署任何语言模型。MLC Chat是在您的手机上运行不同开源模型架构的运行时。该应用旨在非商业目的。它允许您运行从互联网上下载的开源语言模型。每个模型可能受其各自的许可证约束。
Stable LM 2 1.6B是一个1.6亿参数的小型多语言稳定语言模型,支持英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语。该模型体积小、速度快,降低了硬件门槛,让更多开发者参与生成式AI生态系统。我们不仅发布预训练及调参版本,还首次发布预训练冷却前的最后检查点,包括优化器状态,以帮助开发者顺利进行微调和实验。
AgentVerse 是一个提供灵活框架的多智能体环境模拟工具,简化了构建大型语言模型(LLMs)的自定义多智能体环境的过程。它提供了高效的环境构建、可定制的组件、工具插件支持等功能。AgentVerse 旨在帮助研究人员更轻松地进行多智能体环境的开发和定制,以便集中精力进行研究。