GATE - PROMPT

GATE是一种学习框架，通过与用户进行自由形式的基于语言的交互，使用语言模型引导任务规范和推断预期行为。它在电子邮件验证、内容推荐和道德推理三个领域进行了研究。在预注册实验中，我们发现，通过生成开放式问题或合成信息丰富的边界案例等方式，提示GATE执行的语言模型往往比用户编写的提示或标签更具信息量。用户报告称，与提示或示例标记相比，交互式任务引导需要更少的工作量，并提供了用户最初没有预料到的新颖考虑因素。我们的研究结果表明，基于语言模型的引导可以成为将模型与复杂人类偏好和价值观相一致的强大工具。

数据统计

相关导航

Moonvalley

Moonvalley 是一款突破性的文本到视频生成 AI 模型，可以从简单的文本提示中创建出令人惊叹的高清视频和动画。它采用先进的机器学习技术，能够根据用户输入的文本提示，生成逼真、精美的影片和动画。无论是制作电影、广告、动画短片还是个人创作，Moonvalley 都能帮助用户快速将想法转化为视觉作品。

LongLLaMA

LongLLaMA 是一个大型语言模型，能够处理长篇文本。它基于 OpenLLaMA，并使用 Focused Transformer (FoT) 方法进行了微调。它能够处理长达 256k 标记甚至更多的文本。我们提供了一个较小的 3B 基础模型（未经过指令调整），并在 Hugging Face 上提供了支持更长上下文的推断代码。我们的模型权重可以作为现有实现中 LLaMA 的替代品（适用于最多 2048 个标记的短上下文）。此外，我们还提供了评估结果和与原始 OpenLLaMA 模型的比较。

everyprompt.com

Everyprompt是一个用于GPT-3的游乐场。在这里，您可以探索和使用最新的语言模型，构建和分享与GPT-3一起使用的工具，了解人工智能的未来。Everyprompt为AI开发团队提供了一个非常好的工具。它提供了无限的API访问和团队支持，可以让您以更高效的方式开发和部署AI驱动的应用。根据不同的需求，Everyprompt提供了个人、团队和企业的定价计划。

Qwen1.5

Qwen1.5是Qwen系列的下一个版本，提供了基础和聊天模型的开源版本，覆盖了0.5B到72B的多个规模。支持多语言，长上下文，对齐人类偏好，并在基本能力、聊天性能、多语言理解等方面取得显著进展。

TOFU

TOFU数据集包含根据不存在的200位作者虚构生成的问答对,用于评估大型语言模型在真实任务上的遗忘性能。该任务的目标是遗忘在各种遗忘集比例上经过微调的模型。该数据集采用问答格式,非常适合用于流行的聊天模型,如Llama2、Mistral或Qwen。但是,它也适用于任何其他大型语言模型。对应的代码库是针对Llama2聊天和Phi-1.5模型编写的,但可以轻松地适配到其他模型。

Starling-7B

Starling-7B 是一个由强化学习从 AI 反馈（RLAIF）训练的开放大型语言模型（LLM）。它通过我们的新 GPT-4 标记排序数据集 Nectar 和新的奖励训练和策略调优流程充分发挥了作用。Starling-7B 在使用 GPT-4 作为评委的 MT Bench 中得分为 8.09，在 MT-Bench 上超过了目前所有模型，除了 OpenAI 的 GPT-4 和 GPT-4 Turbo。我们在 HuggingFace 上发布了排名数据集 Nectar、奖励模型 Starling-RM-7B-alpha 和语言模型 Starling-LM-7B-alpha，以及 LMSYS Chatbot Arena 中的在线演示。请期待我们即将发布的代码和论文，其中将提供有关整个过程的更多详细信息。

暂无评论

暂无评论...

GATE翻译站点

数据统计

相关导航

暂无评论

热门网址

热门标签