StoryGenius是一款基于GPT-4、Stable Diffusion API和Anthropic API的自动创作小说工具。它可以根据用户提供的初始提示和章节数,在几分钟内生成一整本奇幻小说,并自动打包为电子...
cog-become-image是一个AI模型,能够将任何面部图片适配到另一张图片上。该项目提供了在Replicate上运行此模型的链接,以及在ComfyUI中运行的指南。此外,还提供了在本地开发和运行Web UI的详细步骤。
LLM4Decompile是一个开源项目,旨在创建并发布第一个专门用于反编译的LLM(大型语言模型),并通过构建首个专注于可重编译性和可执行性的反编译基准测试来评估其能力。该项目通过编译大量C代码样本到汇编代码,然后使用这些数据对DeepSeek-Coder模型进行微调,构建了评估基准Decompile-Eval。
稳定扩散 AI 是一种开源的深度学习文本到图像生成模型,由 CompVis 团队与 Runway ML 联合开发,并获得 Stability AI 的运算支持。它可以根据文本描述生成高质量图片,也可以进行图像补全、外推以及文本指导下的图像到图像转换。稳定扩散 AI 开源了其代码、预训练模型和许可证,允许用户在单个 GPU 上运行。这使其成为第一个可以在用户本地设备上运行的开源深度文本到图像模型。
ChatRWKV是一种基于100%RNN的RWKV语言模型构建的开源聊天助手,它可以像ChatGPT一样进行人机对话,但具有更快的速度和更低的显存消耗。该项目由Stability EleutherAI提供训练赞助,最新版RWKV-6已经达到了Mamba级别的性能。
FakeSoraAPI是一个开源项目,它模拟了尚未发布的OpenAI Sora API,允许开发者提前准备和测试他们的应用程序。这个API用于从文本生成视频,帮助开发者在Sora API正式发布前进行开发和测试。
WhisperKit由Argmax公司推出,是一个基于Whisper项目的推理工具包,它允许在iOS和macOS应用程序中进行语音识别和转录。该项目的目标是收集开发者反馈,并在几周内发布一个稳定的候选版本,以加速设备上推理的生产化。