Kaggle是一个面向数据科学家的在线学习平台。它提供了各种数据集、代码示例、论坛交流、在线课程和机器学习竞赛。用户可以在这个平台上免费学习数据科学相关知识,与同行交流并参与...
Comfyspace是ComfyUI Workspace Manager一个用于组织和管理所有工作流程的ComfyUI工作流管理扩展。它允许用户在单一工作空间内无缝切换不同的工作流程,同时支持导入、导出工作流程和重用子工作流模块。特点包括版本控制、图库和封面图片设置、以及便捷的工作流程组织功能。
Vision Mamba是一个高效的视觉表示学习框架,使用双向Mamba模块构建,可以克服计算和内存限制,进行高分辨率图像的Transformer风格理解。它不依赖自注意力机制,通过位置嵌入和双向状态空间模型压缩视觉表示,实现更高性能,计算和内存效率也更好。该框架在 ImageNet分类、COCO目标检测和ADE20k语义分割任务上,性能优于经典的视觉Transformers,如DeiT,但计算和内存效率提高2.8倍和86.8%。
ResFields是一类专门设计用于有效表示复杂时空信号的网络。它将时变权重引入多层感知机中,利用可训练的残差参数增强了模型的表达能力。该方法可以无缝集成到现有技术中,并可显著提高各种具有挑战性的任务的结果,如2D视频逼近、动态形状建模和动态NeRF重建等。
LongLLaMA 是一个大型语言模型,能够处理长篇文本。它基于 OpenLLaMA,并使用 Focused Transformer (FoT) 方法进行了微调。它能够处理长达 256k 标记甚至更多的文本。我们提供了一个较小的 3B 基础模型(未经过指令调整),并在 Hugging Face 上提供了支持更长上下文的推断代码。我们的模型权重可以作为现有实现中 LLaMA 的替代品(适用于最多 2048 个标记的短上下文)。此外,我们还提供了评估结果和与原始 OpenLLaMA 模型的比较。
Bito是一个基于OpenAI和ChatGPT的AI开发者助手浏览器插件。它可以为开发者自动生成代码、写测试用例、优化代码等,极大地提高开发效率。Bito易于安装使用,支持代码风格配置,所有数据均加密传输,绝不存储用户代码,确保开发者的数据安全。Bito可以自动完成代码编写的大部分工作,让开发者更专注于创造性编码,真正提升10倍工作效率!
MovieLLM由复旦大学和腾讯PCG提出,是一个创新框架,旨在为长视频创建合成的、高质量的数据。该框架利用GPT-4和文本到图像模型的力量,生成详细的脚本和相应的视觉内容。