Llemma是一个开放的数学语言模型,提供数据和训练代码。它可以用于数学相关的任务,如定理证明、数学文本生成等。Llemma具有高质量的数学训练数据,可以帮助用户进行数学研究和应...
SpeechGPT是一种多模态语言模型,具有内在的跨模态对话能力。它能够感知并生成多模态内容,遵循多模态人类指令。SpeechGPT-Gen是一种扩展了信息链的语音生成模型。SpeechAgents是一种具有多模态多代理系统的人类沟通模拟。SpeechTokenizer是一种统一的语音标记器,适用于语音语言模型。这些模型和数据集的发布日期和相关信息均可在官方网站上找到。
Web LLM 是一个模块化、可定制的 JavaScript 包,可直接将语言模型聊天引入到 Web 浏览器中。一切都在浏览器内部运行,无需服务器支持,并且通过 WebGPU 进行加速。它可以为大家构建 AI 助手提供很多有趣的机会,并在享受 GPU 加速时保护隐私。此项目是 MLC LLM 的附属项目,MLC LLM 可以在 iPhone 和其他本地环境中本地运行 LLM。
AlphaGeometry是一个超越了现有技术水平的几何问题AI系统,它通过结合神经语言模型的预测能力和规则驱动的推理引擎,能够解决复杂的几何问题。该系统采用神经符号学方法,由神经语言模型和符号推理引擎组成,共同寻找复杂几何定理的证明。通过生成10亿个随机几何对象图形,并从中推导出所有的关系,最终得到了1亿个独特的训练样本,其中900万个包含了额外的构造。AlphaGeometry的语言模型能够在面对国际数学奥林匹克竞赛的几何问题时做出良好的建议。该系统已经成为世界上第一个能够达到国际数学奥林匹克竞赛铜牌水平的AI模型。
RULER 是一种新的合成基准,为长文本语言模型提供了更全面的评估。它扩展了普通检索测试,涵盖了不同类型和数量的信息点。此外,RULER 引入了新的任务类别,如多跳跟踪和聚合,以测试超出检索从上下文中的行为。在 RULER 上评估了 10 个长文本语言模型,并在 13 个代表性任务中获得了表现。尽管这些模型在普通检索测试中取得了几乎完美的准确性,但在上下文长度增加时,它们表现得非常差。只有四个模型(GPT-4、Command-R、Yi-34B 和 Mixtral)在长度为 32K 时表现得相当不错。我们公开源 RULER,以促进对长文本语言模型的全面评估。
Gauth是字节跳动推出的一款面向海外市场的AI学习辅助应用。它利用先进的人工智能技术,帮助学生解决数学、物理、化学、生物等多个学科的家庭作业问题。用户只需通过拍照上传作业问题,Gauth的AI系统就能自动识别题目内容,并迅速提供准确的答案和详细的解题步骤。此外,Gauth还提供了24/7在线专家辅导服务,确保学生可以随时获得个性化的帮助。该应用界面友好,支持多语言,旨在使学习变得有趣和易于理解。
TextSynth是一个基于大型语言模型的文本生成工具。它使用Falcon 7B和Llama2 7B等先进的语言模型,可以帮助用户完成文本的自动补全和生成。无论是写作、聊天还是翻译,TextSynth都能提供准确、流畅的文本输出。它支持多种语言和领域,具有强大的功能和灵活的参数设置。TextSynth是提高生产力和创造力的理想工具。