

- 论文标题:The Surprising Effectiveness of Test-Time Training for Abstract Reasoning
- 论文链接:https://ekinakyurek.github.io/papers/ttt.pdf
- 在与测试时类似的合成任务上进行初始微调;
- 用于构建测试时数据集的增强型 leave-1-out 任务生成策略;
- 训练适用于每个实例的适应器;
- 可逆变换下的自我一致性(self-consistency)方法。
ARC 推理任务示例。可以看到,这是一组类似于智力测试的问题,模型需要找到图形变换的规则,以推导最后的输出结果。











表示一个任务,其中
,即 ARC 任务的集合。ARC 数据集的原始训练集和验证集各由 400 个任务组成。成功标准要求对所有测试输出结果进行精确匹配(如果没有给出部分分数)。- 将本文的 TTT pipeline 与神经模型与 BARC 合成器相结合,准确率提高到 58.5%。
- 将本文的 TTT pipeline 与 BARC 神经模型和合成器相结合,准确率提高到 61.9%。

© 版权声明
本文内容源自互联网公开资源,旨在分享与交流。若您发现任何侵犯您版权的内容,请立即与我们联系,我们将第一时间核实并删除,以确保尊重并维护版权所有者的合法权益。本文内容仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。