OpenCodeInterpreter
OpenCodeInterpreter是一个开源的代码生成系统,将代码生成、执行和迭代优化结合在一起。它利用包含6.8万段交互的Code-Feedback数据集进行训练,可以根据执行输出和人类反馈对代码进行动态优化。在HumanEval、MBPP等基准测试上的评估显示了它在代码生成方面的突出表现。具有33B参数量的OpenCodeInterpreter在HumanEval和MBPP的平均准确率可达83.2%,与GPT-4代码解释器的84.2%不相上下,并可通过人工反馈提升至91.6%。OpenCodeInterpreter缩小了开源代码生成模型与GPT-4等专有系统之间的差距。