SWE-bench Verified

OpenAI reinventa padrão para avaliação de código

A OpenAI e os autores do SWE-bench colaboraram para redesenhar o popular benchmark de engenharia de software e lançar o…

14 de agosto de 2024