В соревновании по вайб‑кодингу K Prize победитель решил только 7,5% задач
Победитель закрыл 9 из 120 задач по программированию, доверяя решение ИИ
Проект K Prize, организованный Laude Institute при поддержке сооснователя Databricks и Perplexity Энди Конвински, впервые провел соревнование по вайб‑кодингу. В отличие от обычных тестов, задания брались из недавно опубликованных GitHub‑issues, чтобы исключить возможность подгонки ИИ‑систем и участников заранее.
Инженер из Бразилии Эдуардо Рошаде Андраде стал победителем первого раунда, закрыв 9 из 120 задач и набрав 7,5% правильных решений. За это он получил приз в размере $50 000. Ни одна из участвовавших ИИ‑моделей не преодолела даже 10%— это подчеркивает реальный уровень сложности новых программных вызовов.
Организаторы отмечают, что на традиционных тестах типа SWE‑Bench лучшие модели ИИ достигают до 75% на простых задачах и 34% на сложных, но K Prize показал, что fresh issues прикладной формат гораздо требовательнее. По словам Энди Конвински, "цель была создать по‑настоящему сложный бенчмарк — и это удалось".