tomerqodo

Follow

tomerqodo

Follow

Achievements

Achievements

Popular repositories Loading

experiments experiments Public

Forked from SWE-bench/experiments

Open sourced predictions, execution logs, trajectories, and results from model inference + evaluation runs on the SWE-bench task.

Shell
preparedness preparedness Public

Forked from openai/frontier-evals

Releases from OpenAI Preparedness

Python
multi-swe-bench multi-swe-bench Public

Forked from multi-swe-bench/multi-swe-bench

Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving

Python