Claude Code

Required env vars

Set these on your dashboard:

Env Var	Required	Description
`ANTHROPIC_API_KEY`	Yes	Your Anthropic API key
`BENCHSPAN_MODEL`	No	Model to use (default: `claude-haiku-4-5-20251001`)
`BENCHSPAN_MAX_TURNS`	No	Max agent turns (default: `30`)

Usage

# Run against SWEbench
benchspan run --benchmark swebench --agent claude-code --instances 10

# Quick healthcheck
benchspan run --benchmark agent-healthcheck.quick --agent claude-code

# Use a different model
# (set BENCHSPAN_MODEL=claude-sonnet-4-20250514 on your dashboard)
benchspan run --benchmark swebench --agent claude-code --instances 5

What it does

The Claude Code runner:

Installs Node.js and @anthropic-ai/claude-code via npm
Creates a non-root user (Claude Code refuses to run as root)
Runs Claude Code in headless mode with --output-format stream-json
Extracts token usage and tool calls into trajectory.json

Changing the model

To switch models, update BENCHSPAN_MODEL on your dashboard:

Model	`BENCHSPAN_MODEL` value
Haiku (fast, cheap)	`claude-haiku-4-5-20251001`
Sonnet (balanced)	`claude-sonnet-4-20250514`
Opus (strongest)	`claude-opus-4-20250514`

Getting Started

Onboard Your Agent

Built-in Agents

Benchmarks

Required env vars

Usage

What it does

Changing the model

Getting Started

Onboard Your Agent

Built-in Agents

Benchmarks

​Required env vars

​Usage

​What it does

​Changing the model

Required env vars

Usage

What it does

Changing the model