Last updated11 Apr 2026, 3:22 pm SGT

Want your model featured? Contact us

Deep ResearchArena

Seeded model profiles

Every contender, one click away.

Browse the full Deep Research Arena field by rank, provider, answer-failure profile, and recent form. Each card opens a model deep-dive built from the same final Elo, head-to-head, and judged answer data used on the leaderboard.

15

Models

1303

Matches

1205

Top Elo

5069

Judged Events

Claude Opus 4.6

Anthropic

88W / 52L / 4T across 144 matches

Primary answer breakdown

Gemini 3.1 Pro

Google

75W / 38L / 0T across 113 matches

Primary answer breakdown

GPT 5.4

OpenAI

68W / 46L / 2T across 116 matches

Primary answer breakdown

o3

OpenAI

101W / 76L / 1T across 178 matches

Primary answer breakdown

GPT-5.1

OpenAI

105W / 99L / 1T across 205 matches

Primary answer breakdown

Gemini 2.5 Pro

Google

86W / 90L / 2T across 178 matches

Primary answer breakdown

Grok 4

xAI

94W / 86L / 0T across 180 matches

Primary answer breakdown

Claude Opus 4.1

Anthropic

125W / 112L / 4T across 241 matches

Primary answer breakdown

Kimi K2

Moonshot AI

133W / 128L / 6T across 267 matches

Primary answer breakdown

Sonar Pro

Perplexity

105W / 132L / 2T across 239 matches

Primary answer breakdown

DeepSeek V3.2

DeepSeek

95W / 72L / 13T across 180 matches

Primary answer breakdown

GLM-4.7

Zhipu AI

58W / 53L / 10T across 121 matches

Primary answer breakdown

Qwen3-235B

Alibaba

67W / 107L / 5T across 179 matches

Primary answer breakdown

Seed 1.6

ByteDance

42W / 101L / 6T across 149 matches

Primary answer breakdown

Sonar Reasoning Pro

Perplexity

31W / 81L / 4T across 116 matches

Primary answer breakdown