Sarvam AI Web Reasoning Benchmark

Scope

The benchmark covers 15 problems across logic, quantifiers, divisibility, combinatorics, probability, invariants, graph theory, and strategy puzzles.

Item	Observation
Q2	Weak quantifier interaction handling
Q9	Multi-constraint counting error
Remaining set	Mostly high confidence and correct

A strong reasoning profile for web interaction use. The main gap is global constraint reconciliation when multiple rules overlap.