No access to reasoning_tokens via Gemini API's OpenAI compatible layer

leolidisplayr · January 15, 2026, 3:48am

Issue

Gemini API’s OpenAI compatible layer does not expose reasoning_tokens. This is making it difficult for applications to control reasoning.

To replicate, make any request to a reasoning model (e.g. Gemini 2.5 Flash) via the OpenAI compatible layer.

The usage field does not directly mention reasoning tokens

    "usage": {
        "completion_tokens": 18,
        "prompt_tokens": 15,
        "total_tokens": 175
    }

Compare this to a response from the same model in Vertex AI:

    "usage": {
        "completion_tokens": 21,
        "completion_tokens_details": {
            "reasoning_tokens": 78
        },
        "extra_properties": {
            "google": {
                "traffic_type": "ON_DEMAND"
            }
        },
        "prompt_tokens": 14,
        "total_tokens": 113
    }

Topic		Replies	Views
Reasoning tokens combined with completion tokens in OpenAI compatibility mode Gemini API api , ai	6	712	April 18, 2025
"Low" Reasoning Instability & Output Budget Cannibalization (Gemini 3.0 Pro) Gemini API feedback , api , models , gemini	2	358	December 30, 2025
Usage not showing for OpenAI compatibility Gemini API open-models	1	278	November 22, 2024
Gemini 2.5 Flash Thinking Tokens using OpenAI API Gemini API help_request	16	1742	June 12, 2025
Question with "Usage" in OpenAI compatibility Gemini API openai_compatibility	3	248	August 22, 2025

No access to reasoning_tokens via Gemini API's OpenAI compatible layer

Related topics