Error: The model is overloaded

KrisBitney · November 9, 2024, 11:08am

I am getting this error, and I’m not sure what it means. It’s a 503, suggesting it is a server-side error. I’m using the free tier. I’m within the rate limits of 15 calls/minute and 1 million tokens / minute. I’m using the JavaScript/TypeScript SDK.

error: [GoogleGenerativeAI Error]: Error fetching from https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash-002:generateContent: [503 Service Unavailable] The model is overloaded. Please try again later.

Does anyone know what this error means? Is it maybe the case that the free tier is only available when paid tier usage is low?

afirstenberg · November 9, 2024, 2:18pm

Welcome to the forums!

As the 50x level indicates - this is an error on Google’s side. It usually means that something went wrong in how they’re dealing with something internally. Sometimes in calling a parallel service to Gemini, but not Gemini itself.

I’m seeing more and more reports of something like this. Can you provide more details or a concrete example of code you’re calling that is is triggering it? Are you using any tools? Large prompts? Media?

KrisBitney · November 12, 2024, 10:24am

In addition to a user text prompt, I’m using cached context with a large PDF and system instructions. I’m trying to accurately extract information from research studies.

test_sj · November 16, 2024, 7:13am

I am also getting the same issue.
did you get any solution for this issue?

AI-Q · November 16, 2024, 10:42am

Same issue sisce morning, i was quite frustrated thinking that if i was doing something wrong… Error details: {
message: ‘[GoogleGenerativeAI Error]: Error fetching from https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent: [503 Service Unavailable] The model is overloaded. Please try again later.’,
stack: ‘Error: [GoogleGenerativeAI Error]: Error fetching from https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent: [503 Service Unavailable] The model is overloaded. Please try again later.\n’ +

AdemCetinkaya · November 16, 2024, 11:08am

I’m facing the same problem when trying to retrieve JSON data

(https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent:) [503 Service Unavailable] The model is overloaded. Please try again later.’,

ogobel · November 16, 2024, 12:26pm

Same issue. Around 30% of requests are returning 503. Model overloaded or service unavailable.

someuser · November 16, 2024, 4:02pm

same issue persist using node js sdk

Proking · November 16, 2024, 4:27pm

[DUPLICATE]

Try using Gemini’s experimental model “gemini-exp-1114”. I believe that Google allocated too many resources to the experimental model, possibly due to an imminent update.

wigglycornet · November 16, 2024, 4:50pm

Hi! Didn’t work. About 80% of request are giving 503.

Ali_Shariq · November 16, 2024, 5:45pm

It’s been 7 days and this error still persists…

mostafa_kamar · November 16, 2024, 8:36pm

Hello, I am also Encountering this error.
Nearly All of my requests are returning 503

[GoogleGenerativeAI Error]: Error fetching from https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent: [503 Service Unavailable] The model is overloaded. Please try again later…

ogobel · November 16, 2024, 8:57pm

btw what about pro-1.5 model? Does it overloaded as well?

Proking · November 17, 2024, 2:32am

No, I don’t believe so.

AI-Q · November 17, 2024, 2:34am

Everything was overloaded yesterday. I just checked it 1 minute earlier and everything seems to work fine now.
I hope the issue is resolved for you all too??

ogobel · November 17, 2024, 8:55am

For me yes! Finally works

AnaBeatriz · November 18, 2024, 6:52am

Using gemini-1.5-pro I got “[429 too many requests] resource has been exhausted (e.g. check quota).” error

Pratham_Dwivedi · November 18, 2024, 6:53am

I am also getting this error . I am using langchain and it is traversing the pdf and giving me answer with the help of gemini . But when I am asking the question sometimes it is giving me this error

Jordan_Malfara · November 18, 2024, 1:44pm

Same issue here.

Error fetching from https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash-002:generateContent: [503 Service Unavailable] The model is overloaded. Please try again later.

I just switched from flash-001 to 002 and now these error are showing. Retry policies let these pass eventually in my case but the errors are pretty often.

Leon_Nicholls · November 18, 2024, 10:28pm

I have been getting these errors frequently today with “gemini-1.5-flash-002”:
[GoogleGenerativeAI Error]: Error fetching from https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash-002:generateContent: [503 Service Unavailable] The model is overloaded. Please try again later.

Some API calls work, but eventually it throws these errors.

Topic		Replies	Views
Model is overloaded - Gemini API model	53	2958	June 3, 2025
503 UNAVAILABLE Gemini 2.0 Flash API Gemini API models , gemini-flash	11	676	May 8, 2025
[PARTIALLY SOLVED] Gemini models overloading with token windows of less than 20? Gemini API gemini-15 , api , models	14	1585	November 18, 2024
Continuous Error: The model is overloaded Gemini API model	4	1554	November 20, 2024
Getting a lot of "service unavailable" errors on gemini-2.0-flash Gemini API api , gemini-flash , gemini-20	14	635	June 24, 2025

Error: The model is overloaded

Related topics