google/gemini-3.1-flash-lite
Google's cheapest GA model in the 3.x series. Matches Gemini 2.5 Flash quality at a fraction of the cost. Optimized for low-latency, high-volume workloads: classification, summarization, simple generation, and RAG at scale.
Источник: gemini_x0.5 · Проверено 2026-06-05
Чтение кэша $0.013/M · Запись кэша $—/M
Для вызова модели через API используйте любой из ID.
google/gemini-3.1-flash-liteЗамените заполнитель ONEHOP_KEY вашим API key. Создать →
from openai import OpenAI
client = OpenAI(
base_url="https://api.onehop.ai/v1",
api_key="<ONEHOP_KEY>",
)
completion = client.chat.completions.create(
model="google/gemini-3.1-flash-lite",
messages=[{"role": "user", "content": "What is the meaning of life?"}],
)
print(completion.choices[0].message.content)0 запросов за последние 30 дней