Компания Google объявила о запуске Gemini 3.1 Flash-Lite — быстрой и наиболее доступной с экономической точки зрения ИИ-модели семейства Gemini. Алгоритм оптимизирован для эффективной обработки больших объёмов данных, а стоимость его использования составляет $0,25 за 1 млн входных и $1,50 за 1 млн выходных токенов. Предварительная версия ИИ-модели уже доступна разработчикам через Gemini API в Google AI Studio, а для корпоративных клиентов — в Vertex AI.

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

Ryzen и 16 Гбайт DDR5: как сэкономить на памяти так, чтобы не лишиться 15 % производительности

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

Обзор Ryzen 7 9850X3D: три процента за двадцать баксов

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

Обзор Samsung Galaxy Z TriFold: тройной складной смартфон по цене квартиры в Воркуте

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

Обзор ноутбука HONOR MagicBook X16 2026: как раньше, только лучше

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

Компьютер месяца, спецвыпуск: эпоха отката, или Как дефицит чипов памяти влияет на выбор железа для игрового ПК

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

Gemini 3.1 Flash-Lite превосходит модель Gemini 2.5 Flash по времени до генерации первого токена в 2,5 раза и на 45 % быстрее выводит данные ответов. При этом сохраняется аналогичный или более высокий уровень качества ответов. Такая низкая задержка необходима для повышения эффективности рабочих процессов, что делает новую модель привлекательной для разработчиков, создающих отзывчивые решения и приложения, работающие в режиме реального времени.

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

ИИ-модель достигла впечатляющего результата в рейтинге ELO в 1432 балла на Arena.ai и превзошла другие ИИ-модели аналогичного уровня по показателям рассуждения и мультимодальной обработки. В тестах GPQA Diamond и MMMU Pro алгоритм набрал 86,9 % и 76,8 % соответственно, превзойдя результаты некоторых более крупных ИИ-моделей Gemini предыдущих поколений, таких как Gemini 2.5 Flash.

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

Разработчики имеют возможность регулирования глубины рассуждений Gemini 3.1 Flash-Lite в соответствии с собственными потребностями. Этот аспект является важным для управления высокочастотными рабочими нагрузками. Проведена оптимизация обработки масштабных задач, таких как перевод больших объёмов текста и модерация контента, где стоимость является одним из приоритетов. Алгоритм подходит для генерации пользовательских интерфейсов (UI), дашбодов, моделирования и проведения исследований на основе сложных запросов.