Выбор модели для AI-систем

Жёсткие атрибуты

  • Инфраструктура - Для стартового проекта построение своей инфраструктуры для развертывания модели извлишне затратно как по времени, так и средствам
  • Доступность - есть доступ к моделям без ограничений и трудностей оплаты в России

Кандидаты

Исходя из ограничений выбор удалось сузить до нескольких вариантов:

  1. gpt-oss-120b
  2. qwen-3-235b-a22b-instruct-2507
  3. gigachat-2-lite
  4. yandexgpt-5.1
  5. deepseek-v3.2

Сравнение кандидатов

Используя ранее реализованные методы по оценке, а также общие сведения о моделях, составлена таблица сравнения

Критерийgpt-oss-120bgigachat-2-liteyandexgpt-5.1qwen-3-235b-a22bdeepseek-v3.2
Кулинарная компетентностьОтличнаяХорошаяХорошаяОтличнаяОтличная
Завершенность ответовЗавершенныеИногда диалог выглядит сломаннымЗаверешенные в большинстве случаевЗавершенныеЗавершенные
СтруктураЧеткая иерархия, акценты, таблицыЕсть иерархия, акцентыЕсть иерархия, акцентыЕсть иерархия, акцентыЧеткая иерархия, акценты
Нежелательное следование инструкциямНе обнаруженоНе обнаруженоНе обнаруженоНе обнаруженоНе обнаружено
Размышляющая модельДаНетНетНетДa
Стоимость тестирования*14 руб.0 руб.**5 руб.10 руб.26 руб.

*- Тестирование выполнено через Yandex Ai Studio, за исключением GigaChat, на одном и том же наборе запросов

**- Первые 1М бесплатно, далее - пакетами. Мин. цена пакета - 1300 руб. за 20M

Выбор модели

Исходя из таблицы, в качестве итоговой модели была выбрана размышляющая модель gpt-oss-120b за умеение четко и наглядно представлять информацию, не устапая по компетентности в кулинарии qwen-3-235b-a22b-instruct-2507 и deepseek-v3.2.