Выбор технологии искусственного интеллекта


Контекст

Изображение представляет собой неструктурированный набор пикселей, для которых трудно задать логические признаки вручную. Задача определения заболевания дачных растений по фото относится к категории задач распознавания (классификация).

Рассматриваемые варианты

  • Система, основанная на знаниях;
  • Нейросетевая система, основанная на многослойном перцептроне (MLP);
  • Нейросетевая система, основанная на сверточной нейронной сети (CNN).

Решение

Нейросетевая система, основанная на сверточной нейронной сети (CNN).

Обоснование

  • Изоражение как неструктурированный набор пикселей едва поддается описанию с помощью правил, характерных для систем, основанных на знаниях;
  • Модели на основе многослойного перцептрона чувствительны к сдвигам, масштабированию и другим геометрическим искажениям изображения, так как не учитывают пространственные зависимости между пикселями [1];
  • Модели, основанные на сверточной нейросети, в целом демонстрируют лучшие результаты в задачач распознавания, чем многослойные перцептроны [2];
  • Свёрточные слои используют разделяемые веса (sparse weights) [3], благодаря чему количество параметров и занимаемая память значительно меньше [1], чем у MLP при работе с изображениями большого размера.

Сравнение числа весов, исходя из архитектур MLP и CNN приведены на рисунке:

Последствия

  • ✅ Точность распознавания образов будет достаточно высокой;
  • ✅ Модель будет занимать приемлемый размер по памяти на устройстве;
  • ❌ Более сложная архитектура модели и, как следствие, процесс обучения несколько сложнее.

Источники

  1. Aston Z., Zhang A., Lipton Z. C., Smola A. J. Dive into learning. 1-е изд. - Cambridge: Cambridge University Press, 2023. - 574 с. - ISBN 1009389432. - URL: https://d2l.ai/
  2. Maryna Dovbnych, Małgorzata Plechawska–Wójcik, A comparison of conventional and deep learning methods of image classification // Journal of Computer Sciences Institute №21, 2021. P. 303-308. - DOI: 10.35784/jcsi.2727
  3. Goodfellow I., Bengio Y., Courville A. Deep learning. - Cambridge, MA: MIT Press, 2016. - 775 с. - ISBN 0262035618. - URL: https://www.deeplearningbook.org/