Выбор технологии искусственного интеллекта
Контекст
Изображение представляет собой неструктурированный набор пикселей, для которых трудно задать логические признаки вручную. Задача определения заболевания дачных растений по фото относится к категории задач распознавания (классификация).
Рассматриваемые варианты
- Система, основанная на знаниях;
- Нейросетевая система, основанная на многослойном перцептроне (MLP);
- Нейросетевая система, основанная на сверточной нейронной сети (CNN).
Решение
Нейросетевая система, основанная на сверточной нейронной сети (CNN).
Обоснование
- Изоражение как неструктурированный набор пикселей едва поддается описанию с помощью правил, характерных для систем, основанных на знаниях;
- Модели на основе многослойного перцептрона чувствительны к сдвигам, масштабированию и другим геометрическим искажениям изображения, так как не учитывают пространственные зависимости между пикселями [1];
- Модели, основанные на сверточной нейросети, в целом демонстрируют лучшие результаты в задачач распознавания, чем многослойные перцептроны [2];
- Свёрточные слои используют разделяемые веса (sparse weights) [3], благодаря чему количество параметров и занимаемая память значительно меньше [1], чем у MLP при работе с изображениями большого размера.
Сравнение числа весов, исходя из архитектур MLP и CNN приведены на рисунке:
Последствия
- ✅ Точность распознавания образов будет достаточно высокой;
- ✅ Модель будет занимать приемлемый размер по памяти на устройстве;
- ❌ Более сложная архитектура модели и, как следствие, процесс обучения несколько сложнее.
Источники
- Aston Z., Zhang A., Lipton Z. C., Smola A. J. Dive into learning. 1-е изд. - Cambridge: Cambridge University Press, 2023. - 574 с. - ISBN 1009389432. - URL: https://d2l.ai/
- Maryna Dovbnych, Małgorzata Plechawska–Wójcik, A comparison of conventional and deep learning methods of image classification // Journal of Computer Sciences Institute №21, 2021. P. 303-308. - DOI: 10.35784/jcsi.2727
- Goodfellow I., Bengio Y., Courville A. Deep learning. - Cambridge, MA: MIT Press, 2016. - 775 с. - ISBN 0262035618. - URL: https://www.deeplearningbook.org/