Начинает свою работу страница курса-факультатива "Компьютерное зрение".

В настоящем разделе размещена информация, затрагивающая литературу, ссылки, лекционный материал по тематике курса и задания к практическим работам.

Место и время проведения 

Физический факультет (1-ый учебный корпус), к. 306, каждую неделю по субботам, с 15.00 до 16.35.

Темы лекционных занятий
  1. Введение и обзор материала курса (презентация .pptxпрезентация .pdf). Tiny images - "крошки картинки" (ссылка). Awesome Terminator 2 Scenes - "сцены из потрясающего фильма Терминатор 2" (ссылка). Microsoft Kinect - "гаджет для Xbox 360" (ссылка).
  2. Формирование изображений. Камера и ее основные характеристики  (презентация .pptxпрезентация .pdf)Awareness Test - "тест на внимательность" (ссылка).
  3. Обработка цифровых изображений в среде Matlab (презентация .pptxпрезентация .pdf). Seam Carving Algorithm - "контурное вырезание по шву" (описание, презентация .pptxпрезентация .pdfпример реализации .rar). Примеры реализации простейших алгоритмов компьютерного зрения в среде Matlab (примеры реализации .rar).
  4. Фильтрация и улучшение изображений. Часть 1 (презентация .pptxпрезентация .pdf). Hybrid Images - "гибридные изображения" (описание).
  5. Фильтрация и улучшение изображений. Часть 2 (презентация .pptxпрезентация .pdf).
  6. Оценка качества цифровых изображений (опционально, презентация .pptxпрезентация .pdfm-файлы .rar). Описание и Matlab-реализацию Structural SIMilarity (SSIM) index - коэффициент структурного подобия (КСП) можно найти здесь. Рекомендации ITU-R BT.500-11 Methodology for the Subjective Assessment of the Quality of Television Pictures - методология для субъективной оценки качества телевизионных изображений (ссылка). Про субъективную оценку качества можно также почитать здесь.
  7. Цвет и обработка цветных изображений (презентация .pptxпрезентация .pdf). Awareness Test - "тест на внимательность" (ссылка). Tiny images - "крошки картинки" (ссылка). Смотрим визуальные иллюзии на Planet Perplex (ссылка). Про трекинг глаз читаем здесь. Так же интересно почитать следующую книгу Yarbus Alfred L. Eye Movements and Vision. Plenum Press, 1967 (ссылка).
  8. Анализ бинарных изображений. Первое понятие о распознавании объектов (презентация .pptxпрезентация .pdf). Примеры реализации простейших алгоритмов анализа бинарных изображений в среде Matlab (примеры реализации .rar).
  9. Алгоритмические и математические принципы систем автоматического распознавания номерных знаков (ссылкапрезентация .pptxпрезентация .pdf). Интересный алгоритм детектирования номерных знаков (ссылка). Пример реализации простого алгоритма детектирования номерных знаков в среде Matlab (ссылка).
  10. Сегментация изображений. Часть 1 (презентация .pptxпрезентация .pdf). Несколько интересных статей по теме лекции можно найти в источнике [16] (ссылка 1ссылка 2ссылка 3). Неплохая обзорная видеолекция на тему сегментации изображений и видео может быть найдена в online курсе Guillermo Sapiro "Image and video processing: From Mars to Hollywood with a stop at the hospital" (ссылка). Смотреть нужно лекцию №5, для просмотра нужна регистрация на сайте www.coursera.org.
  11. Сегментация изображений. Часть 2 (презентация .pptxпрезентация .pdf). Обзорная видеолекция на тему выделения границ и детектирования линий на изображениях может быть найдена в online курсе Guillermo Sapiro "Image and video processing: From Mars to Hollywood with a stop at the hospital" (ссылка). Смотреть нужно лекцию №5, для просмотра нужна регистрация на сайте www.coursera.org. Про детектор Кэнни читаем оригинальную статью здесь. Про детектор линейных сегментов можно найти информацию на сайте научного журнала IPOL (Image Processing On Line) по обработке и анализу изображений (ссылка). Пример заполнения аккумулятора при выполнении преобразования Хафа можно найти здесь.
  12. Машинное обучение. Часть 1 (презентация .pptxпрезентация .pdf). Про автономный вертолет читаем здесь. Законченная реализация алгоритма линейной регрессии с одной и несколькими переменными из online курса Andrew Ng "Machine Learning" на www.coursera.org (ссылка). С оригинальным Стэнфордским курсом по машинному обучению Andrew Ng можно ознакомиться здесь или здесь. Неплохо написанную книжку по машинному обучению Stephen Marsland "Machine Learning: An Algorithmic Perspective" можно скачать здесь. Эта книга хорошо подходит для понимания базовых концепций в данной области. В ней есть примеры реализации алгоритмов машинного обучения на языке Python. Рекомендую ознакомиться с книжкой написанной Александром Борисовичем Мерковым (к.т.н., сотрудник Института системного анализа РАН) "Введение в методы статистического обучения" (ссылка). Книга написана просто, доступно и дает хороший обзор современных методов распознавания. Также рекомендуется ознакомиться с отечественным профессиональным информационно-аналитическим ресурсом, который посвящен машинному обучению, распознаванию образов и интеллектуальному анализу данных (ссылка).
  13. Машинное обучение. Часть 2 (презентация .pptxпрезентация .pdf). Законченная реализация алгоритма логистической регрессии с регуляризацией и без нее из online курса Andrew Ng "Machine Learning" на www.coursera.org (ссылка).
  14. Машинное обучение. Часть 3 (презентация .pptxпрезентация .pdf). Законченная реализация алгоритма логистической регрессии с регуляризацией и нейронной сети прямого распространения для решения задачи многоклассовой классификации на базе данных рукописных цифр MNIST из online курса Andrew Ng "Machine Learning" на www.coursera.org (ссылка). Обращаю внимание на то, что в предложенной реализации по умолчанию используется только 5000 тренировочных примеров (вместо изначальных 60000) из базы данных MNIST, а также на то, что тестирование рассматриваемых алгоритмов осуществляется на примерах, которые использовались на этапе обучения. Поэтому сравнить полученные результаты с уже имеющимися на аналогичной базе данных (ссылка) нельзя! Несколько баз данных для обучение, в том числе MNIST (в удобном, родном для Matlab формате mat) можно найти здесь. Интересно почитать следующую статью про сверточную нейронную сеть LeNet 5 (ссылка).
  15. Машинное обучение. Часть 4 (презентация .pptxпрезентация .pdf). Законченная реализация алгоритма обучения нейронной сети прямого распространения для решения задачи многоклассовой классификации на базе данных рукописных цифр MNIST из online курса Andrew Ng "Machine Learning" на www.coursera.org (ссылка). Автономное вождение / проект ALVINN (видео позаимствовано из курса Andrew Ng "Machine Learning" на www.coursera.org). 
  16. Машинное обучение. Часть 5 (презентация .pptxпрезентация .pdf). Пример законченного кода для самостоятельного исследования по регуляризованной линейной регрессии, а также таких понятий как смещение и дисперсия из курса Andrew Ng "Machine Learning" на www.coursera.org (ссылка).
  17. Детектирование лиц на основе алгоритма Виола / Джонса (презентация .pptxпрезентация .pdf). Ссылка на статью Viola P., Jones M. Robust Real-time Object Detection // Int. J. Computer Vision. 2004. V. 57, 2. P. 137–154 (ссылка).
  18. Анализ главных компонент. Распознавание лиц. Ссылка на статью Turk M., Pentland А. Eigenfaces for Recognition // Journal of Cognitive neuroscience. 1991. V. 3, №1. P. 73–86 (ссылка). Ссылка на копию оригинальной статьи К. Пирсона 1901 г., в которой был предложен анализ главных компонент (ссылка). Пример законченного кода для самостоятельного исследования по анализу главных компонент, а также метода K-средних из курса Andrew Ng "Machine Learning" на www.coursera.org (ссылка). Дополнительно про анализ главных компонент и другие методы сокращения размерности можно почитать в книге Stephen Marsland "Machine Learning: An Algorithmic Perspective" (ссылка).
Практические задания
  1. Фильтрация изображений (описание .pdfизображения .rar).
  2. Цифровая хроматография изображений Российской Империи, полученных С.М. Прокудиным-Горским (описание .pdfизображения .rar).
  3. Простой алгоритм распознавания номерных знаков (описание .pdfтестовые изображения .rarизображения эталонов цифр .rar).
Дополнительные материалы
  1. Szelicki R. Computer Vision: Algorithms and Applications. Springer, 2010 (ссылка).
  2. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, 2009 (ссылка).
  3. Конушин А. и др. Курс "Введение в компьютерное зрение", 2010. Лаборатория компьютерной графики при ВМК МГУ (ссылка).
  4. Конушин А. и др. Курс "Введение в компьютерное зрение", 2011. Лаборатория компьютерной графики при ВМК МГУ (ссылка).
  5. Конушин А. и др. Курс "Введение в компьютерное зрение", 2012. Лаборатория компьютерной графики при ВМК МГУ (ссылка).
  6. Kemelmacher I., Rao R., Seitz S., Shapiro L. Computer Vision (CSE 455), 2003 - 2010. University of Washington (ссылка).
  7. Lazebnik S. Computer Vision (COMP 776), 2008 - 2011. The University of North Carolina at Chapel Hill (ссылка).
  8. Thrun S. Computer Vision / Introduction to Computer Vision (CS 223b), 2004 - 2009. Stanford University (ссылка).
  9. Darrell T. Computer Vision (CS 280), 2009. University of California, Berkeley (ссылка).
  10. Duraiswami R. Fundamentals of Computer Vision (CMSC 828d), 2000 / Computer Vision (CMSC 426), 2005. UMIACS (ссылка). 
  11. Torralba A. Advances in Computer Vision (6.869), 2010. Massachusetts Institute of Technology (ссылка).
  12. Ng A. Machine Learning (CS 229), 2009. Stanford University (ссылка 1, ссылка 2).
  13. Конушин A. Семантическая классификация изображений (видеолекции), 2010. Сomputer Science клуб при ПОМИ РАН (ссылка).
  14. Ерухимов В. Компьютерное зрение и библиотека OpenCV (видеолекции), 2011. Сomputer Science клуб при ПОМИ РАН (ссылка).
  15. Конушин А. Курсы "Введение в компьютерное зрение" и "Доп. главы компьютерного зрения" (видеолекции), 2011. Лаборатория компьютерной графики при ВМК МГУ (ссылка).
  16. Сетевой журнал "Компьютерная графика и мультимедиа" (ссылка).
  17. Efros A. Learning-Based Methods in Vision (16-721), 2009. Carnegie Mellon University (ссылка).
  18. Efros A. Computational Photography (15-463 / 15-862), 2010. Carnegie Mellon University (ссылка).
  19. Сайт научного журнала IPOL (Image Processing On Line) по обработке и анализу изображений (ссылка).
  20. Pattern Analysis, Statistical Modeling and Computational Learning Visual Object Classes Challenge (ссылка).
Online курсы

Информация по наиболее интересным online курсам приведена в первой презентации. Напоминаю, что с прошлого года ряд западных университетов начал практику создания online курсов (www.coursera.orgwww.udacity.org) по различным дисциплинам. Например, "Искусственный интеллект", "Машинное обучение", "Компьютерное зрение" и т.д. Для ознакомления с материалами курсов (видеолекциями, практическими заданиями и т.д.) нужна регистрация! Дополнительно необходимо отметить, что появились online лекции по курсу "Машинное обучение", читаемые сотрудниками ШАД (Школы анализа данных Яндекс). Ссылка на курс здесь.

Руководитель курса: асс. каф. ДЭС Волохов В.А.