Описание изображений с использованием модельно-ориентированных дескрипторов
Мясников В.В.

 

Институт систем обработки изображений РАН – филиал ФНИЦ «Кристаллография и фотоника» РАН, Самара, Россия,
Самарский национальный исследовательский университет имени академика С.П. Королева, Самара, Россия

Аннотация:
В работе предлагается подход к построению описания изображений, основанный на их представлении с использованием набора модельно-ориентированных дескрипторов. Каждый дескриптор характеризует «схожесть» анализируемого изображения, представленного в виде комплекснозначного поля градиента, с некоторой предварительно выбранной моделью этого дескриптора. Для синтеза моделей дескрипторов в работе предлагается использовать метод главных компонент, применяемых для множества реализаций комплекснозначных градиентных полей. Предлагаемый подход позволяет получить описание комплекснозначного поля градиента анализируемого изображения в виде набора вещественных величин – признаков дескрипторов – из интервала [0, 1], которые одновременно характеризуют и фазовую, и абсолютную составляющую градиента изображения. Эффективность предлагаемого подхода демонстрируется на примере решения задачи распознавания лиц путем сопоставления с решением-прототипом (методом «собственных лиц»), использующим непосредственно полутоновые изображения. Сравнение выполняется с использованием классификатора по ближайшему соседу.

Ключевые слова:
цифровые изображения, признаки, модельно-ориентированные дескрипторы, анализ, распознавание.

Цитирование:
Мясников, В.В.  Описание изображений с использованием модельно-ориентированных дескрипторов / В.В. Мясников // Компьютерная оптика. – 2017. – Т. 41, №6. – С. 888-896. – DOI: 10.18287/2412-6179-2017-41-6-888-896.

Литература:

  1. Mikolajczyk, K. A performance evaluation of local descriptors / K. Mikolajczyk, C. Schmid // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2005. – Vol. 27, Issue 10. – P. 1615-1630. – DOI: 10.1109/TPAMI.2005.188.
  2. Методы компьютерной обработки изображений / М.В. Гашников, Н.И. Глумов, Н.Ю. Ильясова, В.В. Мясников, С.Б. Попов, В.В. Сергеев, В.А. Сойфер, А.Г. Храмов, А.В. Чернов, В.М. Чернов, М.А. Чичева, В.А. Фурсов; под ред. В.А. Сойфера. – Изд. 2-е, испр. – М.: Физматлит, 2003. – 784 с. – ISBN: 5-9221-0270-2.
  3. Duda, R.O. Pattern classification and scene analysis / R.O. Duda, P.E. Hart. – New York: Wiley, 1973. – 512 p. – ISBN: 978-0471223610.
  4. Мясников, В.В. Модельно-ориентированный дескриптор поля градиента как удобный аппарат распознавания и анализа цифровых изображений / В.В. Мясников // Компьютерная оптика. - 2012. - Т. 36, № 4. – С. 596-604.
  5. Мясников, В.В. Метод обнаружения транспортных средств на цифровых аэрофото- и космических изображениях дистанционного зондирования земли / В.В. Мясников // Компьютерная оптика. - 2012. - Т. 36, № 3. – С. 429-438.
  6. Kuznetsov, A.V. New algorithms for verifying the consistency between satellite images and survey conditions / A.V. Kuznetsov, V.V. Myasnikov // Pattern Recognition and Image Analysis. - 2016. - Vol. 26(3). – P. 593-596. – DOI: 10.1134/S1054661816030135.
  7. Dalal, N. Histograms of oriented gradients for human detection / N. Dalal, B. Triggs // Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Diego, USA. – 2005. – P. 886-893. – DOI: 10.1109/CVPR.2005.177.
  8. Lowe, D.G. Distinctive image features from scale-invariant keypoints / D.G. Lowe // International Journal of Computer Vision. – 2004. – Vol. 60, Issue 2. – P. 91-110. – DOI: 10.1023/B:VISI.0000029664.99615.94.
  9. Gonzalez-Reyna, S.E. Eigen-gradients for traffic sign recognition / S.E. Gonzalez-Reyna, J.G. Avina-Cervantes, S.E. Ledesma-Orozco, I. Cruz-Aceves // Mathematical Problems in Engineering. – 2013. – Vol. 2013. – 364305 (6 p.). – DOI: 10.1155/2013/364305.
  10. Hu, R. A performance evaluation of gradient field HOG descriptor for sketch based image retrieval / Rui Hu, John Collomosse // Computer Vision and Image Understanding. – 2013. – Vol. 117, Issue 7. – P. 790-806. – DOI: 10.1016/j.cviu.2013.02.005.
  11. Tzimiropoulos, G. Principal component analysis of image gradient orientations for face recognition / G. Tzi­miropoulos, S. Zafeiriou, M. Pantic // 2011 IEEE International Conference on Automatic Face and Gesture Recognition and Workshops (FG 2011). – 2011. – DOI: 10.1109/FG.2011.5771457.
  12. Храмов, А.Г. Метод поля направлений в анализе и интерпретации диагностических изображений : дис. ... доктора техн. наук : 05.13.17 / Храмов Александр Григорьевич. - Самара, 2006. – 230 с.
  13. Harshman, R.A. PARAFAC: Parallel factor analysis / R.A. Harshman, M.E. Lundy // Computational Statistics and Data Analysis. - 1994. - Vol. 18, Issue 1. – P. 39-72. – DOI: 10.1016/0167-9473(94)90132-5.
  14. Geometric computing with Clifford algebras: Theoretical foundations and applications in computer vision and robotics / ed. by G. Sommer. - Berlin, Heidelberg: Springer Verlag, 2000. - 529 p. – ISBN: 978-3-540-41198-7.
  15. Horel, J.D. Complex principal component analysis: Theory and examples / J.D. Horel // Journal of Climate and Applied Meteorology. - 1984. -Vol. 23. – P. 1660-1673. – DOI: 10.1175/1520-0450(1984)023<1660:CPCATA>2.0.CO;2.
  16. Schreier, P.J. Statistical signal processing of complex-valued data: The theory of improper and noncircular signals / P.J. Schreier, L.L. Scharf. – Cambridge: Cambridge University Press, 2010. – 330 p. – ISBN: 978-0-521-89772-3.
  17. Jolliffe, I.T. Principal component analysis / I.T. Jolliffe. – 2nd ed. – New York, Berlin, Heidelberg: Springer-Verlag, 2002. – ISBN: 0-387-95442-2.
  18. Бриллинджер, Д.Р. Временные ряды. Обработка данных и теория / Д.Р. Бриллинджер. – пер. с англ. – М.: Мир, 1980. – 536 с.
  19. Alfsmann, D. Hypercomplex algebras in digital signal processing: Benefits and drawbacks / D. Alfsmann, H.G. Göckler, S.J. Sangwine, T.A. Ell // 15th European Signal Processing Conference (EUSIPCO 2007). – 2007. – P. 1322-1326.
  20. Delac, K. Independent comparative study of PCA, ICA, and LDA on the FERET data set / K. Delac, M. Grgic, S. Grgic // International Journal of Imaging Systems and Technology. – 2005. – Vol. 15, Issue 5. – P. 252-260. – DOI: 10.1002/ima.20059.
  21. Duin, R.P.W. Featureless pattern classification / R.P.W. Duin, D. de Ridder, D.M.J. Tax // Kybernetika. – 1998. – Vol. 34(4). – P. 399-404.
  22. Advances in face image analysis: Techniques and technologies / ed. by Y.-J. Zhang. – Hershey, PA: IGI Global, 2011. – 350 p. – ISBN: 978-1-61520-991-0.
  23. Georghiades, A.S. From few to many: Illumination cone models for face recognition under variable lighting and pose / A.S. Georghiades, P.N. Belhumeur, D.J. Kriegman // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2001. – Vol. 23, Issue 6. – P. 643-660. – DOI: 10.1109/34.927464.
  24. Lee, K.C. Acquiring linear subspaces for face recognition under variable lighting / K.C. Lee, J. Ho, D. Kriegman // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2005. – Vol. 27, Issue 5. – P. 684-698. – DOI: 10.1109/TPAMI.2005.92.
  25. Turk, M. Eigenfaces for recognition / M. Turk, A. Pentland // Journal of Cognitive Neuroscience. – 1991. – Vol. 3(1). – P. 71-86. – DOI: 10.1162/jocn.1991.3.1.71.

© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846) 242-41-24 (ответственный секретарь), +7 (846) 332-56-22 (технический редактор), факс: +7 (846) 332-56-20