Анализ больших данных в геоинформационной задаче краткосрочного прогнозирования параметров транспортного потока на базе метода k ближайших соседей
Агафонов А.А., Юмаганов А.С., Мясников В.В.

Самарский национальный исследовательский университет имени академика С.П. Королёва, 443086, Россия, г. Самара, Московское шоссе д. 34,
ИСОИ РАН – филиал ФНИЦ «Кристаллография и фотоника» РАН, 443001, Россия, г. Самара, ул. Молодогвардейская, д. 151

Аннотация:
Точная и своевременная информация о текущем и прогнозном распределении транспортных потоков является важным фактором функционирования интеллектуальных транспортных систем. Использование этих данных позволит транспортным агентствам эффективнее решать задачу управления трафиком, участникам дорожного движения точнее планировать маршрут поездки и снизить время движения, и в целом повысит эффективность использования транспортной инфраструктуры. В данной статье представлена модель краткосрочного прогнозирования трафика, основанная на методе k ближайших соседей, которая учитывает пространственное и временное распределение транспортных потоков. Разработанная модель реализована с помощью фреймворка Apache Spark на основе модели распределённых вычислений MapReduce. Экспериментальные исследования представленной модели по данным о распределении транспортных потоков в транспортной сети города Самары позволяет сделать вывод, что предлагаемая модель обладает высокой точностью прогнозирования и временем работы, достаточным для прогнозирования в режиме реального времени.

Ключевые слова:
транспортный поток, краткосрочное прогнозирование, k ближайших соседей, MapReduce.

Цитирование:
Агафонов, А.А. Анализ больших данных в геоинформационной задаче краткосрочного прогнозирования параметров транспортного потока на базе метода k ближайших соседей / А.А. Агафонов, А.С. Юмаганов, В.В. Мясников // Компьютерная оптика. – 2018. – Т. 42, № 6. – С. 1101-1111. – DOI: 10.18287/2412-6179-2018-42-6-1101-1111.

Литература:

  1. Lana, I. Road traffic forecasting: Recent advances and new challenges / I. Lana, J. Del Ser, M. Velez, E. Vlahogianni // IEEE Intelligent Transportation Systems Magazine. – 2018. – Vol. 10, Issue 2. – P. 93-109. – DOI: 10.1109/MITS.2018.2806634.
  2. Smith, B.L. Comparison of parametric and nonparametric models for traffic flow forecasting / B.L. Smith, B.M. Williams, R.K. Oswald // Transportation Research Part C: Emerging Technologies. – 2002. – Vol. 10, Issue 4. – P. 303-321. – DOI: 10.1016/S0968-090X(02)00009-8.
  3. Smith, B.L. Traffic flow forecasting: comparison of modeling approaches / B.L. Smith, M.J. Demetsky // Journal of Transportation Engineering –1997. – Vol. 123, Issue 4. – P. 261-266. – DOI: 10.1061/(ASCE)0733-947X(1997)123:4(261).
  4. Xia, D. A distributed spatial-temporal weighted model on MapReduce for short-term traffic flow forecasting / D. Xia, B. Wang, H. Li, Y. Li, Z. Zhang // Neurocomputing. – 2016. – Vol. 179. – P. 246-263. – DOI: 10.1016/j.neucom.2015.12.013.
  5. Lv, Y. Traffic flow prediction with big data: a deep learning approach / Y. Lv, Y. Duan, W. Kang, Z. Li, F.-Y. Wang // IEEE Transactions on Intelligent Transportation Systems – 2015. – Vol. 16, Issue 2. – P. 865-873. – DOI: 10.1109/TITS.2014.2345663.
  6. Vlahogianni, E. Short-term traffic forecasting: Overview of objectives and methods / E. Vlahogianni, J. Golias, M. Kar­laftis // Transport Reviews. – 2004. – Vol. 24, Issue 5. – P. 533-557. – DOI: 10.1080/0144164042000195072.
  7. Vlahogianni, E. Short-term traffic forecasting: Where we are and where we’re going / E. Vlahogianni, M. Karlaftis, J. Golias // Transportation Research Part C: Emerging Technologies. – 2014. – Vol. 43, Issue 1. – P. 3-19. – DOI: 10.1016/j.trc.2014.01.005.
  8. Karlaftis, M.G. Statistical methods versus neural networks in transportation research: Differences, similarities and some insights / M.G. Karlaftis, E.I. Vlahogianni // Transportation Research Part C: Emerging Technologies. – 2011. – Vol. 19, Issue 3. – P. 387-389. – DOI: 10.1016/j.trc.2010.10.004.
  9. Shekhar, S. Adaptive seasonal time series models for forecasting short-term traffic flow / S. Shekhar, B.M. Williams // Transportation Research Record. – 2007. – Vol. 2024, Issue 1. – P. 116-125. – DOI: 10.3141/2024-14.
  10. Chandra, S.R. Predictions of freeway traffic speeds and volumes using vector autoregressive models / S.R. Chandra, H. Al-Deek // Journal of Intelligent Transportation Systems: Technology, Planning, and Operations. –2009. – Vol. 13, Issue 2. – P. 53-72. – DOI: 10.1080/15472450902858368.
  11. Guo, J. Real-time short-term traffic speed level forecasting and uncertainty quantification using layered Kalman filters / J. Guo, B.M. Williams// Transportation Research Record. – 2010. – Vol. 2175, Issue 1. – P. 28-37. – DOI: 10.3141/2175-04.
  12. Wang, Y. Real-time freeway traffic state estimation based on extended Kalman filter: a general approach / Y. Wang, M. Papageorgiou // Transportation Research Part B: Methodological. – 2005. – Vol. 39, Issue 2. – P. 141-167. – DOI: 10.1016/j.trb.2004.03.003.
  13. Fusco, G. Short-term traffic predictions on large urban traffic networks: Applications of network-based machine learning models and dynamic traffic assignment models / G. Fusco, C. Colombaroni, L. Comelli, N. Isaenko // Proceeding of the Fourth IEEE International Conference on Models and Technologies for Intelligent Transportation Systems (MT-ITS). – 2015. – P. 93-101. – DOI: 10.1109/MTITS.2015.7223242.
  14. Yin, H. Urban traffic flow prediction using a fuzzy-neural approach / H. Yin, S. Wong, J. Xu, C. Wong // Transportation Research Part C: Emerging Technologies. – 2002. – Vol. 10, Issue 2. – P. 85-98. – DOI: 10.1016/S0968-090X(01)00004-3.
  15. Lana, I. Joint feature selection and parameter tuning for short-term traffic flow forecasting based on heuristically optimized multi-layer neural networks / I. Lana, J. Del Ser, M. Velez, I. Oregi // Advances in Intelligent Systems and Computing. – 2017. – Vol. 514. – P. 91-100. – DOI: 10.1007/978-981-10-3728-3_10.
  16. Zheng, Z. Short-term traffic volume forecasting: a k-nearest neighbor approach enhanced by constrained linearly sewing principle component algorithm / Z. Zheng, D. Su // Transportation Research Part C: Emerging Technologies. – 2014. – Vol. 43, Issue 1. – P. 143-157. – DOI: 10.1016/j.trc.2014.02.009.
  17. Cai, P. A spatiotemporal correlative K-nearest neighbor model for short-term traffic multistep forecasting / P. Cai, Y. Wang, G. Lu, P. Chen, C. Ding, J. Sun // Transportation Research Part C: Emerging Technologies. – 2016. – Vol. 62. – P. 21-34. – DOI: 10.1016/j.trc.2015.11.002.
  18. Wu, C.-H. Travel-time prediction with support vector regression / C.-H. Wu, J.-M. Ho, D.T. Lee // IEEE Transactions on Intelligent Transportation Systems. – 2004. – Vol. 5, Issue 4. – P. 276-281. – DOI: 10.1109/TITS.2004.837813.
  19. Su, H. Short-term traffic flow prediction based on incremental support vector regression / H. Su, L. Zhang, S. Yu // Third International Conference on Natural Computation. –2007. – Vol. 1. – P. 640-645. – DOI: 10.1109/ICNC.2007.661.
  20. Fei, X. Bayesian dynamic linear model approach for real-time short-term freeway travel time prediction / X. Fei, C.-C. Lu, K.A. Liu // Transportation Research Part C: Emerging Technologies. – 2011. – Vol. 19, Issue 6. – P. 1306-1318. – DOI: 10.1016/j.trc.2010.10.005.
  21. Zhu, Z. Short-term traffic flow prediction with linear conditional Gaussian Bayesian network / Z. Zhu, B. Peng, C. Xiong, L. Zhang // Journal of Advanced Transportation. – 2016. – Vol. 50, Issue 6. – P. 1-13. – DOI: 10.1002/atr.1392.
  22. Sun, S. The selective random subspace predictor for traffic flow forecasting / S. Sun, C. Zhang // IEEE Transactions on Intelligent Transportation Systems. – 2007. – Vol. 8, Issue 2. – P. 367-373. – DOI: 10.1109/TITS.2006.888603.
  23. Агафонов, A.А. Оценка и прогнозирование параметров транспортных потоков с использованием композиции методов машинного обучения и моделей прогнозирования временных рядов / А.А. Агафонов, В.В. Мясников // Компьютерная оптика. – 2014. – Т. 38, № 3. – С. 539-549. – DOI: 10.18287/0134-2452-2014-38-3-539-549.
  24. Zhang, N. Seasonal autoregressive integrated moving average and support vector machine models: prediction of short term traffic flow on freeways / N. Zhang, Y. Zhang, H. Lu // Transportation Research Record. – 2011. – Vol. 2215, Issue 1. – P. 85-92. – DOI: 10.3141/2215-09.
  25. Moretti, F. Urban traffic flow forecasting through statistical and neural network bagging ensemble hybrid modeling / F. Moretti, S. Pizzuti, S. Panzieri, M. Annunziato // Neurocomputing. – 2015. – Vol. 167, Issue C. – P. 3-7. – DOI: 10.1016/j.neucom.2014.08.100.
  26. Chrobok, R. Different methods of traffic forecast based on real data / R. Chrobok, O. Kaumann, J. Wahle, M. Schreckenberg // European Journal of Operational Research. – 2004. – Vol. 155, Issue 3. – P. 558-568. – DOI: 10.1016/j.ejor.2003.08.005.
  27. Laña, I. Understanding daily mobility patterns in urban road networks using traffic flow analytics / I. Laña, J. Del Ser, I. Olabarrieta // Proceedings of the IEEE/IFIP Network Operations and Management Symposium. – 2016. – P. 1157-1162. – DOI: 10.1109/NOMS.2016.7502980.
  28. Jain, A.K. Data clustering: 50 years beyond k-means / A.K. Jain // Pattern Recognition Letters. – 2010. – Vol. 31, Issue 8. – P. 651-666. – DOI: 10.1016/j.patrec.2009.09.011.
  29. Han, J. Data mining: Concepts and techniques / J. Han, M. Kamber, J. Pei. – San Francisco: Morgan Kaufmann Publishers Inc., 2006. – 770 p. – ISBN: 978-1-55860-901-3.
  30. Myasnikov, E.V. Hyperspectral image segmentation using dimensionality reduction and classical segmentation approaches / E.V. Myasnikov // Computer Optics. – 2017. – Vol. 41(4). – P. 564-572. – DOI: 10.18287/2412-6179-2017-41-4-564-572.
  31. Carmel, D. Enhancing cluster labeling using wikipedia / D. Carmel, H. Roitman, N. Zwerdling // Proceedings of the 32nd International ACM SIGIR Conference on Research and Development in Information Retrieval. – 2009. – P. 139-146. – DOI: 10.1145/1571941.1571967.
  32. Ji, Y. On the spatial partitioning of urban transportation networks / Y. Ji, N. Geroliminis // Transportation Research Part B: Methodological. – 2012. – Vol. 46, Issue 10. – P. 1639-1656. – DOI: 10.1016/j.trb.2012.08.005.
  33. Ding, C.H.Q. A min-max cut algorithm for graph partitioning and data clustering / C.H.Q. Ding, X. He, H. Zha, M. Gu, H.D. Simon // Proceedings of the 2001 IEEE International Conference on Data Mining. – 2001. – P. 107-114. – DOI: 10.1109/ICDM.2001.989507.
  34. Apache SparkTM [Electronical Resource]. – URL: https://spark.apache.org/ (request date 28.08.2018).
  35. Dean, J. MapReduce: simplified data processing on large clusters / J. Dean, S. Ghemawat // Communications of the ACM. – 2008. – Vol. 51, Issue 1. – P. 107-113. – DOI: 10.1145/1327452.1327492.

© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846) 242-41-24 (ответственный секретарь), +7 (846) 332-56-22 (технический редактор), факс: +7 (846) 332-56-20