Об одном методе сглаживания двумерной поверхности

Обложка

Цитировать

Полный текст

Аннотация

Регрессионный анализ ставит перед собой задачу отыскания функциональной зависимости между наблюдаемыми величинами изучаемого процесса. При этом исходные данные являются реализацией случайной величины, поэтому рассматривается зависимость математического ожидания. Такую задачу можно решать путём «сглаживания» исходных данных. Под сглаживанием понимается попытка удаления шума и несущественных фрагментов при сохранении наиболее важных свойств структуры данных, то есть результат подобен математическому ожиданию. Сглаживание данных, как правило, осуществляется путём параметрической или непараметрической регрессии. В случае параметрической регрессии необходимы априорные знания о форме уравнения регрессии. Большинство исследуемых данных, однако, невозможно параметризовать. С этой точки зрения непараметрическая и полупараметрическая регрессии представляются лучшим подходом к решению задачи сглаживания. Целью исследования ставилось разработка и реализация алгоритма быстрого сглаживания двумерных данных. Для достижения этой цели были проанализированы предыдущие работы в данной области и разработан свой подход, улучшающий предыдущие. В результате, в данной работе представлен алгоритм, который быстро и с минимальным потреблением памяти очищает данные от «шума» и «несущественных» частей. Для подтверждения «эффективности» алгоритма проведены сравнения с другими общепризнанными подходами на смоделированных и реальных данных. Результаты этих сравнений также приведены в статье.

Об авторах

Павел Геннадьевич Любин

ФБГОУ ВО МГТУ «СТАНКИН»

Email: lyubin.p@gmail.com

Список литературы

  1. Whittaker E. T. On a New Method of Graduation // Proceedings of the Edinburgh Mathematical Society. 1923. Vol. 41. Pp. 62-75.
  2. Wahba G. Spline Models for Observational Data. Society for Industrial Mathematics, 1990. ISBN 9780898712445.
  3. Schoenberg I. J. Spline Functions and the Problem of Graduation // Proceedings of the National Academy of Sciences of the United States of America. 1964. Vol. 52. Pp. 947-950.
  4. Takezawa K. Introduction to Nonparametric Regression. Wiley & Sons, Inc., 2005. ISBN 9780471745839.
  5. Weinert H. L. E_cient Computation for Whittaker-Henderson Smoothing // Computational Statistics & Data Analysis. 2007. Vol. 52. Pp. 959-974.
  6. Щетинин Е. Ю., Любин П. Г. Робастный алгоритм построения сглаживающих сплайнов // Научное обозрение. - 2015. - Т. 1. - С. 86-94.
  7. Любин П. Г., Щетинин Е. Ю. Стохастические модели сглаживания и прогнозирования коэффициентов смертности // Научное обозрение. - 2015. - Т. 18. - С. 147-155.
  8. Xiao L., Li Y., Ruppert D. Fast Bivariate P-splines: the Sandwich Smoother // Journal of the Royal Statistical Society. 2013. Vol. 75. P. 577-599.
  9. Garcia D. Robust Smoothing of Gridded Data in One and Higher Dimensions with Missing Values // Computational Statistics & Data Analysis. 2010. Vol. 54. P. 1167-1178.
  10. Seber G. A Matrix Handbook for Statisticians. Wiley-Interscience, 2007. ISBN 9780471748694.
  11. Wood S. MGCV: Mixed GAM Computation Vehicle with GCV/AIC/REML Smoothness Estimation. R package version 1.8.10. https://cran.r-project.org/web/packages/mgcv/index.html, r package version 1.8.10.
  12. The Human Mortality Database. http://www.mortality.org/.

© Любин П.Г., 2016

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах