Об одном методе оценки многомерной плотности на основеближайших соседей

Обложка

Цитировать

Полный текст

Аннотация

Представлен метод оценки многомерной плотности, основанный на взвешенном методе ближайших соседей и имитирующий метод естественных соседей. Оценка многомерной плотности важна в машинном обучении, астрономии, биологии, физике и эконометрике.Строится 2-аддитивная нечёткая мера на основе аппроксимации индексов парных взаимодействий. Соседи, лежащие примерно в одном направлении, рассматриваются как излишние,и вклад дальнего соседа передаётся ближнему соседу. Расчёт локальной оценки плотности осуществляется с помощью дискретного интеграла Шоке таким образом, что учитывается вклад соседей, расположенных со всех сторон точки, где производятся вычисления. Однако вклад соседей, расположенных с одной и той же стороны, занижается с помощью выбора подходящей нечёткой меры. Таким образом вычисляется приближение к множеству естественных соседей Сибсона. Этот метод значительно снижает вычислительную нагрузку методов на базе естественных соседей, которые лежат на основе тесселяции Делоне, в высокой размерности, для которых вычислительная сложность растёт как экспонента раз-мерности. Описанный метод подходит для оценки плотности структурированных данных(возможно, лежащих на многообразии более низкой размерности), так как в этом случае ближайшие соседи могут значительно отличаться от естественных соседей.

Об авторах

Глеб Беляков

Университет Дикин

Автор, ответственный за переписку.
Email: gleb@deakin.edu.au

Беляков Глеб - профессор, кандидат физико-математических наук, профессор кафедры вычислительных технологий Университета Дикин, Австралия

Бурвуд хайвей 221, Бурвуд 3125, Австралия

Список литературы

  1. Scott D. W. Multivariate Density Estimation. - New York: John Wiley and Sons, 2015.
  2. Beliakov G., King M. Density Based Fuzzy C-Means Clustering of Non-Convex Patterns // Europ. J. Oper. Res. - 2006. - Vol. 173. - Pp. 717-728.
  3. Angelov P., Yager R. R. Density-Based Averaging - a New Operator for Data Fusion // Information Sciences. - 2013. - Vol. 222. - Pp. 163-174.
  4. Beliakov G., Wilkin T. On Some Properties of Weighted Averaging with Variable Weights // Information Sciences. - 2014. - Vol. 281. - Pp. 1-7.
  5. Parzen E. On the Estimation of a Probability Density Function and the Mode // Annals of Math. Stats. - 1962. - Vol. 33. - Pp. 1065-1076.
  6. Abraham C., Biau G., Cadre B. Simple Estimation of the Mode of a Multivariate Density // The Canadian Journal of Statistics. - 2003. - Vol. 31. - Pp. 23-34.
  7. Schaap W. E., van de Weygaert R. Continuous Fields and Discrete Samples: Reconstruction Through Delaunay Tessellations // Astronomy and Astrophysics. - 2000. - Vol. 363. - Pp. L29-L32.
  8. DBSCAN Revisited, Revisited: Why and How You Should (Still) Use DBSCAN / E. Schubert, J. Sander, M. Ester, H. P. Kriegel, X. Xu // ACM Trans. Database Syst. - 2017. - Vol. 42. - Pp. 19:1-19:21.
  9. Heidenreich N.-B., Schindler A., Sperlich S. Bandwidth Selection for Kernel Density Estimation: a Review of Fully Automatic Selectors // AStA Adv. Stat. - 2013. - Vol. 97. - Pp. 403-433.
  10. Voronoi G. Nouvelles applications des parametres continus a la theorie des formes quadratiques // Journal fur die Reine und Angewandte Mathematik. - 1908. - Vol. 133. - Pp. 97-178.
  11. Delaunay B. Sur la sph`ere vide // Bulletin de l’Academie des Sciences de l’URSS, Classe des sciences mathematiques et naturelles. - 1934. - Vol. 6. - Pp. 793-800.
  12. Sibson R. Brief Description of Natural Neighbor Interpolation // Interpreting Multivariate Data / Ed. by V. Barnett. - New York: John Wiley and Sons, 1981. - Pp. 21-36.
  13. Stuetzle W. Estimating the Cluster Tree of a Density by Analyzing the Minimal Spanning Tree of a Sample // Journal of Classification. - 2003. - Vol. 20. - Pp. 25-47.
  14. Samet H. Foundations of Multidimensional and Metric Data Structures. - Boston: Elsevier, 2006.
  15. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. - New York, Berlin, Heidelberg: Springer-Verlag, 2001.
  16. Dasarathy B. Nearest Neighbor Norms: NN Pattern Classification Techniques. - Los Alamitos, CA: IEEE Computer Society Press, 1991.
  17. Cost S., Salzberg S. A Weighted Nearest Neighbor Algorithm for Learning with Symbolic Features // Machine Learning. - 1993. - Vol. 10. - Pp. 57-78.
  18. Yager R. Using Fuzzy Methods to Model Nearest Neighbor Rules // IEEE Trans. on Syst., Man, and Cybernetics. - 2002. - Vol. 32. - Pp. 512-525.
  19. Hullermeier E. The Choquet-Integral as an Aggregation Operator in Case-Based Learning // Computational Intelligence, Theory and Applications / Ed. by B. Reusch. - Berlin, Heidelberg: Springer, 2006. - Pp. 615-627.
  20. Watson D. Contouring: A Guide to the Analysis and Display of Spatial Data. - Oxford: Pergamon Press, 1992.
  21. Boissonnat J.-D., Cazals F. Smooth Surface Reconstruction Via Natural Neighbour Interpolation of Distance Functions // Proc. of the 16th Annual Symposium on Computational Geometry. - 2000. - Pp. 223-232.
  22. The Non-Sibsonian Interpolation: a New Method of Interpolation of the Values of a Function on an Arbitrary Set of Points / V. V. Belikov, V. D. Ivanov, V. K. Kontorovich, S. A. Korytnik, A. Y. Semenov // Computational Mathematics and Mathematical Physics. - 1997. - Vol. 37. - Pp. 9-15.
  23. Beliakov G., Pradera A., Calvo T. Aggregation Functions: A Guide for Practitioners. - Heidelberg: Springer, 2007.
  24. Aggregation Functions / M. Grabisch, J.-L. Marichal, R. Mesiar, E. Pap. - Cambridge: Cambridge University press, 2009.
  25. Fuzzy Measures and Integrals. Theory and Applications / Ed. by M. Grabisch, T. Murofushi, M. Sugeno. - Heidelberg: Physica-Verlag, 2000.
  26. Grabisch M. k-Order Additive Discrete Fuzzy Measures and Their Representation // Fuzzy Sets and Systems. - 1997. - Vol. 92. - Pp. 167-189.
  27. Mayag B., Grabisch M., Labreuche C. A Characterization of the 2-additive Choquet Integral // Proc. of IPMU. - Malaga, Spain: 2008. - Pp. 1512-1518.
  28. Harris J. W., Stocker H. Spherical Segment (Spherical Cap) // Handbook of Mathematics and Computational Science. - New York: Springer, 1998. - 107 p.

© Беляков Г., 2018

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах