Волатильность в классификации

Обложка

Цитировать

Полный текст

Аннотация

Целью данной работы является разработка новой трёхуровневой схемы автоматической классификации, основанной на введённом понятии - волатильности , как отдельных кластеров, так и классификации в целом. Волатильность представляет собой точно определяемую и эффективно вычисляемую величину, которая определяет стабильность, точность, надёжность некоторых подмножеств исходного множества вариантов - короче говоря, возможность (или невозможность) их выбора в качестве кластеров. Предложенный алгоритм находит кластеры с заданным максимальным уровнем волатильности, включая и традиционные кластеры, обладающие волатильностью, близкой к нулевой. Кластеры на фондовых рынках США, России и Швеции (за период кризиса 2008-2010 годов) и депутатские кластеры, определяемые голосованиями в 3-й Думе с 01.09.2001 по 31.01.2002 - периода, включающего в себя образование партии «Единая Россия» 01.12.2001, - были построены предложенным алгоритмом. При анализе кластеров, построенных по результатам голосований для каждого месяца в отдельности, оказалось, что волатильность кластеризации в сентябре и октябре равна 0, резко возрастает в ноябре и слегка убывает в декабре и ноябре. Другие методы (типа индексов согласованности между фракциями и др.) не показывают «политической бифуркации» в рассматриваемом периоде. Рассмотрены также разнообразные модельные примеры, для которых результаты классификации хорошо согласуются с геометрической интуицией.

Об авторах

Александр Анатольевич Рубчинский

Национальный исследовательский университет «Высшая школа экономики»

Email: arubchinsky@yahoo.com
Международная научно-учебная лаборатория анализа и выбора решений; Кафедра прикладной математики и информатики Международный университет природы, общества и человека «Дубна» ул. Университетская, д.19, Дубна, Московская область, Россия, 141980

Список литературы

  1. A Survey of Kernel and Spectral Methods for Clustering / M. Filippone, F. Camastra, F. Masulli, S. Rovetta // Pattern Recognition. - 2008. - Vol. 41, No 1. - Pp. 176-190.
  2. Girvan M., Newman M. E. J. Community Structure in Social and Biological Networks // Proc. Natl. Acad. Sci. USA. - 2002. - Vol. 99, No 12. - Pp. 7821-7826.
  3. Gordon A. D. Classification. - London: Chapman & Hall/CRC, 1999.
  4. Luxburg U. A Tutorial on Spectral Clustering // Statistics and Computing. - 2007. - Vol. 17, No 4. - Pp. 395-416.
  5. Mirkin B. Mathematical Classification and Clustering. - Dordrecht: Kluwer Academic Publishers, 1996.
  6. Mirkin B. Clustering for Data Mining: A Data Recovery Approach. - London: Chapman & Hall/CRC, 2005.
  7. Mirkin B. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. - London: Springer, 2010.
  8. Rubchinsky A. Divisive-Agglomerative Classification Algorithm Based on the Minimax Modification of Frequency Approach. - Moscow: NRU HSE, 2010.
  9. Алескеров Ф. Т. и др. Влияние и структурная устойчивость в Российском парламенте(1905-1917и1993-2005гг.). М.: ФИЗМАТЛИТ,2007.

© Рубчинский А.А., 2014

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах