Волатильность в классификации
- Авторы: Рубчинский А.А.1
-
Учреждения:
- Национальный исследовательский университет «Высшая школа экономики»
- Выпуск: № 2 (2014)
- Страницы: 272-280
- Раздел: Статьи
- URL: https://journals.rudn.ru/miph/article/view/8376
Цитировать
Полный текст
Аннотация
Целью данной работы является разработка новой трёхуровневой схемы автоматической классификации, основанной на введённом понятии - волатильности , как отдельных кластеров, так и классификации в целом. Волатильность представляет собой точно определяемую и эффективно вычисляемую величину, которая определяет стабильность, точность, надёжность некоторых подмножеств исходного множества вариантов - короче говоря, возможность (или невозможность) их выбора в качестве кластеров. Предложенный алгоритм находит кластеры с заданным максимальным уровнем волатильности, включая и традиционные кластеры, обладающие волатильностью, близкой к нулевой. Кластеры на фондовых рынках США, России и Швеции (за период кризиса 2008-2010 годов) и депутатские кластеры, определяемые голосованиями в 3-й Думе с 01.09.2001 по 31.01.2002 - периода, включающего в себя образование партии «Единая Россия» 01.12.2001, - были построены предложенным алгоритмом. При анализе кластеров, построенных по результатам голосований для каждого месяца в отдельности, оказалось, что волатильность кластеризации в сентябре и октябре равна 0, резко возрастает в ноябре и слегка убывает в декабре и ноябре. Другие методы (типа индексов согласованности между фракциями и др.) не показывают «политической бифуркации» в рассматриваемом периоде. Рассмотрены также разнообразные модельные примеры, для которых результаты классификации хорошо согласуются с геометрической интуицией.
Об авторах
Александр Анатольевич Рубчинский
Национальный исследовательский университет «Высшая школа экономики»
Email: arubchinsky@yahoo.com
Международная научно-учебная лаборатория анализа и выбора решений; Кафедра прикладной математики и информатики Международный университет природы, общества и человека «Дубна» ул. Университетская, д.19, Дубна, Московская область, Россия, 141980
Список литературы
- A Survey of Kernel and Spectral Methods for Clustering / M. Filippone, F. Camastra, F. Masulli, S. Rovetta // Pattern Recognition. - 2008. - Vol. 41, No 1. - Pp. 176-190.
- Girvan M., Newman M. E. J. Community Structure in Social and Biological Networks // Proc. Natl. Acad. Sci. USA. - 2002. - Vol. 99, No 12. - Pp. 7821-7826.
- Gordon A. D. Classification. - London: Chapman & Hall/CRC, 1999.
- Luxburg U. A Tutorial on Spectral Clustering // Statistics and Computing. - 2007. - Vol. 17, No 4. - Pp. 395-416.
- Mirkin B. Mathematical Classification and Clustering. - Dordrecht: Kluwer Academic Publishers, 1996.
- Mirkin B. Clustering for Data Mining: A Data Recovery Approach. - London: Chapman & Hall/CRC, 2005.
- Mirkin B. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. - London: Springer, 2010.
- Rubchinsky A. Divisive-Agglomerative Classification Algorithm Based on the Minimax Modification of Frequency Approach. - Moscow: NRU HSE, 2010.
- Алескеров Ф. Т. и др. Влияние и структурная устойчивость в Российском парламенте(1905-1917и1993-2005гг.). М.: ФИЗМАТЛИТ,2007.