Об идентификации языка искаженных текстов методом опорных векторов
- Авторы: Ермилов А.В.1
-
Учреждения:
- Национальный исследовательский институт «Высшая школа экономики»
- Выпуск: № 2 (2012)
- Страницы: 127-131
- Раздел: Статьи
- URL: https://journals.rudn.ru/miph/article/view/8666
Цитировать
Полный текст
Аннотация
Рассматривается задача автоматического определения языка текстовых сообщений для случая, когда текст, язык которого нужно определить, подвергается случайным искажениям называемых «замена символа» с различными вероятностями. Приводятся результаты экспериментов по идентификации языка методом опорных векторов.
Ключевые слова
Об авторах
Алексей Валерьевич Ермилов
Национальный исследовательский институт «Высшая школа экономики»
Email: alvalerm@mail.ru
кафедра управления разработкой программного обеспечения; Национальный исследовательский институт «Высшая школа экономики»
Список литературы
- Support Vector Machines for Speaker and Language Recognition / W.M. Campbell, J.P. Campbell, D.A. Reynolds et al. // Computer Speech and Language. - 2006. - Vol. 20. - Pp. 210-229.
- Кулай А.Ю., Мельников С.Ю. О точности идентификации языка искаженного текста в зависимости от степени искажения // Концептуальный спектр изысканий в современном речеведении (Вестн. Моск. Гос. Лингвист. Ун-та, сер. Языкознание. - Вып. 575). - М.: ИПК МГЛУ «Рема». - 2009. - С. 200-209. [Kulayj A.Yu., Meljnikov S.Yu. O tochnosti identifikacii yazihka iskazhennogo teksta v zavisimosti ot stepeni iskazheniya // Konceptualjnihyj spektr izihskaniyj v sovremennom rechevedenii (Vestn. Mosk. Gos. Lingvist. Un-ta, ser. Yazihkoznanie. - Vihp. 575). - M.: IPK MGLU "Rema". - 2009. - S. 200-209. ]
- Boser B.E., Guyon I.M., Vapnik V.N. A Training Algorithm for Optimal Margin Classifiers // Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory. - ACM Press, 1992. - Pp. 144-152.
- Buhmann M.D. Radial Basis Functions: Theory and Implementations. CambridgeMonographs on Applied and Computational Mathematics. - Cambridge University Press, 2009. - ISBN 9780521101332. - http://books.google.co.uk/books?id= -v2GPAAACAAJ.
- Joachims T. Text Categorization with Support Vector Machines: Learning withMany Relevant Features. - 1998.
- Teytaud O., Jalam R. Kernel-Based Text-Categorization // In International Joint Conference on Neural Networks (IJCNN'2001. - 2000. - P. 1.
- Hsu C.-W., Lin C.-J. A Comparison of Methods for Multiclass Support Vector Machines. - 2002.
- Buturovi.c L. J. PCP: a Program for Supervised Classification of Gene Expression Profiles // Bioinformatics. - 2006. - Vol. 22, No 2. - Pp. 245-247. - http: //bioinformatics.oxfordjournals.org/content/22/2/245.abstract.
- Kohavi R. A Study of Cross-Validation and Bootstrap for Accuracy Estimation andModel Selection. - Morgan Kaufmann, 1995. - Pp. 1137-1143.