Об идентификации языка искаженных текстов методом опорных векторов

Обложка

Цитировать

Полный текст

Аннотация

Рассматривается задача автоматического определения языка текстовых сообщений для случая, когда текст, язык которого нужно определить, подвергается случайным искажениям называемых «замена символа» с различными вероятностями. Приводятся результаты экспериментов по идентификации языка методом опорных векторов.

Об авторах

Алексей Валерьевич Ермилов

Национальный исследовательский институт «Высшая школа экономики»

Email: alvalerm@mail.ru
кафедра управления разработкой программного обеспечения; Национальный исследовательский институт «Высшая школа экономики»

Список литературы

  1. Support Vector Machines for Speaker and Language Recognition / W.M. Campbell, J.P. Campbell, D.A. Reynolds et al. // Computer Speech and Language. - 2006. - Vol. 20. - Pp. 210-229.
  2. Кулай А.Ю., Мельников С.Ю. О точности идентификации языка искаженного текста в зависимости от степени искажения // Концептуальный спектр изысканий в современном речеведении (Вестн. Моск. Гос. Лингвист. Ун-та, сер. Языкознание. - Вып. 575). - М.: ИПК МГЛУ «Рема». - 2009. - С. 200-209. [Kulayj A.Yu., Meljnikov S.Yu. O tochnosti identifikacii yazihka iskazhennogo teksta v zavisimosti ot stepeni iskazheniya // Konceptualjnihyj spektr izihskaniyj v sovremennom rechevedenii (Vestn. Mosk. Gos. Lingvist. Un-ta, ser. Yazihkoznanie. - Vihp. 575). - M.: IPK MGLU "Rema". - 2009. - S. 200-209. ]
  3. Boser B.E., Guyon I.M., Vapnik V.N. A Training Algorithm for Optimal Margin Classifiers // Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory. - ACM Press, 1992. - Pp. 144-152.
  4. Buhmann M.D. Radial Basis Functions: Theory and Implementations. CambridgeMonographs on Applied and Computational Mathematics. - Cambridge University Press, 2009. - ISBN 9780521101332. - http://books.google.co.uk/books?id= -v2GPAAACAAJ.
  5. Joachims T. Text Categorization with Support Vector Machines: Learning withMany Relevant Features. - 1998.
  6. Teytaud O., Jalam R. Kernel-Based Text-Categorization // In International Joint Conference on Neural Networks (IJCNN'2001. - 2000. - P. 1.
  7. Hsu C.-W., Lin C.-J. A Comparison of Methods for Multiclass Support Vector Machines. - 2002.
  8. Buturovi.c L. J. PCP: a Program for Supervised Classification of Gene Expression Profiles // Bioinformatics. - 2006. - Vol. 22, No 2. - Pp. 245-247. - http: //bioinformatics.oxfordjournals.org/content/22/2/245.abstract.
  9. Kohavi R. A Study of Cross-Validation and Bootstrap for Accuracy Estimation andModel Selection. - Morgan Kaufmann, 1995. - Pp. 1137-1143.

© Ермилов А.В., 2012

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах