Application of stochastic methods, wavelet transformations and support vectors for the study of electroencephalogram signals

Cover Page

Cite item

Full Text

Abstract

This study explores the application of modern data processing methods - wavelet transformation, stochastic methods, and Support Vector Machine (SVM) - on real electroencephalogram (EEG) signals from open databases. Analyzing EEG signals is crucial for medical diagnostics and neuroscience, requiring sophisticated techniques due to high dimensionality and noise. Wavelet transformation allows decomposition of signals into frequency components with varying temporal resolutions, facilitating time-frequency analysis. Stochastic methods utilize probabilistic models for modeling random processes and analyzing data statistics. Meanwhile, SVM is a machine learning algorithm that identifies the optimal hyperplane to separate classes, enhancing generalization, particularly with complex nonlinear data. When comparing these methods, the specific data type and task should be considered: wavelet transformation is ideal for signal processing, stochastic methods are used for random processes, and SVM excels in classification tasks. Thus, selecting the most suitable approach should be based on a comparative analysis of method effectiveness in a particular context. This study will discuss these concepts and present examples of applying these techniques to EEG data, contributing to the analysis and classification of brain activity and the identification of pathologies.

Full Text

Введение В современном мире нейронауки и медицинской диагностики анализ сигналов электроэнцефалограмм (ЭЭГ) играет ключевую роль в выявлении патологий мозга, исследовании активности мозга и понимании механизмов его работы. Однако обработка и анализ ЭЭГ-сигналов является сложной задачей из-за их высокой размерности, шумов и сложной структуры. В данном исследовании рассмотрено применение современных методов обработки данных, таких как вейвлет-преобразование, стохастические методы и метод опорных векторов (SVM), на реальных данных ЭЭГ из открытых баз данных. Вейвлет-преобразование используется для анализа частотных характеристик сигналов, что позволяет выделять особенности и структуру сигналов на разных временных и частотных масштабах. Стратегии машинного обучения, такие как стохастические методы и SVM, являются мощными инструментами для классификации электрофизиологических сигналов. Их применение на реальных данных ЭЭГ позволяет эффективно выявлять патологии и аномалии, а также классифицировать активность мозга. В ходе работы будут рассмотрены концепции, методы и практические примеры применения указанных подходов на реальных сигналах ЭЭГ, что поможет углубить понимание возможностей анализа и интерпретации данных мозговой активности с использованием передовых методов обработки и классификации. 1. Методы Электроэнцефалография (ЭЭГ) - метод исследования активности мозга, который позволяет записать электрические сигналы, генерируемые нейронами. Анализ сигналов ЭЭГ имеет большое значение в медицине, нейронауке и психологии. Одним из наиболее эффективных методов анализа сигналов ЭЭГ является вейвлет-преобразование. Этот метод позволяет анализировать сигналы на различных временных масштабах и частотах, что полезно для выявления временных зависимостей в данных [1]. Помимо вейвлет-преобразования стохастические методы также широко используются для анализа временных рядов, включая сигналы ЭЭГ. Они позволяют учитывать случайность и изменчивость сигналов, что может быть важно при исследовании активности мозга. Среди методов машинного обучения для анализа сигналов ЭЭГ SVM (Support Vector Machine) занимает особое место. SVM - это мощный алгоритм классификации, который может быть успешно применен для распознавания образцов в сигналах ЭЭГ, например для диагностики неврологических заболеваний. Исследования, в которых комбинируются методы вейвлет-преобразования, стохастические методы и SVM на реальных данных ЭЭГ из открытых баз данных, могут привести к новым открытиям в области нейронауки и медицины. Такие исследования направлены на улучшение диагностики и лечения различных заболеваний мозга, а также понимания особенностей его работы. Значение использования реальных сигналов ЭЭГ из открытых баз данных. Использование реальных сигналов ЭЭГ из открытых баз данных имеет высокое значение для исследований в области нейронауки, медицины и психологии. Рассмотрим несколько ключевых аспектов этой темы. 1.1. Обзор открытых баз данных в области ЭЭГ Существует несколько популярных открытых баз данных, содержащих записи сигналов ЭЭГ, которые широко используются исследователями по всему миру. Некоторые из таких баз данных включают: - PhysioNet - это крупнейшая база данных с различными физиологическими сигналами, включая данные по ЭЭГ. Она содержит разнообразные наборы данных, которые могут быть использованы для различных исследований; - EEG Database - это ресурс, предоставляющий доступ к множеству баз данных с сигналами ЭЭГ различных пациентов и здоровых испытуемых. 1.2. Преимущества использования реальных данных для исследований Реализм. Использование реальных данных позволяет получить более точное представление об активности мозга, что помогает более эффективно и достоверно исследовать различные аспекты работы мозга. Объективность. Данные из открытых баз обеспечивают доступ к широкому спектру различных сигналов, что помогает обеспечить объективность результатов исследования. Возможность повторяемости. Использование открытых данных позволяет другим исследователям повторить и проверить результаты исследований. 1.3.Необходимость стандартизации и проверки качества данных Стандартизация. Важно обеспечить единый подход к обработке и анализу данных ЭЭГ из различных баз данных, чтобы гарантировать сравнимость результатов между разными исследованиями. Проверка качества. Необходимо проводить проверку качества данных, так как возможны искажения и шумы, которые могут влиять на выводы исследований. Она включает в себя проверку на артефакты, помехи и другие ошибки. Использование реальных данных ЭЭГ из открытых баз данных представляет собой ценный ресурс для научных исследований в области нейронауки. Тщательный анализ и стандартизация данных играют важную роль в обеспечении достоверности и значимости исследовательских результатов. 2. Моделирование 2.1. Методы вейвлет-преобразования для анализа сигналов ЭЭГ Вейвлет-преобразование - это метод обработки сигналов, который позволяет разложить сигнал на составляющие различных частот и временных масштабов. Он использует вейвлеты - небольшие волновые функции для анализа сигналов в диапазоне частот [2]. Преимущества применения вейвлет-анализа для обработки сигналов ЭЭГ: - локализация во времени и частоте. Вейвлет-анализ позволяет одновременно анализировать и локализовать как частотные, так и временные особенности сигналов ЭЭГ; - лучшее разрешение. Вейвлет-анализ обладает лучшим разрешением по сравнению с классическим преобразованием Фурье, что позволяет выявлять даже тонкие изменения в сигналах ЭЭГ; - мультирезольюционность. Вейвлет-анализ обеспечивает мультирезольюционный подход к анализу сигналов, что позволяет исследовать различные временные и частотные масштабы одновременно. Практическое применение методов вейвлет-преобразования на реальных данных ЭЭГ: - фильтрация шумов. Вейвлет-преобразование позволяет эффективно фильтровать и уменьшать шумы в сигналах ЭЭГ, повышая качество данных; - идентификация событий. С помощью вейвлет-анализа можно выявлять специфические события и паттерны в сигналах ЭЭГ, такие как реакции на стимулы или эпилептические разряды; - изучение динамики мозговой активности. Методы вейвлет-преобразования позволяют анализировать изменения в частотных компонентах сигнала ЭЭГ во времени, что помогает понять динамику мозговой активности. Практическое применение вейвлет-преобразования на реальных данных ЭЭГ является мощным инструментом для изучения мозговой активности, выявления патологий и исследования когнитивных процессов [3]. Перейдем к примерам (рис.). Вайвлет Мексиканская шляпа / Tne Mexican hat wavelet Пример вейвлета Мексиканская шляпа И с т о ч н и к: выполнено В.В. Толмановой An example of the “Mexican Hat” wavelet S o u r c e: done by V.V. Tolmanova На графике Вейвлет Мексиканская шляпа изображены три разные кривые, соответствующие математической функции, описанной в заголовке и легенде. Каждая кривая представляет собой комбинацию функций масштабирования и гауссовой функции. График имеет горизонтальную ось с метками от -15 до 15 и вертикальную ось с диапазоном значений от -0,4 до 1,0: 1) кривая y(t) (синяя линия) соответствует параметрам a = 1, b = 1; 2) кривая yab (t) (оранжевая линия) соответствует параметрам a = 2, b = 1; 3) кривая yab (t) (зеленая линия) соответствует параметрам a = 4, b = 1. Каждая из кривых представляет собой вейвлет Мексиканская шляпа для различных параметров масштабирования и сдвига, показывая, как функция меняет свою форму и ширину при изменении значений a и b. Метод вейвлет-преобразования является мощным инструментом анализа сигналов и изображений. Используя вейвлет-преобразование, можно добиться ряда практических результатов: 1) сжатие данных. Вейвлет-преобразование позволяет представлять данные в их разложенном виде на различные масштабы и частоты. Это дает возможность эффективно сжимать данные, сохраняя при этом их информативность. Такой подход широко применяется в сжатии изображений и звука; 2) фильтрация сигналов. Вейвлет-преобразование позволяет выделять различные компоненты сигнала на разных масштабах, благодаря чему возможно удалять шумы из сигнала или выделять интересующие компоненты сигнала, улучшая его качество [4]; 3) детекция и сегментация объектов. Вейвлет-преобразование позволяет выделять текстуры и паттерны в изображениях, что делает его полезным инструментом для детекции и сегментации объектов на изображениях; 4) анализ временных рядов. Вейвлет-преобразование позволяет анализировать временные ряды на различных временных и частотных масштабах, что помогает выявлять различные закономерности и тренды в данных. Таким образом, метод вейвлет-преобразования обладает широким спектром применений и может использоваться для решения различных задач в области анализа сигналов и изображений [5]. 2.2. Стохастические методы анализа сигналов ЭЭГ Статистические методы анализа, включая стохастические методы, широко используются для изучения временных рядов ЭЭГ. Некоторые из ключевых стохастических методов включают: - авторегрессионные модели - алгоритмы, моделирующие зависимости между текущим значением сигнала и предыдущими значениями; - спектральный анализ - методы анализа частотного содержания сигнала, такие как методы оценки спектра мощности; - методы машинного обучения - стохастические алгоритмы, такие как скрытые марковские модели или нейронные сети, могут быть применены для анализа и классификации сигналов ЭЭГ [6]. Применение стохастических методов для изучения временных рядов ЭЭГ: - идентификация паттернов. Стохастические методы позволяют выявлять и анализировать сложные временные зависимости в сигналах ЭЭГ, например переходы между различными фазами активности [6]; - классификация состояний. С использованием методов машинного обучения на основе временных рядов ЭЭГ можно классифицировать различные состояния мозговой активности, что полезно, например, для диагностики нейрологических расстройств; - прогнозирование. Стохастические методы могут быть использованы для прогнозирования будущих значений сигналов ЭЭГ на основе предыдущих данных [8]. Результаты и преимущества применения стохастических методов на реальных данных: - улучшенное понимание динамики мозговой активности. Стохастические методы позволяют проводить более глубокий и точный анализ временных рядов ЭЭГ, что способствует лучшему пониманию динамики мозговой активности [9]; - точность диагностики. Использование стохастических методов для анализа сигналов ЭЭГ может повысить точность диагностики различных патологий мозга, таких как эпилепсия или расстройства сна; - поиск корреляций. Стохастические методы позволяют исследовать корреляции между различными частотными компонентами сигналов ЭЭГ и другими параметрами, что может привести к новым открытиям в области нейронауки [10]. Применение стохастических методов на реальных данных ЭЭГ - это эффективный подход для изучения и анализа мозговой активности, а также для диагностики и мониторинга различных нейрологических состояний. Они позволяют выявлять скрытые паттерны, прогнозировать будущие изменения и улучшать общее понимание работы мозга [11]. Стохастические методы обработки данных широко применяются в различных областях. Благодаря их использованию можно достичь ряда практических результатов. 1. Улучшение скорости обучения моделей. Стохастический градиентный спуск позволяет быстрее находить локальный оптимум функции потерь и обучать модели на больших объемах данных. Это особенно актуально в области машинного обучения и искусственного интеллекта [12]. 2. Эффективное решение оптимизационных задач. Стохастические методы оптимизации могут помочь в решении сложных оптимизационных задач, таких как задачи минимизации функций потерь или поиска оптимальных параметров модели. 3. Адаптивность к изменениям в данных. Благодаря стохастическим методам модели могут подстраиваться к изменениям во входных данных или среде, что делает их более устойчивыми и гибкими. 4. Решение задач в реальном времени. Использование стохастических методов позволяет обрабатывать данные в режиме реального времени, что особенно важно в таких областях, как финансы, медицина, маркетинг и др. 5. Улучшение качества результата. Правильный выбор стохастического метода обработки данных и настройка его параметров могут повысить качество моделей и точность предсказаниий [13]. Таким образом, стохастические методы обработки данных могут привести к улучшению эффективности обучения моделей, адаптивности к изменениям и повышению качества результатов в различных областях прикладной науки и технологий. 3. Применение метода опорных векторов (SVM) в анализе сигналов ЭЭГ 3.1. Введение в метод опорных векторов (SVM) Метод опорных векторов (Support Vector Machine, SVM) - это мощный алгоритм машинного обучения, который используется для задач классификации и регрессии. Основная идея SVM заключается в поиске оптимальной разделяющей гиперплоскости, которая наилучшим образом разделяет данные разных классов. SVM стремится максимизировать расстояние между этой гиперплоскостью и ближайшими к ней точками, называемыми опорными векторами [14]. 3.2. Применение SVM для классификации сигналов в ЭЭГ Применение SVM для классификации сигналов в ЭЭГ является одним из популярных подходов, особенно в задачах диагностики нейрологических состояний. Для этого данные сигналов ЭЭГ обычно представляются как набор признаков, например, частотно-временные характеристики сигнала, которые затем подаются на вход SVM для обучения модели классификации [15]. 3.3. Практический пример применения SVM на реальных данных ЭЭГ Имея набор данных ЭЭГ, содержащий информацию о различных состояниях мозговой активности, мы используем SVM для классификации этих состояний. Для этого мы должны сделать следующее: 1) предобработать данные. Предварительная обработка сигналов ЭЭГ, такая как фильтрация, уменьшение шума и извлечение признаков. 2) разделить данные. Разделение данных на обучающую и тестовую выборки для обучения и оценки модели SVM; 3) выбрать ядро. Выбор оптимального ядра SVM, которое наилучшим образом будет соответствовать структуре данных; 4) обучить модель. Обучение SVM на обучающем наборе данных с последующей кросс-валидацией для подбора гиперпараметров; 5) оценить модель. Оценка качества модели на тестовой выборке с использованием метрик, таких как точность, полнота, F1-мера и т.д. 4. Результаты и обсуждения В результате после обработки данных и обучения модели SVM на наборе данных ЭЭГ мы можем использовать обученную модель для классификации новых сигналов и определения состояний мозговой активности с высокой точностью [16]. Метод опорных векторов (SVM) является мощным инструментом машинного обучения, который позволяет эффективно решать задачи классификации и регрессии [17]. Далее приведем несколько практических результатов, которые можно получить при использовании SVM. 1. Хорошая обобщающая способность. SVM способен строить разделяющую гиперплоскость, которая максимально разделяет классы, что позволяет модели обобщать данные и делать точные прогнозы на новых, ранее не использованных данных. 2. Решение задач с линейной и нелинейной зависимостью. SVM способен работать как с линейно разделимыми данными, так и с данными, которые не могут быть разделены прямой линией. С помощью ядерных функций SVM может строить сложные нелинейные разделяющие поверхности. 3. Поддержка многомерных данных. SVM может обрабатывать данные в высокоразмерных пространствах, что позволяет эффек-тивно работать с данными большой размерности, например в компьютерном зрении или обработке естественного языка. 4. Решение проблемы переобучения. SVM имеет возможность контролировать сложность модели с помощью параметров регуляризации, что помогает предотвращать переобучение и повышает обобщающую способность модели. 5. Поддержка различных функций потерь. SVM можно настраивать с различными функциями потерь в зависимости от задачи, что делает данный метод универсальным инструментом для различных типов задач машинного обучения [18]. Таким образом, использование метода опорных векторов может привести к высокой точности моделей, способности работать с разнообразными данными и решать различные задачи классификации и регрессии. Поэтому SVM является мощным инструментом для классификации сигналов ЭЭГ и может быть эффективно применен для анализа и диагностики нейрологических состояний [19]. Результат: Данный результат означает, что точность модели SVM на тестовом наборе данных составляет 55 %. То есть модель правильно клас-сифицировала 55 % примеров из тестового набора данных. Чем выше точность модели, тем лучше она справляется с задачей классификации [20]. Заключение Подводя итог, необходимо подчеркнуть значимость и перспективность данных методов для анализа мозговой активности. Использование вейвлет-преобразования предоставляет возможность эффективного вы-явления частотных особенностей сигналов на разных временных масштабах, что важно для изучения динамики мозговой активности. Стратегии стохастических методов и SVM позволяют классифицировать ЭЭГ-сигналы, что важно для диагностики патологий и понимания функциональной организации мозга. Результаты исследования на реальных данных ЭЭГ подтверждают эффективность и применимость указанных методов для анализа сложных сигналов мозговой активности. Применение современных алгоритмов обработки данных улучшает точность классификации электрофизиологических данных, что открывает новые возможности для исследований в области нейронауки и медицинской диагностики. Однако для дальнейшего развития и улучшения эффективности применения данных методов необходимо проводить более глубокие исследования, внедрять новейшие техники анализа данных и продолжать работу над оптимизацией алгоритмов. Кроме того, важно осуществлять сравнительный анализ с другими методами обработки сигналов для получения более точной и всесторонней оценки их применимости и эффективности.
×

About the authors

Veronika V. Tolmanova

RUDN University

Email: 1042210065@pfur.ru
ORCID iD: 0000-0001-9433-7859

Postgraduate student of the Department of Mechanics and Control Processes, Academy of Engineering

6 Miklukho-Maklaya St, Moscow, 117198, Russian Federation

Denis A. Andrikov

RUDN University

Author for correspondence.
Email: andrikovdenis@mail.ru
ORCID iD: 0000-0003-0359-0897
SPIN-code: 8247-7310

Ph.D. in Technical Sciences, Associate Professor of the Department of Mechanics and Control Processes, Academy of Engineering

6 Miklukho-Maklaya St, Moscow, 117198, Russian Federation

References

  1. Petrosian A, Prokhorov D, Homan R. Reccurent neural network based prediction of epileptic seizures in intra- and extracranial EEG. Neurocomputing. 2000;30(1):201-218. https://doi.org/10.1016/S0925-2312(99)00126-5
  2. Adeli H, Zhou Z, Dadmehr N. Analysis of EEG records in an epileptic patient using wavelet transform. Journal of Neuroscience Methods. 2003;123(1):69-87. https://doi.org/10.1016/S0165-0270(02)00340-0
  3. Albaqami H, Hassan G, Datta A. Automatic detection of abnormal EEG signals using wavelet feature extraction and gradient boosting decision tree. Biomedical Signal Processing and Control. 70, 2021;70(2):102957. https://doi.org/10.1016/j.bspc.2021.102957
  4. Nacpil E, Wang Z, Guan M. EEG-based Emergency Braking Prediction Using Data Ablation and SVM Classification. IEEE Sensors Journal. 2023;23(14):16013-16019. https://doi.org/10.1109/JSEN.2023.3283447
  5. Shanmugadass V, Suresh GR, Balakumaran T, Wise A. EEG Signal Analysis for Automated Epilepsy Seizure Detection Using Wavelet Transform and Artificial Neural Network. Journal of Medical Imaging and Health Informatics. 2019;9(6):1301-1306. https://doi.org/10.1166/jmihi.2019.2713
  6. Ullah I, Hussain M. An Automated System for Epilepsy Detection using EEG Brain Signals based on Deep Learning Approach. Expert systems with applications. 2018;107:61-71. https://doi.org/10.1016/j.eswa.2018.04.021
  7. Karpov OE, Andrikov DA, Maksimenko VA, Hramov AE. Explainable artificial intelligence for medicine. Medical doctor and information technology. 2022;(2):4-11. (In Russ.) https://doi.org/10.25881/18110193_2022_2_4
  8. Sharova DE, Mikhailova AA, Gusev AV, Garbuk SV, Vladzymyrskyy AV, Vasilev YA. Аn analysis of global experience in regulations on the use of medical data for artificial intelligence systems development based on machine learning. Medical doctor and information technology. 2022;(4):28-39. (In Russ.) https://doi.org/10.25881/18110193_2022_4_28
  9. Cortes C, Vapnik V. Support-vector networks. Machine learning. 1995;20(3):273-297. https://doi.org/10.1007/BF00994018
  10. Stam CJ. Nonlinear dynamical analysis of EEG and MEG: review of an emerging field. Clinical Neurophysiology. 2004;116(10):2266-2301. https://doi.org/10.1016/j.clinph.2005.06.011
  11. Thakor NV, Tong S. Advances in quantitative electroencephalogram analysis methods. Annual Review of Biomedical Engineering. 2004;6(1):453-95. https://doi.org/10.1146/annurev.bioeng.5.040202.121601
  12. Hramov AE, Koronovskii A, Makarov VA, Pavlov A, Sitnikova E. Wavelets in neuroscience. Springer Berlin Heidelberg; 2015. ISBN: 978-3-662-43850-3
  13. Hramov AE, Koronovskii AA, Makarov VA, Pavlov AN, Sitnikova E. Automatic Diagnostics and Process-ing of EEG. In: Wavelets in Neuroscience. Springer Series in Synergetics. Berlin, Heidelberg: Springer; 2014. https://doi.org/10.1007/978-3-662-43850-3_7
  14. Percival DB, Walden AT. Wavelet Methods for Time Series Analysis. Cambridge University Press; 2000. https://doi.org/10.1017/CBO9780511841040
  15. Hilarov VL. Epileptic seizures regularities, revealed from encephalograms time series by nonlinear mechanics methods. Journal of Physics Conference Series. 2019;1400(3):033011. https://doi.org/10.1088/1742-6596/1400/3/033011
  16. Peker M, Sen B, Delen D. A novel method for automated diagnosis of epilepsy using complex-valued classifiers and wavelet transform. Journal of Biomedical Informatics. 2016;20(1):108-118. https://doi.org/10.1109/JBHI.2014.2387795
  17. Meenakshi D, Singh A, Singh A. Frequency ana-lysis of healthy & epileptic seizure in EEG using fast fourier transform. Int. J. Eng. Res.Gen.Sci. 2014;2(4):683-691. Available from: https://oaji.net/articles/2014/786-1406216595.pdf (accessed: 17.07.2024).
  18. Sudalaimani C, Thomas TE, Sivakumaran N, Valsalam SR, Meethal SP, Sathish E. Seizure prediction using general regression neural network. 2017 Trends in Industrial Measurement and Automation (TIMA), Chennai, India, 2017. p. 1-7. https://doi.org/10.1109/TIMA.2017.8064810
  19. Savadkoohi M, Oladduni T. A machine learning approach to epileptic seizure prediction using electroencephalogram (EEG) signal. Journal of Applied Biomedicine. 2020;40(3): 1328-1341. https://doi.org/10.1016/j.bbe.2020. 07.004
  20. Devarajan K, Jyostna E, Jayasri K, Balasampath V. (2014). EEG-based epilepsy detection and prediction. Inter-national Journal of Engineering and Technology. 2014;6(3):212-216. https://doi.org/10.7763/IJET.2014.V6.698

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2025 Tolmanova V.V., Andrikov D.A.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.