<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">RUDN Journal of Engineering Research</journal-id><journal-title-group><journal-title xml:lang="en">RUDN Journal of Engineering Research</journal-title><trans-title-group xml:lang="ru"><trans-title>Вестник Российского университета дружбы народов. Серия: Инженерные исследования</trans-title></trans-title-group></journal-title-group><issn publication-format="print">2312-8143</issn><issn publication-format="electronic">2312-8151</issn><publisher><publisher-name xml:lang="en">Peoples’ Friendship University of Russia named after Patrice Lumumba (RUDN University)</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="publisher-id">40360</article-id><article-id pub-id-type="doi">10.22363/2312-8143-2024-25-2-151-161</article-id><article-id pub-id-type="edn">TMZJXN</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>Articles</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Статьи</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Building a Predictive Model for Predicting Real Estate Prices Based on the Generated Database</article-title><trans-title-group xml:lang="ru"><trans-title>Построение предиктивной модели для прогнозирования цен недвижимости на основе сформированной базы данных</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Konyaeva</surname><given-names>Polina A.</given-names></name><name xml:lang="ru"><surname>Коняева</surname><given-names>Полина Александровна</given-names></name></name-alternatives><bio xml:lang="en">Master’s student, Academy of Engineering</bio><bio xml:lang="ru">магистрант инженерной академии</bio><email>1032212116@pfur.ru</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-3880-6662</contrib-id><contrib-id contrib-id-type="spin">3969-6701</contrib-id><name-alternatives><name xml:lang="en"><surname>Saltykova</surname><given-names>Olga A.</given-names></name><name xml:lang="ru"><surname>Салтыкова</surname><given-names>Ольга Александровна</given-names></name></name-alternatives><bio xml:lang="en"><p>Doctor of Sciences (Techn.), Associate Professor of the Department of Mechanics and Control Processes, Academy of Engineering</p></bio><bio xml:lang="ru"><p>кандидат физико-математических наук, доцент департамента механики и процессов управления, инженерная академия</p></bio><email>saltykova-oa@rudn.ru</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-8657-2282</contrib-id><contrib-id contrib-id-type="spin">2287-2902</contrib-id><name-alternatives><name xml:lang="en"><surname>Kupreev</surname><given-names>Sergei A.</given-names></name><name xml:lang="ru"><surname>Купреев</surname><given-names>Сергей Алексеевич</given-names></name></name-alternatives><bio xml:lang="en"><p>Doctor of Sciences (Techn.), Professor of the Department of Mechanics and Control Processes, Academy of Engineering</p></bio><bio xml:lang="ru"><p>доктор технических наук, профессор департамента механики и процессов управления инженерной академии</p></bio><email>kupreev-sa@rudn.ru</email><xref ref-type="aff" rid="aff1"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">RUDN University</institution></aff><aff><institution xml:lang="ru">Российский университет дружбы народов</institution></aff></aff-alternatives><pub-date date-type="pub" iso-8601-date="2024-07-30" publication-format="electronic"><day>30</day><month>07</month><year>2024</year></pub-date><volume>25</volume><issue>2</issue><issue-title xml:lang="en">VOL 25, NO2 (2024)</issue-title><issue-title xml:lang="ru">ТОМ 25, №2 (2024)</issue-title><fpage>151</fpage><lpage>161</lpage><history><date date-type="received" iso-8601-date="2024-08-11"><day>11</day><month>08</month><year>2024</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2024, Konyaeva P.A., Saltykova O.A., Kupreev S.A.</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2024, Коняева П.А., Салтыкова О.А., Купреев С.А.</copyright-statement><copyright-year>2024</copyright-year><copyright-holder xml:lang="en">Konyaeva P.A., Saltykova O.A., Kupreev S.A.</copyright-holder><copyright-holder xml:lang="ru">Коняева П.А., Салтыкова О.А., Купреев С.А.</copyright-holder><ali:free_to_read xmlns:ali="http://www.niso.org/schemas/ali/1.0/"/><license><ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-nc/4.0/legalcode</ali:license_ref></license></permissions><self-uri xlink:href="https://journals.rudn.ru/engineering-researches/article/view/40360">https://journals.rudn.ru/engineering-researches/article/view/40360</self-uri><abstract xml:lang="en"><p style="text-align: justify;">The work is devoted to solving the current problem of forecasting real estate prices by building a predictive model based on the generated database of real estate in Moscow, posted on the Move Real Estate website. Existing machine learning methods for solving the forecasting problem are considered and one of them is applied - multiple linear regression. A regression analysis of the obtained results of solving the forecasting problem was carried out. Eleven independent variables are considered as control parameters. The influence of the variables taken into account when constructing the model on the results of solving the problem of forecasting real estate prices was studied. It was determined which of the independent variables have the greatest impact on the results of the model. To improve the quality of the model, preprocessing and standardization of features were carried out. Identification of outliers and omissions of values was carried out during the formation of the database. The coefficients of the multiple linear regression model were determined using the least squares method. To assess the quality of the model, the following model parameters are analyzed: R-squared, adjusted R-squared, p-value. The result of constructing a predictive model is the resulting regression equation. The application of the resulting equation can be used to subsequently take into account specific characteristics when solving the problem of forecasting real estate prices. The work shows the advantages of using this method and the prospects for applying the obtained result.</p></abstract><trans-abstract xml:lang="ru"><p style="text-align: justify;">Представлено решение актуальной задачи прогнозирования цен на недвижимость с помощью построения предиктивной модели на основе сформированной базы данных по недвижимости в Москве, размещенной на веб-сайте «Move Недвижимость». Рассмотрены существующие методы машинного обучения для решения задачи прогнозирования и применен один из них - множественная линейная регрессия. Проведен регрессионный анализ полученных результатов решения задачи прогнозирования. В качестве управляющих параметров рассматриваются 11 независимых переменных. Исследовано влияние учитываемых при построении модели переменных на результаты решения задачи прогнозирования цен на недвижимость. Определено, какие из независимых переменных оказывают наибольшее влияние на результаты работы модели. Для улучшения качества модели была осуществлена предобработка и стандартизация признаков, а также идентификация выбросов и пропусков значений при формировании базы данных. Коэффициенты модели множественной линейной регрессии определялись с помощью метода наименьших квадратов. Для оценки качества модели проводился анализ следующих параметров модели: R-квадрат, скорректированный R-квадрат, р-значение. Результатом построения предиктивной модели является полученное уравнение регрессии. Применение полученного уравнения может быть использовано для последующего учета конкретных характеристик при решении задачи прогнозирования цен на недвижимость. Показаны преимущества использования данного метода и перспективы применения полученного результата.</p></trans-abstract><kwd-group xml:lang="en"><kwd>machine learning</kwd><kwd>regression analysis</kwd><kwd>multiple linear regression</kwd><kwd>least squares method</kwd><kwd>regression equation</kwd><kwd>R-squared</kwd><kwd>adjusted R-squared</kwd><kwd>p-value</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>машинное обучение</kwd><kwd>регрессионный анализ</kwd><kwd>множественная линейная регрессия</kwd><kwd>метод наименьших квадратов</kwd><kwd>уравнение регрессии</kwd><kwd>R-квадрат</kwd><kwd>скорректированный R-квадрат</kwd><kwd>р-значение</kwd></kwd-group><funding-group/></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><citation-alternatives><mixed-citation xml:lang="en">Alekseev G. Introduction to machine learning. Habr. 2019. (In Russ.) Available from: https://habr.com/ru/articles/448892 / (accessed: 03.27.2023).</mixed-citation><mixed-citation xml:lang="ru">Алексеев Г. Введение в машинное обучение // Хабр. 2019. URL: https://habr.com/ru/articles/448892/ (дата обращения: 27.03.2023).</mixed-citation></citation-alternatives></ref><ref id="B2"><label>2.</label><citation-alternatives><mixed-citation xml:lang="en">Leifer LA, Chernaya EV. Machine learning techniques for real estate mass valuation. Analysis of accuracy for various methods on the example of the appraisal of apartments. Property relations in the Russian Federation. 2020;3:32–42. (In Russ.) EDN: BQRFXJ</mixed-citation><mixed-citation xml:lang="ru">Лейфер Л.А., Чёрная Е.В. Массовая оценка объектов недвижимости на основе технологий машинного обучения. Анализ точности различных методов на примере определения рыночной стоимости квартир // Имущественные отношения в Российской Федерации. 2020. №. 3 (222). С. 32-42. EDN: BQRFXJ</mixed-citation></citation-alternatives></ref><ref id="B3"><label>3.</label><citation-alternatives><mixed-citation xml:lang="en">Kok N, Koponen E-L, Martinez-Barbosa CA. Big Data in Real Estate From Manual Appraisal to Automated Valuation». The Journal of Portfolio Management. 2017; 43(6):202–211. https://doi.org/10.3905/jpm.2017.43.6.202</mixed-citation><mixed-citation xml:lang="ru">Kok N., Koponen E.-L., Martinez-Barbosa C.A. (2017). Big Data in Real Estate From Manual Appraisal to Automated Valuation» // The Journal of Portfolio Management. 2017. Vol. 43. No. 6. P. 202-211. https://doi.org/10.3905/jpm.2017.43.6.202</mixed-citation></citation-alternatives></ref><ref id="B4"><label>4.</label><citation-alternatives><mixed-citation xml:lang="en">Yasnitskiy VL. Using a neural network to solve the problem of mass real estate appraisal of city Perm. Fundamental Research. 2015;10–3:650–653. (In Russ.) EDN: UNXWSX</mixed-citation><mixed-citation xml:lang="ru">Ясницкий В.Л. Нейросетевое моделирование в задаче массовой оценки жилой недвижимости города Перми // Фундаментальные исследования. 2015. № 10-3. С. 650-653. EDN: UNXWSX</mixed-citation></citation-alternatives></ref><ref id="B5"><label>5.</label><citation-alternatives><mixed-citation xml:lang="en">Surkov FA, Petkova NV, Sukhovskiy SF. Neural network data analysis methods in real estate valuation. News of universities. North Caucasus region. Technical science. 2016;3:38–45. (In Russ.) https://doi.org/10.17213/0321-2653-2016-3-38-45</mixed-citation><mixed-citation xml:lang="ru">Сурков Ф.А., Петкова Н.В., Суховский С.Ф. Нейросетевые методы анализа данных в оценке недвижимости» // Известия вузов. Северо-Кавказский регион. Технические науки. 2016. № 3. C. 38-45. https://doi.org/10.17213/0321-2653-2016-3-38-45</mixed-citation></citation-alternatives></ref><ref id="B6"><label>6.</label><citation-alternatives><mixed-citation xml:lang="en">Arefieva E.A, Kostyaev D S. Using neural NETWORKS for evaluation of market cost of real estate. News of the Tula State University. Technical science. 2017; 10:177–184. (In Russ.) EDN: ZVLGJH</mixed-citation><mixed-citation xml:lang="ru">Арефьева Е.А., Костяев Д.С. Использование нейронных сетей для оценки рыночной стоимости недвижимости // Известия Тульского государственного университета. Технические науки. 2017. № 10. С. 177-184. EDN: ZVLGJH</mixed-citation></citation-alternatives></ref><ref id="B7"><label>7.</label><citation-alternatives><mixed-citation xml:lang="en">Vykhodtsev NA. Artificial intelligence in price estimation of real estate. Proceedings of the TUSUR University. 2021;24(1):68–72. (In Russ.) https://doi.org/10.21293/1818-0442-2021-24-1-68-72</mixed-citation><mixed-citation xml:lang="ru">7. Выходцев Н.А. Использование искусственного интеллекта для оценки стоимости недвижимого имущества // Доклады Томского государственного университета систем управления и радиоэлектроники. 2021. Т. 24. № 1. С. 68-72. https://doi.org/10.21293/1818-04422021-24-1-68-72</mixed-citation></citation-alternatives></ref><ref id="B8"><label>8.</label><citation-alternatives><mixed-citation xml:lang="en">Arzamastsev SA, Bgatov MV, Kartysheva EN, Derkunsky VA, Semenchikov DN. Predicting subscriber churn: comparison of machine learning methods. Computer tools in education. 2018;5:5–23. (In Russ.) https://doi.org/10.32603/2071-2340-2018-5-5-23</mixed-citation><mixed-citation xml:lang="ru">Арзамасцев С.А., Бгатов М.В., Картышева Е.Н., Деркунский В.А., Семенчиков Д.Н. Предсказание оттока абонентов: сравнение методов машинного обучения // Компьютерные инструменты в образовании. 2018. № 5. С. 5-23. https://doi.org/10.32603/2071-2340-20185-5-23</mixed-citation></citation-alternatives></ref><ref id="B9"><label>9.</label><citation-alternatives><mixed-citation xml:lang="en">9. Radchuk MA, Kopytina EA. Development of a software tool for predicting customer churn using machine learning methods. Collection of student scientific works of the Faculty of Computer Science of VSU. 2019. p. 190–196. (In Russ.) EDN: PSWAXM</mixed-citation><mixed-citation xml:lang="ru">Радчук М. А., Копытина Е.А. Разработка программного средства для предсказания оттока клиентов с помощью методов машинного обучения // Сборник студенческих научных работ факультета компьютерных наук ВГУ. 2019. С. 190-196. EDN: PSWAXM</mixed-citation></citation-alternatives></ref><ref id="B10"><label>10.</label><citation-alternatives><mixed-citation xml:lang="en">Lalwani P, Mishra MK, Chadha JS, Sethi P. Customer churn prediction system: a machine learning approach. Computing. 2022;104(2):271–294. https://doi.org/10.1007/s00607-021-00908-y</mixed-citation><mixed-citation xml:lang="ru">Lalwani P., Mishra M.K., Chadha J.S., Sethi P. Customer churn prediction system: a machine learning approach // Computing. 2022. Vol. 104. No. 2. P. 271-294. https://doi.org/10.1007/s00607-021-00908-y</mixed-citation></citation-alternatives></ref><ref id="B11"><label>11.</label><citation-alternatives><mixed-citation xml:lang="en">Khodabandehlou S, Zivari Rahman M. Comparison of supervised machine learning techniques for customer churn prediction based on analysis of customer behavior. Journal of Systems and Information Technology. 2017;19(1/2):65–93. https://doi.org/10.1108/JSIT-102016-0061</mixed-citation><mixed-citation xml:lang="ru">Khodabandehlou S., Zivari Rahman M. Comparison of supervised machine learning techniques for customer churn prediction based on analysis of customer behavior // Journal of Systems and Information Technology. 2017. Vol. 19. Iss. 1/2. P. 65-93. https://doi.org/10.1108/JSIT-10-2016-0061</mixed-citation></citation-alternatives></ref><ref id="B12"><label>12.</label><citation-alternatives><mixed-citation xml:lang="en">Andrianova EG, Novikova OA. The role of text mining methods in automating stock market forecasting. Cloud of science. 2018;5(1):196–211. (In Russ.) EDN: YUTIIN</mixed-citation><mixed-citation xml:lang="ru">Андрианова Е.Г., Новикова О.А. Роль методов интеллектуального анализа текста в автоматизации прогнозирования рынка ценных бумаг // Cloud of science. 2018. Т. 5. № 1. С. 196-211. EDN: YUTIIN</mixed-citation></citation-alternatives></ref><ref id="B13"><label>13.</label><citation-alternatives><mixed-citation xml:lang="en">Kovalenko IA. Use of artificial intelligence in the exchange and over-the-counter securities markets. Bulletin of Science. 2023;3(6):75–80. (In Russ.) Available from: https://www.xn----8sbempclcwd3bmt.xn--p1ai/article/ 8956 (accessed: 30.03.2023).</mixed-citation><mixed-citation xml:lang="ru">Коваленко И.А. Использование искусственного интеллекта на биржевом и внебиржевом рынке ценных бумаг // Вестник науки. 2023. Т. 3. № 6 (63). С. 75-80. URL: https://www.xn----8sbempclcwd3bmt.xn-p1ai/article/8956 (дата обращения: 28.02.2023).</mixed-citation></citation-alternatives></ref><ref id="B14"><label>14.</label><citation-alternatives><mixed-citation xml:lang="en">Henrique BM, Sobreiro VA, Kimura H. Literature review: Machine learning techniques applied to financial market prediction. Expert Systems with Applications. 2019; 124:226–251. https://doi.org/10.1016/j.eswa.2019.01.012</mixed-citation><mixed-citation xml:lang="ru">Henrique B.M., Sobreiro V.A., Kimura H. Literature review: Machine learning techniques applied to financial market prediction // Expert Systems with Applications. 2019. Vol. 124. P. 226-251. https://doi.org/10.1016/j.eswa.2019.01.012</mixed-citation></citation-alternatives></ref><ref id="B15"><label>15.</label><citation-alternatives><mixed-citation xml:lang="en">Kumbure MM, Lohrmann C, Luukka P, Porras J. Machine learning techniques and data for stock market forecasting: A literature review. Expert Systems with Applications. 2022;197:116659.</mixed-citation><mixed-citation xml:lang="ru">Kumbure M.M., Lohrmann C., Luukka P., Porras J. Machine learning techniques and data for stock market forecasting: A literature review // Expert Systems with Applications. 2022. Vol. 197. https://doi.org/10.1016/j.eswa.2022.116659</mixed-citation></citation-alternatives></ref><ref id="B16"><label>16.</label><citation-alternatives><mixed-citation xml:lang="en">Mahesh B. Machine learning algorithms-a review. International Journal of Science and Research. 2020; 9(1):381–386. https://doi.org/10.21275/ART20203995</mixed-citation><mixed-citation xml:lang="ru">Mahesh B. Machine learning algorithms-a review // International Journal of Science and Research. 2020. Vol. 9. Iss. 1. P. 381-386. https://doi.org/10.21275/ART 20203995</mixed-citation></citation-alternatives></ref><ref id="B17"><label>17.</label><citation-alternatives><mixed-citation xml:lang="en">Salnikov VA, Mikheeva OM. Models for forecasting prices on the Moscow residential real estate market. Problems of forecasting. 2018;1(166):129–139. (In Russ.) EDN: YLXJZZ</mixed-citation><mixed-citation xml:lang="ru">Сальников В.А., Михеева О.М. Модели прогнозирования цен на московском рынке жилой недвижимости // Проблемы прогнозирования. 2018. № 1 (166). С. 129-139. EDN: YLXJZZ</mixed-citation></citation-alternatives></ref><ref id="B18"><label>18.</label><citation-alternatives><mixed-citation xml:lang="en">Sternik GM, Pechenkina AV. Forecast of supply prices for apartments on the Moscow housing market (macroeconomic approach). Property relations in the Russian Federation. 2007;10:11–18. (In Russ.) EDN: JXADIB</mixed-citation><mixed-citation xml:lang="ru">Cтерник Г.М., Печенкина А.В. Прогноз цен предложения квартир на московском рынке жилья (макроэкономический подход) // Имущественные отношения в Российской Федерации. 2007. № 10. С. 11-18. EDN: JXADIB</mixed-citation></citation-alternatives></ref><ref id="B19"><label>19.</label><citation-alternatives><mixed-citation xml:lang="en">Nazarov A. Regression analysis in DataScience. Simple linear regression. statsmodels library. Habr. 2022. (In Russ.) Available from: https://habr.com/ru/articles690414/ (accessed: 30.03.2023).</mixed-citation><mixed-citation xml:lang="ru">Назаров А. Регрессионный анализ в Data Science. Простая линейная регрессия. Библиотека statsmodels // Хабр. 2022. URL: https://habr.com/ru/articles/690414/ (дата обращения: 30.03.2023).</mixed-citation></citation-alternatives></ref><ref id="B20"><label>20.</label><citation-alternatives><mixed-citation xml:lang="en">Dronov V. Linear regression using Scikit-Learn in Python. Learning Python. 2021. (In Russ.) Available from: https://tonais.ru/library/lineynaya-regressiya-s-pomo schyu-scikit-learn-v-python (accessed: 05.04.2023).</mixed-citation><mixed-citation xml:lang="ru">Дронов В. Линейная регрессия с помощью Scikit-Learn в Python // Обучение Python. 2021. URL: https://tonais.ru/library/lineynaya-regressiya-s-pomoschyu-scikit-learn-v-python (дата обращения: 05.04.2023).</mixed-citation></citation-alternatives></ref><ref id="B21"><label>21.</label><citation-alternatives><mixed-citation xml:lang="en">Aylin А. Normalization vs. standardization in linear regression. Machine learning. 2023. Available from: https://www.baeldung.com/cs/normalization-vs-standardization (accessed: 15.04.2023).</mixed-citation><mixed-citation xml:lang="ru">Айлин А. Нормализация против стандартизации в линейной регрессии // Машинное обучение. 2023. URL: https://www.baeldung.com/cs/normalizationvs-standardization (дата обращения: 15.04.2023).</mixed-citation></citation-alternatives></ref></ref-list></back></article>
