<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">Discrete and Continuous Models and Applied Computational Science</journal-id><journal-title-group><journal-title xml:lang="en">Discrete and Continuous Models and Applied Computational Science</journal-title><trans-title-group xml:lang="ru"><trans-title>Discrete and Continuous Models and Applied Computational Science</trans-title></trans-title-group></journal-title-group><issn publication-format="print">2658-4670</issn><issn publication-format="electronic">2658-7149</issn><publisher><publisher-name xml:lang="en">Peoples' Friendship University of Russia named after Patrice Lumumba (RUDN University)</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="publisher-id">8272</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>Articles</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Статьи</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">The Problem of Data Placement in Distributed Systems</article-title><trans-title-group xml:lang="ru"><trans-title>Задача оптимизации размещения данных в распределённых системах</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Zhipa</surname><given-names>A V</given-names></name><name xml:lang="ru"><surname>Жипа</surname><given-names>А В</given-names></name></name-alternatives><bio xml:lang="en">Department of Information Technology</bio><bio xml:lang="ru">Кафедра информационных технологий</bio><email>-</email><xref ref-type="aff" rid="aff1"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">Peoples’ Friendship University of Russia</institution></aff><aff><institution xml:lang="ru">Российский университет дружбы народов</institution></aff></aff-alternatives><pub-date date-type="pub" iso-8601-date="2015-02-15" publication-format="electronic"><day>15</day><month>02</month><year>2015</year></pub-date><issue>2</issue><issue-title xml:lang="en">NO2 (2015)</issue-title><issue-title xml:lang="ru">№2 (2015)</issue-title><fpage>46</fpage><lpage>54</lpage><history><date date-type="received" iso-8601-date="2016-09-08"><day>08</day><month>09</month><year>2016</year></date></history><permissions><copyright-statement xml:lang="ru">Copyright ©; 2015, Жипа А.В.</copyright-statement><copyright-year>2015</copyright-year><copyright-holder xml:lang="ru">Жипа А.В.</copyright-holder><ali:free_to_read xmlns:ali="http://www.niso.org/schemas/ali/1.0/"/><license><ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">http://creativecommons.org/licenses/by/4.0</ali:license_ref></license></permissions><self-uri xlink:href="https://journals.rudn.ru/miph/article/view/8272">https://journals.rudn.ru/miph/article/view/8272</self-uri><abstract xml:lang="en">Distributed system eﬀectiveness depends dramatically on the way it manages incoming tasks and data against limited computational resources that are at its disposal. Due to ever-inreasing amount of incoming data distributed systems are required to eﬃciently manage the way its storage and processing are being made. Nowadays the distributed system design is signiﬁcantly ﬂounced by the manner it leverages high load scenarios, provides data storage functionality and uses the underlying resources. An eﬀective distributed system’s resource management has to balance trade-oﬀs between single node resource consumption and the overall loss of data locality, that is inevitable due to data fragmentation. In this article we will formalize the problem of data placement by maximizing data storage locality in distributed data systems, which as it turns out is a NP-complete task. We will later describe a polynomial-time algorithm that is capable of providing us a solution that is within an additive constant from the optimal one.</abstract><trans-abstract xml:lang="ru">Эффективность работы распределённых вычислительных систем основывается на способе распределения потоков вычислительных задач и данных относительно ограниченного количества вычислительных ресурсов. Из-за постоянного увеличения объёма данных таким системам необходимо решать вопрос их хранения и обработки наиболее эффективным образом. Между тем современные распределённые вычислительные системы уделяют все больше внимания таким своим характеристикам, как распределение вычислительной нагрузки, построение эффективной структуры хранилища данных, а также оптимальное использование вычислительных мощностей. Оптимальное управление имеющимися у вычислительной системы ресурсами вынуждено балансировать между использованием ресурсов каждого отдельно взятого узла и потерей локальности хранения данных, связанной с их неизбежной фрагментацией. В данной статье мы сформируем задачу оптимизации размещения данных путём максимизации локальности их хранения, а также покажем, что данная задача является NP-полной. Далее мы рассмотрим полиномиальный по времени алгоритм, дающий результат, отличающийся от оптимального на фиксированную константу. Для доказательства эффективности предложенного алгоритма нами будет доказан ряд вспомогательных утверждений, а также подробно описана основная операция в работе алгоритма, за свою схожесть с процессом обмена участками хромосом в клетках названная кроссинговером.</trans-abstract><kwd-group xml:lang="en"><kwd>fragmentation</kwd><kwd>distributed systems</kwd><kwd>NP-complete problems</kwd><kwd>bin-packing problems</kwd><kwd>data storage locality</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>фрагментация</kwd><kwd>распределённые вычислительные системы</kwd><kwd>NP-полные задачи</kwd><kwd>задача об упаковке в контейнеры</kwd><kwd>локальность хранения данных</kwd></kwd-group></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><mixed-citation>Oceanstore: An Architecture for Global-Scale Persistent Storage / J. Kubiatowicz, D. Bindel, Y. Chen et al. // ASPLOS-IX / ASPLOS. - New York, USA: ACM, 2000. - Pp. 190-201.</mixed-citation></ref><ref id="B2"><label>2.</label><mixed-citation>Wide-Area Cooperative Storage with CFS / F. Dabek, M. Kaashoek, D. Karger et al. // SOSP. - 2001. - Pp. 202-215.</mixed-citation></ref><ref id="B3"><label>3.</label><mixed-citation>Rowstron A., Druschel P. Storage Management and Caching in PAST, A Largescale, Persistent Peer-to-peer Storage Utility // SOSP. - 2001. - Pp. 188-201.</mixed-citation></ref><ref id="B4"><label>4.</label><mixed-citation>Ivy: A Read/Write Peer-to-Peer File System / A. Muthitacharoen, R. Morris, T. M. Gil, B. Chen // SOSDI / Ed. by D. E. Culler, P. Druschel. - USENIX Association, 2002.</mixed-citation></ref><ref id="B5"><label>5.</label><mixed-citation>Coffman E.G.J., Garey M.R., Johnson D.S. Approximation Algorithms for NP-hard Problems. - Boston, USA: PWS Publications, 1996. - Pp. 46-96.</mixed-citation></ref><ref id="B6"><label>6.</label><mixed-citation>Coffman E.G.J., Lueker G. Approximation Algorithms for Extensible Bin-Packing // Journal of Scheduling. - Vol. 9. - Hingham, MA, USA: Kluwer Academic Publishers, 2006. - Pp. 63-69.</mixed-citation></ref><ref id="B7"><label>7.</label><mixed-citation>Perfect Packing Theorems and the Average-Case Behavior of Optimal and Online Bin Packing / E. G. J. Coffman, C. Courcoubetis, M. R. Garey et al. // J. Discrete Math. - 2000. - Vol. 13, No 3. - Pp. 384-402.</mixed-citation></ref><ref id="B8"><label>8.</label><mixed-citation>Seiden S.S. On the Online Bin Packing Problem // Journal of the ACM. - 2002. - Vol. 49, No 5. - Pp. 640-671.</mixed-citation></ref><ref id="B9"><label>9.</label><mixed-citation>Karp R.M. Reducibility Among Combinatorial Problems // SOSP. - The IBM Research Symposia Series. - Plenum Press, New York, 1972. - Pp. 85-103.</mixed-citation></ref><ref id="B10"><label>10.</label><mixed-citation>Garey M.R., Johnson D.S. Complexity Results for Multiprocessor Scheduling under Resource Constraints // SIAM Journal on Computing. - 1975. - Vol. 4, No 4. - Pp. 397-411.</mixed-citation></ref></ref-list></back></article>
