Задача оптимизации размещения данных в распределённых системах

Обложка

Цитировать

Полный текст

Аннотация

Эффективность работы распределённых вычислительных систем основывается на способе распределения потоков вычислительных задач и данных относительно ограниченного количества вычислительных ресурсов. Из-за постоянного увеличения объёма данных таким системам необходимо решать вопрос их хранения и обработки наиболее эффективным образом. Между тем современные распределённые вычислительные системы уделяют все больше внимания таким своим характеристикам, как распределение вычислительной нагрузки, построение эффективной структуры хранилища данных, а также оптимальное использование вычислительных мощностей. Оптимальное управление имеющимися у вычислительной системы ресурсами вынуждено балансировать между использованием ресурсов каждого отдельно взятого узла и потерей локальности хранения данных, связанной с их неизбежной фрагментацией. В данной статье мы сформируем задачу оптимизации размещения данных путём максимизации локальности их хранения, а также покажем, что данная задача является NP-полной. Далее мы рассмотрим полиномиальный по времени алгоритм, дающий результат, отличающийся от оптимального на фиксированную константу. Для доказательства эффективности предложенного алгоритма нами будет доказан ряд вспомогательных утверждений, а также подробно описана основная операция в работе алгоритма, за свою схожесть с процессом обмена участками хромосом в клетках названная кроссинговером.

Об авторах

А В Жипа

Российский университет дружбы народов

Кафедра информационных технологий

Список литературы

  1. Oceanstore: An Architecture for Global-Scale Persistent Storage / J. Kubiatowicz, D. Bindel, Y. Chen et al. // ASPLOS-IX / ASPLOS. - New York, USA: ACM, 2000. - Pp. 190-201.
  2. Wide-Area Cooperative Storage with CFS / F. Dabek, M. Kaashoek, D. Karger et al. // SOSP. - 2001. - Pp. 202-215.
  3. Rowstron A., Druschel P. Storage Management and Caching in PAST, A Largescale, Persistent Peer-to-peer Storage Utility // SOSP. - 2001. - Pp. 188-201.
  4. Ivy: A Read/Write Peer-to-Peer File System / A. Muthitacharoen, R. Morris, T. M. Gil, B. Chen // SOSDI / Ed. by D. E. Culler, P. Druschel. - USENIX Association, 2002.
  5. Coffman E.G.J., Garey M.R., Johnson D.S. Approximation Algorithms for NP-hard Problems. - Boston, USA: PWS Publications, 1996. - Pp. 46-96.
  6. Coffman E.G.J., Lueker G. Approximation Algorithms for Extensible Bin-Packing // Journal of Scheduling. - Vol. 9. - Hingham, MA, USA: Kluwer Academic Publishers, 2006. - Pp. 63-69.
  7. Perfect Packing Theorems and the Average-Case Behavior of Optimal and Online Bin Packing / E. G. J. Coffman, C. Courcoubetis, M. R. Garey et al. // J. Discrete Math. - 2000. - Vol. 13, No 3. - Pp. 384-402.
  8. Seiden S.S. On the Online Bin Packing Problem // Journal of the ACM. - 2002. - Vol. 49, No 5. - Pp. 640-671.
  9. Karp R.M. Reducibility Among Combinatorial Problems // SOSP. - The IBM Research Symposia Series. - Plenum Press, New York, 1972. - Pp. 85-103.
  10. Garey M.R., Johnson D.S. Complexity Results for Multiprocessor Scheduling under Resource Constraints // SIAM Journal on Computing. - 1975. - Vol. 4, No 4. - Pp. 397-411.

© Жипа А.В., 2015

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах