Построение реляционной модели данных о жителях Российской империи по оцифрованным документам российских переписей
- Авторы: Брилёва Н.Е.1, Панкратов А.С.1
-
Учреждения:
- Российский университет дружбы народов
- Выпуск: № 2 (2012)
- Страницы: 104-115
- Раздел: Статьи
- URL: https://journals.rudn.ru/miph/article/view/8664
Цитировать
Полный текст
Аннотация
Описывается технология построения базы данных, содержащей материалы переписей населения Российской империи, на примере ревизских сказок XVIII-XIX веков. База данных строится на основе оцифровки архивных материалов переписей, сделанной в формате Excel. Описывается алгоритм распознавания смысловых конструкций записей в переписных документах, выделения атрибутов и правила заполнения реляционных таблиц. Алгоритм приводится для конкретных переписей (4 и 5 ревизий), однако подобные алгоритмы могут быть разработаны и для других ревизий, что позволит выстроить непрерывную цепочку исторических переписных ведомостей, переведенную в единый формат базы данных. Наличие такой цепочки может оказать существенную помощь в генеалогических исследованиях.
Ключевые слова
Об авторах
Наталья Евгеньевна Брилёва
Российский университет дружбы народовКафедра информационных технологий; Российский университет дружбы народов
Александр Серафимович Панкратов
Российский университет дружбы народов
Email: sasha.pankratov@gmail.com
Кафедра информационных технологий; Российский университет дружбы народов
Список литературы
- Гарсиа-Молина Г., Ульман Д., Уидом Д. Системы баз данных. Полный курс. - М.: Издательский дом «Вильямс», 2003. - 1088 с. [Garsia-Molina G., Uljman D., Uidom D. Sistemih baz dannihkh. Polnihyj kurs. - M.: Izdateljskiyj dom «Viljyams», 2003. - 1088 s. ]
- Гринев М. Системы управления полуструктурированными данными // Открытые системы. - 1999. - Т. 5-6. [Grinev M. Sistemih upravleniya polustrukturirovannihmi dannihmi // Otkrihtihe sistemih. - 1999. - T. 5-6. ]
- Горелов С.С. Эффективные модели поиска в базах полуструктурированных данных на основе иерархии схем документов. Диссертация на соискание степени кандидата физико-математических наук. - М., 2009. [Gorelov S.S. Ehffektivnihe modeli poiska v bazakh polustrukturirovannihkh dannihkh na osnoveierarkhii skhem dokumentov. Dissertaciya na soiskanie stepeni kandidata fizikomatematicheskikh nauk. - M., 2009. ]
- ОБД Мемориал. - http://www.obd-memorial.ru. [OBD Memorial. - http:// www.obd-memorial.ru.]
- All Russia Family Tree. Российская генеалогия. - http://www.vgd.ru. [All Russia Family Tree. Rossiyjskaya genealogiya. - http://www.vgd.ru.]
- АОТ. - http://www.aot.ru. [AOT. - http://www.aot.ru.]
- Брилева Н.Е. Генерация родословных линий на базе оцифровки архивных документов переписи населения // Фестиваль науки в РУДН: Сборник работ студентов-победителей международных, всероссийских конкурсов, конференций, олимпиад. - РУДН, 2010. - С. 118-124. [Brileva N.E. Generaciya rodoslovnihkh liniyj na baze ocifrovki arkhivnihkh dokumentov perepisi naseleniya // Festivalj nauki v RUDN: Sbornik rabot studentov-pobediteleyj mezhdunarodnihkh, vserossiyjskikh konkursov, konferenciyj, olimpiad. - RUDN, 2010. - S. 118-124. ]