К методам и задачам цифровой индологии

Обложка

Цитировать

Полный текст

Аннотация

В статье описываются состояние дел и перспективы исследований и разработок в области активного применения в ближайшем будущем цифровых инструментов и программ в исследовании индийской интеллектуальной традиции. Термин “Цифровая индология” мы используем по аналогии с выражением “Цифровая гуманитария” (Digital Humanities). В данном случае он будет пониматься как изучение и освоение философских и иных мировоззренческих текстов Древней и Средневековой Индии с использованием цифровых технологий, математической статистики, методов контекстного анализа вместе с привычными, устоявшимися подходами философии и гуманитарных наук. Излагаются основные тенденции развития цифровой философской индологии (формирование единой компьютерной базы данных индийских классических текстов, разработка специальных программ, позволяющих ставить и решать новые исторические и содержательные задачи при изучении различных текстов различных групп и т.д.). В качестве типичных вспомогательных методов анализа классических текстов Индии предлагается применение математической статистики и метод контекстного анализа. Мы не закрываем глаза на возможные скрытые опасности возможного увлечения цифровизацией (крен в социологию, математизация результатов, минимализация философской интерпретации). Цифровую индологию мы в нашем кратком манифесте считаем лишь полезным подспорьем в классических индологических исследованиях, у которых свои собственные историко-философские задачи и цели.

Полный текст

Оцифровка и компьютерная обработка данных достаточно давно применяются в целом ряде областей гуманитарных наук в качестве полезных прикладных методов (ср. [1, 2]). К примеру, в распоряжении латинистов и эллинистов уже много лет имеются весьма полные базы латинских и древнегреческих текстов с развитыми возможностями поиска данных, портал Perseus Digital Library[1] и др. ресурсы; исследователям христианской традиции доступны оцифрованные и распознанные базы Patrologia Latina[2] и Patrologia Graeca, при этом печатный прообраз обеих составляет в сумме около 400 томов. Значительны также успехи в оцифровке дальневосточной классики. Но, к сожалению, в сфере индологических штудий, в обработке и изучении текстов на классических языках Индии (ведийский, санскрит и гибридный санскрит, пали, старотамильский, а также переводы на тибетский с санскрита и гибридного санскрита буддийских текстов, не сохранившихся в подлинниках) они представлены гораздо скромнее, наблюдается огромное отставание от названных выше удачных образцов. Достаточно сказать, что до сих пор нет электронной версии ведийского корпуса текстов. Не представлены в должном виде, а именно с акцентуацией, даже самхиты (основные своды ритуальных текстов). Не все ведийские брахманы (обширные прозаические комментарии к ритуальным сборникам, самхитам) оцифрованы. Большие и ценные, но пока существенно неполные собрания (ср. ведийский раздел на сайте GRETIL — Göttingen Register of Electronic Texts in Indian Languages[3]) не оформлены как база текстов с теми возможностями поиска, каковыми более двух десятков лет располагают латинисты и патрологи (см. выше). Иногда ценный сетевой ресурс ограничивает к себе доступ в силу посторонних для науки соображений (TITUS — Thesaurus Indogermanischer Text- und Sprachmaterialien[4]). Оцифрованные ведийские гимны должны сопровождаться их авторитетной рецитацией, в целом, как признано, сохранившей произношение на протяжении трех тысяч лет, чего пока не сделано. Для сравнения: многоязычные (подлинник с параллельными важнейшими классическими переводами) версии Библии давно существуют в виде CD-ROM, а в исламоведении в оцифрованном виде доступны не только Коран с синхронизированным устным исполнением и демонстрацией письменного текста, но и немало тафсиров (коранических комментариев). Такое досадное для классической индологии, как в филологической, так и историко-философской области, положение дел объясняется, вероятно, и последствиями колониального английского владычества, из-за чего европейски-британское и традиционное индийское брахманское образования в значительной мере разобщены, и тем, что в самой Индии большинство профессионалов в области санскрита, брахманистской философии, индуизма (но не буддизма и не буддийской философии!) и др. получают образование по старинному образцу, становятся пандитами (традиционными учеными), которые очень многое выучивают наизусть и привычно полагаются прежде всего на свою память. И это несмотря на широкую и заслуженную известность индийских IT-специалистов и даже на несмотря на то, что классическая индийская рациональность, представленная, к примеру, вьякараной (самобытной лингвистикой), выраженно тяготеет не к теоретическому, но к инженерному и программистскому мышлению в области знаковых объектов.

Предпринимаемые начинания в области оцифровки индийского наследия регулярно не завершаются. Так, не была закончена компьютерная версия основополагающей порождающей грамматики санскрита, Aṣṭādhyāyī (“Восьмикнижия”) Панини5. В имеющемся варианте ее отсутствует подпрограмма порождения глагольных словоформ от корней. Многообещающее собрание санскритских текстов, ранее вывешенное на сайте Национального санскритского университета в Тирупати, Индия6 уже много лет недоступно.

К счастью, особенности индийской словесности не только требуют оцифровки и работе с нею статистическими методами, но и предрасполагают к ней. Традиционные индийские нарративные и религиозные тексты изобилуют стереотипными сравнениями, а рациональные (шастры) — скрытыми цитатами и аллюзиями, а также как правило слепыми для европейского ученого отсылками типа «некоторые считают» или «имеется мнение» (ср. [3]). Очень многое из подобных фрагментов материала могло бы быть постепенно прояснено путем создания текстовых корпусов и подкорпусов и постепенным наполнением их гиперссылками на основе результатов умело организованного поиска. Весьма частичные, но тем не менее полезные результаты в данном направлении в последние десятилетия были получены в основном японскими индологами и буддологами, однако типичность подобных задач делает актуальной именно создание текстовых баз данных и развитых поисковых (запросных) инструментов работы с ними. В идеале (в перспективе) такой инструмент будет полезен не только для ответов на вопросы, возникающие при обычной научной работе с традиционными сочинениями, но и для постановки новых вопросов, как относящихся к имманентному содержанию, к существу проблем, которые затрагиваются в текстах, так и связанных с их внешней историей, а также этапами постепенного разрастания текстов некоторых жанров (к примеру, эпоса, пуранической литературы, дхармашастр, махаянских сутр и др.), появления в них вставок и интерполяций (ср. [4]).

В буддологии положение дел ощутимо лучше, в частности потому, что традиционная ученость в этой области связана с иными странами Азии, в частности, с Японией и Китаем, а также в силу большого интереса к буддийскому идейному наследию в странах западной культуры и закреплению в них буддизма как религии. К примеру, в оцифрованном виде общедоступен свод буддийской литературы на языке пали[7], полностью включающий в себя канонические тексты и комментарии на основе текста, утвержденного решением Шестого буддийского собора. Также успешно пополняются собрания оцифрованных махаянских текстов, в том числе с параллельными переводами на тибетский и китайский языки. Однако этим проектам недостает координации, они нередко связаны не с научными, а прежде всего с конфессиональными запросами[8]. Более общая их недоработка — разобщение в таких инициативах буддийского и небуддийского текстового наследия, что подобно неправильной, хотя и давно устоявшейся практике в истории западной философии II—VII вв., где в исследованиях и учебных курсах обычно разделяют языческую и раннехристианскую ветви философии, в действительности находившиеся в ситуации постоянной полемики.

Несомненно также, что литературное и философское наследие различных конкретных направлений индуизма (шиваитские агамы, вишнуитская панчаратра) не менее чем философская литература и эпос изобилуют формулами, скрытыми цитатами и т. п. чертами не вполне авторской, в новоевропейском смысле, словесности, и что поддается обнаружению и исследованию в историко-философских целях прежде всего с опорой на цифровизацию, работу с базами данных и статистику.

Видный европейский индолог Й. Бронкхорст отмечает [5], что европейским ученым при всем желании не сравняться в подготовке с индийскими пандитами в том, что касается начитанности в литературе той или иной философской школы, однако европейцы задаются вопросами об историческом развитии, о ранних этапах существования даршан. Но как раз опора на приспособленные к запросам и созданию гиперссылок базы данных позволила бы обойти это ограничение западного ученого и успешно ставить и решать историко-литературные и историко-философские задачи.

Предварительные, служебные задачи цифровизации в нашей области заключаются, помимо создания и пополнения единой текстовой базы с возможностями сквозного поиска, в написании компьютерной программы, прежде работающей с санскритскими сочинениями и, в значительно меньшем масштабе, с палийскими и старотамильскими, в силу того что эти последние на фоне санскрита не представят сложностей для обработки. Назначение такой программы следующее. Потребуется: а) восстанавливать паузальные формы слов из контекстных, обусловленных правилами сандхи. Это сама по себе не слишком объемная задача, предполагающая перевод в компьютерную форму нескольких десятков правил из классической грамматики Панини; б) написание подпрограммы (процедуры) парсера, которая бы разбивала многокомпонентные композиты (синтаксические сложные слова, весьма характерные для позднего санскрита) и в) программа должна будет сопоставлять многочисленным словоформам в именах (падежные формы существительных в трех числах, а в случае прилагательных и местоимений еще и в трех родах) и чрезвычайно многочисленным в глаголах (десять видовременных форм, причастия и пр., всего более тысячи форм) словоформам одну из них, принимаемую за исходную. Без этого поиск терминов и вокабул оказывается неэффективным, иной раз на грани возможности. Вполне можно ожидать, что решение данной задачи окажется чем-то новым и нерутинным для программистов, работающих в области компьютерной лингвистики и обработки текстов.

В заключение опишем для примера одну из возможных содержательных задач, работа над которой в некоторой степени подготовлена. Корпус канонической текстов на языке пали (Типитака) уже надежно оцифрован (см. выше). Внимательное изучение этого массива литературы школы тхеравада позволяет выдвинуть гипотезу, что древние составители, в сущности, во многом предвосхитили современную идею гипертекста. Четыре из пяти так называемых «сводов» Никая), составляющие «Корзину сутт», и отдельные группы текстов в составе пятого свода могут пониматься как в большой степени пересекающиеся по содержанию, но организованные и предназначенные для разного типа запросов базы данных по буддийскому учению. Из этого для классической индологии и буддологии следует сильный вывод, что так сохраняемое содержание не дает адекватной возможности представить себя в виде линейно разворачивающейся теории. В пользу такого вывода свидетельствует весьма большой разброс взглядов и трактовок в области буддологии, поскольку специалисты всегда полагаются на некоторую прочитанную ими совокупность текстов и строят далее свои концепции, которые не подтверждаются при начитанности в иных группах. Компьютерная эмуляция человеческой памяти буддийских монахов, в которой традиционно хранились тексты, позволит поднять эту область буддологии на новый уровень доказательности.

Примером другой содержательной задачи, работа над которой также в значительной мере подготовлена, могут служить вопросы аутентичности разного рода текстов, приписываемых одному и тому же автору. В этом случае результаты текстологического анализа с использованием цифровых методов (в частности, методы математической статистики и контекстного анализа) могли бы стать решающими в вопросе определения авторства того или иного текста. Данный вопрос неоднократно поднимался Р.В. Псху на индологических конференциях [6–9].

 

1 http://www.perseus.tufts.edu

2 Оцифрованная версия с достаточными возможностями поиска была создана в Ватикане уже для Windows 3.1

3 http://gretil.sub.uni-goettingen.de

4 http://titus.uni-frankfurt.de

5 http://www.taralabalu.org/panini/

6 https://nsktu.ac.in/

7 https://tipitaka.org

8 В частности, https://tipitaka.org

×

Об авторах

Пурушоттама Билимория

Российский университет дружбы народов

Email: p.bilimoria@unimelb.edu.au
ORCID iD: 0000-0002-0755-0983

PhD (философия), ведущий ученый Центра исследования философии и культуры Индии «Пурушоттама»

Российская Федерация, 117198, Москва, ул. Миклухо-Маклая, д. 6

Андрей Всеволодович Парибок

Российский университет дружбы народов

Email: watanparast@mail.ru
ORCID iD: 0000-0002-0100-4412

кандидат филологических наук, старший научный сострудник Центра исследования философии и культуры Индии «Пурушоттама»

Российская Федерация, 117198, Москва, ул. Миклухо-Маклая, д. 6

Рузана Владимировна Псху

Российский университет дружбы народов

Автор, ответственный за переписку.
Email: r.pskhu@mail.ru
ORCID iD: 0000-0002-5558-6518

доктор философских наук, доцент; профессор кафедры истории философии, главный научный сострудник Центра исследования философии и культуры Индии «Пурушоттама»

Российская Федерация, 117198, Москва, ул. Миклухо-Маклая, д. 6

Список литературы

  1. Кодоньо М. Математика за чашечкой кофе. Минск: Дискурс, 2020.
  2. Савельев В. Статистика и котики. М.: АСТ, 2021.
  3. Поппер К. Логика научного исследования. М.: Республика, 2005.
  4. Парибок А.В., Псху Р.В. Методологические и содержательные аргументы против «понятийного европоцентризма» // Философские науки. 2019. № 62(6). С. 54-69. https://doi.org/10.30727/0235-1188-2019-62-6-54-69
  5. Bronkhorst J. Traditional and Modern Sanskrit Scholarship: How Do They Relate to Each Other // Michaels A. (Ed.) The Pandit: Traditional Scholarship in India. Delhi: Manohar, 2001. P. 167-180.
  6. Pskhu R. Digital Indology. Some remarks and suggestion // The 3rd (Hybrid) International Conference on Recent Development in Engineering & Technology (ICRDET). February 25 (Fri.) - February 26 (Sat.), 2022. Anand International College of Engineering, Jaipur, India. P. 35.
  7. Псху Р.В. О «Шрирангагадье» Рамануджи // Дубянские чтения. 1-я Международная научная конференция. Москва, 18-20 ноября 2021 года. Cборник тезисов. М. : Директ-медиа, 2021. С. 43-44.
  8. Псху Р.В. Философский санскрит и трудности его перевода // Вопросы философии. 2016. № 3. С. 80-89.
  9. Псху Р.В., Крыштоп Л.Э., Парибок А.В. К постановке вопроса о периодизации истории индийской философии // Вопросы философии. 2019. № 1. С. 146-163.

© Билимория П., Парибок А.В., Псху Р.В., 2022

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах