Лаборатория цифровых исследований литературы и фольклора — коллектив ученых, занимающихся созданием и продвижением инструментов количественных исследований в области истории и исторической социологии русской литературы и фольклора. Приток больших данных в цифровой форме и развитие методов их обработки, в первую очередь машинного обучения, трансформирует сейчас все области человеческого знания, в том числе и литературоведение во всем мире. Большие массивы уже оцифрованных литературных произведений и данных об их обращении дают богатый материал «цифровых следов», отражающих собственно литературную и в целом культурную историю за большие периоды времени. Традиционные филологические подходы не позволяют охватить весь объем оцифрованного материала, а новые методы и данные дают возможность ставить совершенно новый тип вопросов о закономерностях литературного процесса.

НАПРАВЛЕНИЯ РАБОТЫ

  • Корпус русской литературы

Формирование массива данных, содержащего не только тексты произведений, снабженные профессионально подготовленными метаданными, но и давать возможности поиска, навигации и агрегации данных в терминах релевантных для литературы высокоуровневых категорий: персонаж, тема, сюжетная функция и т.п. Открытый доступ к поисковым и агрегационным возможностям корпуса будет важен не только для специалистов, но и для более широкой аудитории, поскольку корпус может выступить также современной и технологичной формой репрезентации литературы, что повышает статус литературы в обществе в целом.

  • Репозиторий открытых данных по русской литературе

Создание хранилища открытых данных обеспечит возможность публикации данных наряду с публикацией результатов исследования. Репозиторий также решает задачу организации онлайн-доступа к данным в долгосрочной перспективе, предоставляет стандартизованный способ ссылаться на данные в публикациях и в целом поднимает видимость работы исследователей над подготовкой, проверкой и публикацией данных.

  • Количественные исследования в области истории и социологии русской литературы

Исследовательские проекты сотрудников лаборатории, в которых будут использоваться данные создаваемого в рамках первого направления корпуса русской литературы и его подкорпусов, а также библиографические и прочие данные по истории русской литературы.