Лаборатория цифровых исследований литературы и фольклора — коллектив ученых, занимающихся созданием и продвижением инструментов количественных исследований в области истории и исторической социологии русской литературы и фольклора. Приток больших данных в цифровой форме и развитие методов их обработки, в первую очередь машинного обучения, трансформирует сейчас все области человеческого знания, в том числе и литературоведение во всем мире. Большие массивы уже оцифрованных литературных произведений и данных об их обращении дают богатый материал «цифровых следов», отражающих собственно литературную и в целом культурную историю за большие периоды времени. Традиционные филологические подходы не позволяют охватить весь объем оцифрованного материала, а новые методы и данные дают возможность ставить совершенно новый тип вопросов о закономерностях литературного процесса.

НАПРАВЛЕНИЯ РАБОТЫ

  • Корпус русской литературы
    Формирование массива данных, содержащего не только тексты произведений, снабженные профессионально подготовленными метаданными, но и давать возможности поиска, навигации и агрегации данных в терминах релевантных для литературы высокоуровневых категорий: персонаж, тема, сюжетная функция и т.п. Открытый доступ к поисковым и агрегационным возможностям корпуса важен не только для специалистов, но и для более широкой аудитории, поскольку выступает также современной и технологичной формой репрезентации литературы, что повышает статус литературы в обществе в целом. Поисковый интерфейс (конкорданс) к открытым на настоящий момент подкорпусам доступен по адресу: http://corpora.pushdom.ru.
  • Репозиторий открытых данных по русской литературе и фольклору
    Репозиторий открытых данных по русской литературе и фольклору — это ресурс для хранения и публикации научных данных, которые авторы предоставляют в свободный доступ другим исследователям. Репозиторий также решает задачу организации онлайн-доступа к данным в долгосрочной перспективе, предоставляет стандартизованный способ ссылаться на данные в публикациях и в целом поднимает видимость работы исследователей над подготовкой, проверкой и публикацией данных. Публикуемые в репозитории данные проходят рецензирование и техническую подготовку для того, чтобы обеспечить достоверность, полноту и консистентность данных. Сайт проекта: https://dataverse.pushdom.ru/site.
  • Количественные исследования в области истории и социологии русской литературы
    Сотрудники лаборатории ведут исследовательские проекты, в которых используются данные корпуса русской литературы и его подкорпусов, а также библиографические и прочие данные по истории русской литературы.