Новый датасет: «Корпус русской литературной баллады 1840 гг.»

Лаборатория цифровых исследований литературы и фольклора ИРЛИ РАН. 28 июня 2022.
В Репозитории открытых данных по русской литературе и фольклору опубликован новый датасет — Корпус русской литературной баллады 1840-х гг., собранный Марией Ивановой.

В корпус вошло 212 текстов, опубликованных в периодических изданиях и сборниках 1840-х гг. под заголовком «Баллада» или в одноименном разделе; также включались тексты, обладающие характерными балладными признаками, сформулированными в исследовательской традиции: к ним относятся наличие фабулы и сюжетная основа, взятая из фольклора, средневековой литературы, античной мифологии и, реже, обыденной жизни, а также элемент чудесного (см. исследования Р. В. Иезуитовой и О. А. Левченко).

Тексты снабжены подробными метаданными, включающими как стиховые характеристики (метр и размер, строфическая формула и т.д.), так и специфические для баллады признаки (тип повествования, указание на переводную природу текста). В библиографическом отношении метаданные корпуса позволяют исследовать степень распространения балладного жанра в авторских сборниках и периодике 1840-х гг.

В сравнении с корпусом «канонической» баллады начала XIX в., представленной балладами В. А. Жуковского, П. А. Катенина, А. С. Пушкина и М. Ю. Лермонтова, корпус баллад 1840-х гг. представляет базу для изучения развития жанра и механизмов его трансформации на исходе «золотого века» русской поэзии. О нескольких находках в этом направлении см. работу Марии «Жанр литературной баллады в 1840-е годы» (Тарту, 2022).

Два новых датасета

Лаборатория цифровых исследований русской литературы и фольклора представляет два новых датасета:

Новый датасет: «Словарь русских писателей XVIII века: сеть персоналий»

Обновление датасета: Корпус русской прозы для детей и юношества

Лаборатория цифровых исследований

16 февраля 2022 года руководитель лаборатории цифровых исследований Кирилл Маслинский выступил с докладом «О культуре работы с данными в DH, или роль Репозитория открытых данных» на семинаре «Цифровая среда» Сибирского федерального университета. Запись семинара доступна по ссылке https://www.youtube.com/watch?v=18BUQBh2P5E&ab_channel=DigitalHumanitiesResearchInstitute

Круглый стол Лаборатории цифровых исследований литературы и фольклора

Круглый стол Лаборатории цифровых исследований литературы и фольклора «Корпусные исследования гимнографических текстов» пройдет 18 декабря в формате телемоста.  Начало в 11.00.
Афиша и программа
По вопросам  регистрации участников обращаться к Никите Шереметову по электронному адресу: nikita2631@mail.ru

Семинар Лаборатории цифровых исследований

20-го февраля в 14:00 в Малом конференц-зале пройдет семинар Лаборатории цифровых исследований литературы и фольклора. Спикер семинара — Борис Орехов, доцент Факультета гуманитарных наук Высшей школы экономики (Москва), выступит с докладом на тему «Векторно-дистрибутивные модели в исследовании художественного текста».
В течение последнего десятилетия старая теоретическая идея, что слово обретает свое значение только в конкретном контексте, получила практическое измерение. Эффективные алгоритмы, позволяющие обсчитать все контексты всех слов в корпусе, дали компьютерным лингвистам инструмент для работы с семантикой, не заложенной в программу экспертом, а извлеченной непосредственно из текста. Помимо того, что эти технологии позволяют компьютерным системам интеллектуально обрабатывать запросы пользователей (например, в задачах информационного поиска), существует и несколько областей применения в исследовательской практике, в том числе и у исследователей художественного текста.

Семинар Лаборатория цифровых исследований

Лаборатория цифровых исследований приглашает на семинар, посвященный текущим проектам. Сотрудники лаборатории расскажут о том, как продвигается работа над созданием репозитория открытых данных и литературных корпусов, ответят на вопросы.
Семинар пройдет 25 ноября в 13:00 в Малом конференц-зале.
Докладчики:
13:00-13:15. Кирилл Маслинский. О задачах Лаборатории.
13:15-13:30. Евгения Лекаревич. Корпус русской детской литературы: обновления, перемены и перспективы.
13:30-13:45. Никита Шереметов, Алексей Горгадзе. Произведения древнерусской литературы как часть корпуса: источники и принципы публикации.
13:45-14:00. Елена Казакова, Антонина Мартыненко. Создание и наполнение репозитория открытых данных по русской литературе и фольклору.
14:00-14-15. Дискуссия, вопросы.

Шестой Семинар Лаборатории цифровых исследований литературы и фольклора

Шестой Семинар Лаборатории цифровых исследований литературы и фольклора состоится в четверг, 19 сентября в 15.30.
Тема семинара — “Поэтический корпус как исследовательский инструмент”.
С докладами выступят Вера Полилова (МГУ, Институт мировой культуры) и Игорь Пильщиков (МГУ, Институт мировой культуры; Таллиннский университет; UCLA), которые представят свой корпусной проект “Сопоставительная поэтика и сравнительное литературоведение”, а также Антонина Мартыненко (Тартуский университет; ИРЛИ), работающая над созданием корпуса русской элегии.
Темы выступлений:
Вера Полилова. Кластерное представление параллельных текстов (на примере информационной системы “Сопоставительная поэтика и сравнительное литературоведение”).
Игорь Пильщиков. Межтекстовые связи как метаинформация (на примере информационной системы “Сопоставительная поэтика и сравнительное литературоведение”).
Антонина Мартыненко. Корпус русской элегии 1815-1835 годов: проблемы выборки, описание и подходы к исследованию.

Семинар лаборатории цифровых исследований и фольклора

13 мая в 14 часов в Большом конференц-зале Пушкинского Дома выступит Екатерина Владимировна Рахилина доктор филологических наук, профессор, руководитель Школы лингвистики Факультета гуманитарных наук НИУ ВШЭ (Москва). Тема: М. Ю. Лермонтов «Герой нашего времени». Лингвистическое чтение. Подробнее

Семинар Лаборатории цифровых исследований литературы и фольклора

22 апреля  2019 года в 15.30 в Большом конференц-зале Пушкинского Дома с докладом «Как Чистяков обошел Пушкина: измерение престижа и популярности в русской критике 1860-80-х гг.» выступит аспирантка Центра исследований детской литературы Ольга Лучкина.
В докладе речь пойдет о структуре литературного канона, реконструируемого на материале критики детской литературы XIX в. Дж. Д. Портер (Stanford Literary Lab) указывает на два способа войти в литературный канон: быть прочитанным многими («популярность») и быть ценным для избранной элиты («престиж»). С помощью этих двух измерений мы рассмотрим механизмы формирования канона, чтобы объяснить место М.Б. Чистякова и А.С. Пушкина в иерархии писателей для детей. Задача доклада — прояснить не только содержание канона, но и структуру, внутренние взаимосвязи. Решить эту задачу помогают количественные методы анализа данных.
Семинар проводится совместно с Центром исследований детской литературы.

Семинар Лаборатории цифровых исследований литературы и фольклора

14 марта 2019 года в 15.00 в Большом конференц-зале Пушкинского Дома с докладом «Современный метод компьютерной атрибуции текстов: надёжность, ограничения, результаты» выступит Борис Орехов (НИУ ВШЭ, Москва).
Речь пойдёт о широко используемом в современных исследованиях методе Delta, появившемся в начале 2000-х годов. Его повсеместное применение обусловлено многократно проверенной надежностью, доступностью использования и простотой интерпретации результатов. Особое внимание будет уделено тому, как Delta работает на русскоязычном материале, и какие традиционные вопросы атрибуции помогает решать.