Новый датасет: «Данные для воспроизведения исследования: Лекаревич, Е. Домашние дела литературных персонажей»
В Репозитории открытых данных по русской литературе и фольклору опубликован новый датасет в разделе Воспроизводимые данные, позволяющий воспроизвести результаты исследования Евгении Лекаревич «Домашние дела литературных персонажей», опубликованного в журнале «Детские чтения» 20(2):155-74.
В работе проанализирована частотность изображения персонажей-женщин и мужчин, занятых бытовым трудом, в русской детской литературе XX-XXI вв. — на материале Корпуса русской литературы для детей и юношества (Деткорпус). Количественные выводы сделаны на основании анализа контекстов употребления глаголов, обозначающих бытовой труд.
В советской и постсоветской детской литературе так же, как и в литературе для взрослых, у авторов-мужчин значительно преобладают персонажи мужского пола, в то время как для авторов-женщин характерно несколько более эгалитарное распределение персонажей. Женские персонажи чаще изображаются за определенными видами бытовой работы авторами обоего пола. В статье с помощью тематического моделирования (LDA) выявлен круг романтических и приключенческих топосов, в рамках которых изображаются мужчины и мальчики, занятые обустройством быта.
Обновление датасета: Лучшие образцы русской литературы (1849–1900)
Опубликована новая версия (2.0) датасета
Лучшие образцы русской литературы (1849–1900): антологии избранной поэзии и прозы, литературные сборники и альманахи, сборники для легкого чтения, антологии для народа, антологии для женщин.
В новой версии базы данных значительно расширен временной диапазон вошедших в нее антологий и сборников второй половины XIX в., что делает ее репрезентативным датасетом русских литературных антологий, альманахов и сборников избранной русскоязычной поэзии и прозы. Прежняя версия датасета была ограничена 1869 годом, новая же версия включает в себя литературные сборники, альманахи и антологии 1870-1900 гг., а также датасет дополнен несколькими прежде не вошедшими в его состав изданиями 1849-1869 гг.
Новый датасет: «Корпус русской литературной баллады 1840 гг.»
В Репозитории открытых данных по русской литературе и фольклору опубликован новый датасет — Корпус русской литературной баллады 1840-х гг., собранный Марией Ивановой.
В корпус вошло 212 текстов, опубликованных в периодических изданиях и сборниках 1840-х гг. под заголовком «Баллада» или в одноименном разделе; также включались тексты, обладающие характерными балладными признаками, сформулированными в исследовательской традиции: к ним относятся наличие фабулы и сюжетная основа, взятая из фольклора, средневековой литературы, античной мифологии и, реже, обыденной жизни, а также элемент чудесного (см. исследования Р. В. Иезуитовой и О. А. Левченко). Подробнее
Два новых датасета
Лаборатория цифровых исследований русской литературы и фольклора представляет два новых датасета:
Новый датасет: «Словарь русских писателей XVIII века: сеть персоналий»
Обновление датасета: Корпус русской прозы для детей и юношества
Лаборатория цифровых исследований
16 февраля 2022 года руководитель лаборатории цифровых исследований Кирилл Маслинский выступил с докладом «О культуре работы с данными в DH, или роль Репозитория открытых данных» на семинаре «Цифровая среда» Сибирского федерального университета. Запись семинара доступна по ссылке https://www.youtube.com/watch?v=18BUQBh2P5E&ab_channel=DigitalHumanitiesResearchInstitute
Круглый стол Лаборатории цифровых исследований литературы и фольклора
Круглый стол Лаборатории цифровых исследований литературы и фольклора «Корпусные исследования гимнографических текстов» пройдет 18 декабря в формате телемоста. Начало в 11.00.
Афиша и программа
По вопросам регистрации участников обращаться к Никите Шереметову по электронному адресу: nikita2631@mail.ru
Семинар Лаборатории цифровых исследований
20-го февраля в 14:00 в Малом конференц-зале пройдет семинар Лаборатории цифровых исследований литературы и фольклора. Спикер семинара — Борис Орехов, доцент Факультета гуманитарных наук Высшей школы экономики (Москва), выступит с докладом на тему «Векторно-дистрибутивные модели в исследовании художественного текста».
В течение последнего десятилетия старая теоретическая идея, что слово обретает свое значение только в конкретном контексте, получила практическое измерение. Эффективные алгоритмы, позволяющие обсчитать все контексты всех слов в корпусе, дали компьютерным лингвистам инструмент для работы с семантикой, не заложенной в программу экспертом, а извлеченной непосредственно из текста. Помимо того, что эти технологии позволяют компьютерным системам интеллектуально обрабатывать запросы пользователей (например, в задачах информационного поиска), существует и несколько областей применения в исследовательской практике, в том числе и у исследователей художественного текста.
Семинар Лаборатория цифровых исследований
Лаборатория цифровых исследований приглашает на семинар, посвященный текущим проектам. Сотрудники лаборатории расскажут о том, как продвигается работа над созданием репозитория открытых данных и литературных корпусов, ответят на вопросы.
Семинар пройдет 25 ноября в 13:00 в Малом конференц-зале.
Докладчики:
13:00-13:15. Кирилл Маслинский. О задачах Лаборатории.
13:15-13:30. Евгения Лекаревич. Корпус русской детской литературы: обновления, перемены и перспективы.
13:30-13:45. Никита Шереметов, Алексей Горгадзе. Произведения древнерусской литературы как часть корпуса: источники и принципы публикации.
13:45-14:00. Елена Казакова, Антонина Мартыненко. Создание и наполнение репозитория открытых данных по русской литературе и фольклору.
14:00-14-15. Дискуссия, вопросы.
Шестой Семинар Лаборатории цифровых исследований литературы и фольклора
Шестой Семинар Лаборатории цифровых исследований литературы и фольклора состоится в четверг, 19 сентября в 15.30.
Тема семинара — “Поэтический корпус как исследовательский инструмент”.
С докладами выступят Вера Полилова (МГУ, Институт мировой культуры) и Игорь Пильщиков (МГУ, Институт мировой культуры; Таллиннский университет; UCLA), которые представят свой корпусной проект “Сопоставительная поэтика и сравнительное литературоведение”, а также Антонина Мартыненко (Тартуский университет; ИРЛИ), работающая над созданием корпуса русской элегии.
Темы выступлений:
Вера Полилова. Кластерное представление параллельных текстов (на примере информационной системы “Сопоставительная поэтика и сравнительное литературоведение”).
Игорь Пильщиков. Межтекстовые связи как метаинформация (на примере информационной системы “Сопоставительная поэтика и сравнительное литературоведение”).
Антонина Мартыненко. Корпус русской элегии 1815-1835 годов: проблемы выборки, описание и подходы к исследованию.
Семинар лаборатории цифровых исследований и фольклора
13 мая в 14 часов в Большом конференц-зале Пушкинского Дома выступит Екатерина Владимировна Рахилина доктор филологических наук, профессор, руководитель Школы лингвистики Факультета гуманитарных наук НИУ ВШЭ (Москва). Тема: М. Ю. Лермонтов «Герой нашего времени». Лингвистическое чтение. Подробнее