Дорогие друзья! Вышел в свет 40 выпуск «Временника Пушкинской комиссии». Электронная версия.

Дорогие друзья! Вышел в свет 40 выпуск «Временника Пушкинской комиссии». Электронная версия.

Дорогие друзья! Публикацией датасета Елизаветы Копыловой Икты на односложных словах в русском силлабо-тоническом стихе мы открываем новый раздел репозитория Стиховедческие данные.
В датасет вошли сведения об односложных словах в силлабо-тонических текстах и наличии иктов (метрически сильных мест) на них, а также о параметрах, потенциально определяющих, окажется ли слово отмечено иктом: фонетической и морфологической характеристики, позиции в строке, метра, количества стоп и типа клаузулы. В качестве материала были задействованы размеченные тексты поэтического подкорпуса Национального корпуса русского языка. Датасет может быть использован для дальнейших исследований по соотношению иктов и реальных ударений в поэзии, а также для разработки алгоритмов автоматического определения метра силлабо-тонического стиха.
Дорогие друзья! В разделе Биографических данных опубликован новый датасет Женщины литературных профессий: материалы для биобиблиографического словаря. Он представляет собой машиночитаемую базу данных, созданную на основе материалов биобиблиографического словаря Ю. А. Горбунова «Писательницы России» Евгенией Лекаревич и Александром Кимом. В него вошли биографические и библиографические данные о российских писательницах, учёных и публицистках (до первой половины XX в.), отобранные по формальному критерию наличия подтверждённой публикации. Целью авторов датасета было сохранить и структурировать информацию о вкладе женщин в литературу, следуя принципу Горбунова о важности фиксации каждого факта литературной деятельности. Помимо таблицы, позволяющей выполнять справочные запросы и количественные исследования, в состав датасета также включен слепок веб-сайта оригинального авторского словаря в виде WARC-архива.
Дорогие друзья! В разделе Корпуса текстов опубликован новый датасет Корпус церковнославянской гимнографии (на материале современных обиходных миней). Корпус, подготовленный Никитой Шереметовым, содержит больше 1000 текстов служб и отдельных песнопений, извлечённых из современных изданий обиходных миней, преимущественно так называемых «Зелёных миней». Тексты снабжены подробными метаданными и разметкой по международному стандарту TEI, что позволяет точно описывать структуру богослужебных последований, жанры песнопений, их гласы, подобны и другие атрибуты.

Дорогие друзья! Опубликован новый датасет Литературные сюжеты в формате карты событий (Олег Стрижак, Венедикт Ерофеев, Гайто Газданов, Геннадий Алексеев, Александр Етоев, Андрей Некрасов) в разделе Геоданные.
Эта публикация стала результатом первого для редакции Репозитория опыта взаимодействия с практиками «гражданской науки» (citizen science). Датасет создан автором, не включенным в институциональную науку и формальные исследовательские процессы и руководствовавшимся в отборе данных частными интересами и обстоятельствами. Чтобы контекст появления датасета был более объемным, в сопроводительную документацию включено интервью с автором.
Собственно данные, представленные в датасете, содержат географическую привязку ключевых нарративных событий нескольких произведений русской литературы. Теоретическим основанием здесь служит понятие «карта событий», обобщающее практику текстовых отсылок к конкретным пространственным координатам и позволяющее транслировать литературный нарратив в визуально-географический формат. Таким образом, датасет не только предлагает инструмент для визуализации маршрутов персонажей, но и служит ресурсом для анализа роли пространства в структурировании литературного произведения.
В издательстве «Манн, Иванов и Фербер» переиздана поэма «Демон» М.Ю. Лермонтова с предисловием сотрудника Лаборатории цифровых исследований литературы и фольклора Бориса Орехова. Текст предисловия доступен на сайте, в разделе статей публикаций сотрудников.

В библиографическом разделе Репозитория открытых данных по русской литературе и фольклору опубликован новый датасет «Роспись содержания советских толстых журналов, 1955—1990 (Новый Мир, Октябрь, Наш Современник, Звезда, Знамя, Юность)». В него вошли обширные сведения о литературных произведениях, напечатанных в главных советских толстых журналах.
Основная таблица содержит данные о названиях произведений, жанровые метки, данные об авторах и их партийной принадлежности. В двух дополнительных таблицах представлены данные о составах редакционных коллегий журналов и списках лауреатов литературных премий.
Датасет может использоваться не только как источник сводной библиографии толстых литературных журналов, но и как основа для исследований о путях распространения текстов и их канонизации с учетом институциональных факторов.


Опубликован новый датасет «Пушкиниана: библиография научных и критических работ, посвящённых А. С. Пушкину». Датасет создан на основе «Пушкинианы» — базы данных, в которой содержатся библиографические сведения об изданиях произведений А. С. Пушкина, их переводах, а также исследовательских материалах о них, биографии писателя и его творчестве. Данные «Пушкинианы» собраны сотрудниками Пушкинского кабинета ИРЛИ (Пушкинский Дом) РАН из различных источников.
Более 50 тыс. библиографических записей содержат сведения об оригинальных текстах Пушкина, справочных изданий по пушкинистике, библиографических указателях, сборниках материалов конференций, пристатейной библиографии и рецензиях. Записи снабжены уникальными идентификаторами UID, позволяющими определить, каким произведениям посвящено издание. Датасет позволяет работать с данными «Пушкинианы» удаленно, делая их более доступными и расширяя круг пользователей.
Опубликованы вторые версии датасетов «Индекс произведений и писем А. С. Пушкина» и «Корпус стихотворений А. С. Пушкина», дополненные сведениями 5-го тома Пушкинской энциклопедии.
Все три перечисленных датасета формируют цифровую репрезентацию стихотворных текстов, библиографии и метабиблиографии Пушкина и могут служить материалом в том числе для количественных исследований. Датасеты могут использоваться совместно, так как содержат объединяющие их идентификаторы произведений UID.