<

Новый датасет

Дорогие друзья! Публикацией датасета Елизаветы Копыловой Икты на односложных словах в русском силлабо-тоническом стихе мы открываем новый раздел репозитория Стиховедческие данные.

В датасет вошли сведения об односложных словах в силлабо-тонических текстах и наличии иктов (метрически сильных мест) на них, а также о параметрах, потенциально определяющих, окажется ли слово отмечено иктом: фонетической и морфологической характеристики, позиции в строке, метра, количества стоп и типа клаузулы. В качестве материала были задействованы размеченные тексты поэтического подкорпуса Национального корпуса русского языка. Датасет может быть использован для дальнейших исследований по соотношению иктов и реальных ударений в поэзии, а также для разработки алгоритмов автоматического определения метра силлабо-тонического стиха.


Новый датасет

Дорогие друзья! В разделе Биографических данных опубликован новый датасет Женщины литературных профессий: материалы для биобиблиографического словаря. Он представляет собой машиночитаемую базу данных, созданную на основе материалов биобиблиографического словаря Ю. А. Горбунова «Писательницы России» Евгенией Лекаревич и Александром Кимом. В него вошли биографические и библиографические данные о российских писательницах, учёных и публицистках (до первой половины XX в.), отобранные по формальному критерию наличия подтверждённой публикации. Целью авторов датасета было сохранить и структурировать информацию о вкладе женщин в литературу, следуя принципу Горбунова о важности фиксации каждого факта литературной деятельности. Помимо таблицы, позволяющей выполнять справочные запросы и количественные исследования, в состав датасета также включен слепок веб-сайта оригинального авторского словаря в виде WARC-архива.


Новый датасет

Дорогие друзья! В разделе Корпуса текстов опубликован новый датасет Корпус церковнославянской гимнографии (на материале современных обиходных миней). Корпус, подготовленный Никитой Шереметовым, содержит больше 1000 текстов служб и отдельных песнопений, извлечённых из современных изданий обиходных миней, преимущественно так называемых «Зелёных миней». Тексты снабжены подробными метаданными и разметкой по международному стандарту TEI, что позволяет точно описывать структуру богослужебных последований, жанры песнопений, их гласы, подобны и другие атрибуты.

Новый датасет

Дорогие друзья! Опубликован новый датасет  Литературные сюжеты в формате карты событий (Олег Стрижак, Венедикт Ерофеев, Гайто Газданов, Геннадий Алексеев, Александр Етоев, Андрей Некрасов) в разделе Геоданные.

Эта публикация стала результатом первого для редакции Репозитория опыта взаимодействия с практиками «гражданской науки» (citizen science). Датасет создан автором, не включенным в институциональную науку и формальные исследовательские процессы и руководствовавшимся в отборе данных частными интересами и обстоятельствами. Чтобы контекст появления датасета был более объемным, в сопроводительную документацию включено интервью с автором.

Собственно данные, представленные в датасете, содержат географическую привязку ключевых нарративных событий нескольких произведений русской литературы. Теоретическим основанием здесь служит понятие «карта событий», обобщающее практику текстовых отсылок к конкретным пространственным координатам и позволяющее транслировать литературный нарратив в визуально-географический формат. Таким образом, датасет не только предлагает инструмент для визуализации маршрутов персонажей, но и служит ресурсом для анализа роли пространства в структурировании литературного произведения.

Новый датасет

Дорогие друзья! Новый датасет Творчество Х.-К. Андерсена в русской литературной и педагогической критике: 1845–1918 гг., опубликован в библиографическом разделе Репозитория. Он содержит библиографические сведения о статьях, рецензиях и отдельных изданиях, написанных литературными критиками, литераторами, педагогами и библиографами на русском языке в период с 1845 г. по 1918 г. Материалы отобраны из изданий русской периодики, преимущественно литературной и педагогической, а также из рекомендательных пособий и предисловий к изданиям текстов Х.-К. Андерсена.

Более 150 библиографических записей содержат сведения о публикациях, в которых рассматриваются произведения Андерсена, входящие в круг детского чтения, а сам писатель характеризуется как детский автор. Записи включают такие формы критической литературы, как рецензии, статьи литературоведческого и педагогического характера, биографии писателя и методические материалы. Датасет позволяет проследить, как творчество Андерсена обретало статус классики детской литературы в России, и выявить динамику интереса критиков и педагогов к его произведениям.

Репозиторий открытых данных по русской литературе и фольклору

В библиографическом разделе Репозитория открытых данных по русской литературе и фольклору опубликован новый датасет «Роспись содержания советских толстых журналов, 1955—1990 (Новый Мир, Октябрь, Наш Современник, Звезда, Знамя, Юность)». В него вошли обширные сведения о литературных произведениях, напечатанных в главных советских толстых журналах.

Основная таблица содержит данные о названиях произведений, жанровые метки, данные об авторах и их партийной принадлежности. В двух дополнительных таблицах представлены данные о составах редакционных коллегий журналов и списках лауреатов литературных премий.

Датасет может использоваться не только как источник сводной библиографии толстых литературных журналов, но и как основа для исследований о путях распространения текстов и их канонизации с учетом институциональных факторов.

К 70-летию экспедиции фольклористов Пушкинского Дома

Дорогие друзья! К 70-летию экспедиции фольклористов Пушкинского Дома в знаменитый Усть-Цилемский район (д. Рочево, июль 1955 г.) сотрудниками Научно-исследовательской лабораторией «Филологические исследования духовной культуры Севера» Сыктывкарского государственного университета им. Питирима Сорокина подготовлен новый интернет-ресурс

Приглашаем познакомиться!

Репозиторий открытых данных по русской литературе и фольклору

Опубликован новый датасет «Пушкиниана: библиография научных и критических работ, посвящённых А. С. Пушкину». Датасет создан на основе «Пушкинианы» — базы данных, в которой содержатся библиографические сведения об изданиях произведений А. С. Пушкина, их переводах, а также исследовательских материалах о них, биографии писателя и его творчестве. Данные «Пушкинианы» собраны сотрудниками Пушкинского кабинета ИРЛИ (Пушкинский Дом) РАН из различных источников.

Более 50 тыс. библиографических записей содержат сведения об оригинальных текстах Пушкина, справочных изданий по пушкинистике, библиографических указателях, сборниках материалов конференций, пристатейной библиографии и рецензиях. Записи снабжены уникальными идентификаторами UID, позволяющими определить, каким произведениям посвящено издание. Датасет позволяет работать с данными «Пушкинианы» удаленно, делая их более доступными и расширяя круг пользователей. 

Опубликованы вторые версии датасетов «Индекс произведений и писем А. С. Пушкина» и «Корпус стихотворений А. С. Пушкина», дополненные сведениями 5-го тома Пушкинской энциклопедии.

Все три перечисленных датасета формируют цифровую репрезентацию стихотворных текстов, библиографии и метабиблиографии Пушкина и могут служить материалом в том числе для количественных исследований. Датасеты могут использоваться совместно, так как содержат объединяющие их идентификаторы произведений UID.

Журнал «Цифровые гуманитарные исследования»

Уважаемые коллеги! Институт русской литературы (Пушкинский Дом) РАН начинает издавать новый журнал, посвященный цифровым методам в гуманитарных науках. Журнал «Цифровые гуманитарные исследования» — рецензируемый электронный научный журнал, периодичность выхода — 2 раза в год. Первый номер доступен по ссылке.

Обновление датасета: Критика детской литературы русского зарубежья в периодических изданиях 1920–1940-х гг.

Опубликована новая версия (V2) датасета Анны Димяненко «Критика детской литературы русского зарубежья в периодических изданиях 1920–1940-х гг.»

Новая версия датасета помимо библиографических данных включает полные тексты 250-ти статей, рецензий и обзоров, посвященных книгам, изданным для детей на русском языке, детскому чтению, библиотекам и издательствам, выпускавшим литературу для детей за рубежом. Материалы отобраны из периодических изданий, выходивших в Европе с 1920 по 1940 гг. на русском языке. В библиографические данные внесен ряд уточнений и корректировок.
Данные пополнили корпус Деткорпус. Критика, интерфейс которого позволяет осуществлять комплексный поиск по текстам. Для удобства пользователей тексты эмигрантской печати объединены в отдельный подкорпус.