Уважаемые коллеги! Институт русской литературы (Пушкинский Дом) РАН начинает издавать новый журнал, посвященный цифровым методам в гуманитарных науках. Журнал «Цифровые гуманитарные исследования» — рецензируемый электронный научный журнал, периодичность выхода — 2 раза в год. Первый номер доступен по ссылке.
Обновление датасета: Критика детской литературы русского зарубежья в периодических изданиях 1920–1940-х гг.
Опубликована новая версия (V2) датасета Анны Димяненко «Критика детской литературы русского зарубежья в периодических изданиях 1920–1940-х гг.»
Новая версия датасета помимо библиографических данных включает полные тексты 250-ти статей, рецензий и обзоров, посвященных книгам, изданным для детей на русском языке, детскому чтению, библиотекам и издательствам, выпускавшим литературу для детей за рубежом. Материалы отобраны из периодических изданий, выходивших в Европе с 1920 по 1940 гг. на русском языке. В библиографические данные внесен ряд уточнений и корректировок.
Данные пополнили корпус Деткорпус. Критика, интерфейс которого позволяет осуществлять комплексный поиск по текстам. Для удобства пользователей тексты эмигрантской печати объединены в отдельный подкорпус.
Новый датасет: Забытые романы русских писателей из фондов Пушкинского Дома (1857–1917)
Раздел Корпуса текстов Репозитория пополнился датасетом «Забытые романы русских писателей из фондов Пушкинского Дома (1857–1917)».
Датасет состоит из 100 текстов романов малоизвестных русских писателей, хранящихся в фондах Института русской литературы РАН (Пушкинского Дома). Оцифрованные копии текстов автоматически распознаны и снабжены метаданными, в числе которых сведения о раскрытых псевдонимах, библиографическая информация об оцифрованном издании, а также дата первой публикации произведения.
Эта публикация вводит в научный оборот произведения из малодоступных изданий, которые почти наверняка никогда ранее не были оцифрованы. Такой материал позволит исследователям сформировать более объемное представление как о жанровых особенностях романа, так и в целом о литературе второго ряда, изданной во второй половине XIX — начале XX вв.
Вместе с «Корпусом нарративной прозы XIX в.», коллекция «забытых романов» представляет значительный срез крупных прозаических произведений XIX в. на русском языке.
Новый датасет: Корпус публикаций журнала «Современник» (1847–1866)
Корпусный раздел Репозитория пополнился датасетом Екатерины Вожик «Корпус публикаций журнала «Современник» (1847–1866)».
Этот корпус открывает более широкие возможности для систематических цифровых и количественных исследований по материалам одного самых известных литературных журналов России. Датасет включает автоматически распознанные тексты 4686 публикаций основного содержания «Современника» и расширенные метаданные к ним. Структура таблицы метаданных задана сведениями основного авторитетного источника – указателя В. Э. Бограда (Боград В. Э. Журнал «Современник». 1847–1866: Указатель содержания. М.; Л.: ГИХЛ, 1959), которые были уточнены, реструктурированы и дополнены составительницей датасета. В частности, восстановлены опущенные Боградом указания на авторов в заглавиях статей. Данные сверены de visu по оригинальным выпускам журнала, включая пятый выпуск за 1866 г., часть тиража которого была изъята цензурой. Набор метаданных включает не только базовую информацию о публикации и ее авторе, но и сведения о датах фактического выхода журнала в свет и датах цензурных разрешений, принадлежности к определенному разделу журнала, адресатах посвящений и др. В отдельной таблице приведены метаданные к журнальным приложениям «Современника».
Новый датасет: Русско-европейские литературные связи XVIII века
Раздел Репозитория Биографические данные пополнился датасетом Рината Бакирова и Бориса Орехова «Русско-европейские литературные связи XVIII векаx».
Датасет представляет собой сведения о литературных контактах русских и европейских писателей по данным двух справочных изданий — «Словаря русских писателей XVIII века» и энциклопедического словаря «Русско-европейские литературные связи — XVIII век». Упоминания писателей выделены из словарных статей и приведены в табличную машиночитаемую форму. Эти данные также агрегированы в файл, готовый к загрузке в программу сетевого анализа.
Датасет будет полезен при составлении наиболее полной картины связей писателей в русской литературе XVIII века, которая позволит наблюдать литературные и экстралитературные процессы в динамике, в том числе, с учетом литературных направлений, стилей, групп. Кроме того, датасет связан с датасетом Словарь русских писателей XVIII века: сеть персоналий за счет унифицированного обозначения персоналий, что позволяет использовать их совместно.
Новый датасет: Индекс произведений и писем А. С. Пушкина»
Датасет «Индекс произведений и писем А. С. Пушкина», опубликованный в библиографическом разделе Репозитория, представляет собой сводный перечень, систематизирующий имеющиеся в распоряжении современной пушкинистики сведения о письменном наследии поэта.
Своей главной целью авторы датасета видели составление списка произведений, объединяющего все письменное наследие Пушкина, и присвоение каждому произведению уникального идентификатора (UID), позволяющего однозначно его определить. Датасет включает в себя три таблицы: oeuvre, letters и texts, — представляющие сведения о художественных и нехудожественных произведениях Пушкина, его письмах и текстах, которые написаны его рукой (выписки и записи разного содержания, официальные документы).
В основе датасета лежат переведенные в табличную форму данные «Пушкинской энциклопедии», работа над которой ведется в Институте русской литературы (Пушкинский Дом) Российской Академии наук с 2009 года. Сведения о письмах и текстах, написанных «рукою Пушкина», актуализированы в сотрудничестве с Отделом пушкиноведения и Рукописным отделом ИРЛИ РАН.
Новый датасет: Литературные произведения в государственных стандартах и программах для средней школы 1998—2022 гг.
Раздел Репозитория Библиографические данные пополнился датасетом Андрея Кокорина «Литературные произведения в государственных стандартах и программах для средней школы 1998—2022 гг.»
Датасет представляет собой роспись литературных произведений, вошедших в постсоветские государственные стандарты и программы средней школы по родной литературе, а также в кодификаторы основного и единого государственных экзаменов по литературе — то есть все официальные документы, регламентирующие школьное преподавание русской литературы.
Произведения в таблице снабжены расширенными метаданными: помимо базовых (автор, время создания, жанр) приводятся сведения об обязательности изучения автора и произведения, наличие рекомендации к углубленному изучению, сведения о возможности выбора текстов учащимися.
Вместе с уже опубликованными в Репозитории датасетами Хрестоматии Российской Империи с 1805 по 1912 гг. и Программы по литературе для средней школы с 1919 по 1991 гг. эта публикация формирует цикл, позволяющий изучать становление и трансформацию школьного литературного канона на хронологическом отрезке более чем в 200 лет.
Новые проекты
Лаборатория цифровых исследований русской литературы представляет вашему вниманию два веб-приложения с визуализацией данных: Таймлайн жизни русских писателей и Персоналии в Словаре русских писателей XVIII века.
Новый датасет: Бытование литературных текстов в ГУЛАГе
Лаборатория цифровых исследований литературы и фольклора ИРЛИ РАН. 17 февраля 2023 года
В разделе Библиографические данные Репозитория опубликован новый датасет Бытование литературных текстов в ГУЛАГе.
Группа исследователей НИУ «Высшая школа экономики» обработала крупный общедоступный корпус мемуаров и извлекла из него упоминания литературных произведений, бытовавших в советской пенитенциарной системе в 1917—1991 гг. Каждое упоминание снабжено метаданными: когда, кем, где и при каких обстоятельствах осуществлялась рецитация текста. Широкие хронологические рамки, большой объем вхождений (более 2500 единиц) и подробные метаданные делают этот датасет чрезвычайно интересным и удобным для всего спектра гуманитарных исследований. Наряду с датасетом Программы по литературе для средней школы с 1919 по 1991 гг. эти данные могут служить материалом для изучения процесса трансформации литературного канона в советскую эпоху.
Данные сопровождаются описанием на русском и английском языках.
Новый датасет: Авторы и произведения для детского чтения в критике 1860—1880-х гг.
Раздел репозитория Библиографические данные пополнился датасетом Ольги Лучкиной «Авторы и произведения для детского чтения в критике 1860—1880-х гг.».
Данные представляют собой роспись изданий (фамилии литераторов и названия произведений), упомянутых в критических и педагогических статьях, обзорах, рецензиях и списках, опубликованных на страницах «Журнала Министерства народного просвещения», «Педагогического сборника», «Женского образования» в 1860—1880-х гг. Эти журналы, издаваемые или контролируемые правительственными ведомствами, стали новыми площадками для публичного обсуждения детской литературы, а рекомендательная практика — одним из ранних этапов формирования литературного канона.