Перспективы развития Национальной Службы поддержки форматов RUSMARC.

В. Скворцов, руководитель Национальной Службы развития системы форматов RUSMARC.

В этом году Национальной Службе развития системы форматов RUSMARC, также как и центру ЛИБНЕТ, исполнилось 10 лет. Соответствующий документ был подписан Министерством культуры 20 ноября 2001 года. Но в силу острого дефицита времени, я вынужден отойти от традиционной схемы юбилейного доклада и не стану рассказывать о наших достижениях за прошедший срок. С ними вы можете познакомиться на сайте Национальной Службы по адресу: www.rusmarc.ru. Посещаемость сайта растёт из года в год, причём растёт не только посещаемость, но  и скорость прироста посещений сайта из года в год возрастает. И это на наш взгляд убедительней всего говорит о востребованности нашей деятельности.

Я попытаюсь оценить перспективы развития Национальной Службы в ближайшем будущем. Давайте, прежде всего, посмотрим на каком фоне предполагается осуществлять это развитие.

1.    Международный опыт.

Современные глобальные технологические и концептуальные изменения, в первую очередь развитие INTERNET, в особенности web-технологий, заставляют библиотечное сообщество пересмотреть будущее библиографического контроля, включая будущее коммуникативных форматов MARC.

В частности, специальная рабочая группа, созданная по инициативе Библиотеки Конгресса, цель работы которой обозначена в её названии: Будущее библиографического контроля, сделала заключение о том, что форматы MARC21 – а значит и все форматы семейства MARC - больше не соответствуют тем задачам, которые призваны были решать, а именно: служить носителями библиографической информации, способными вмещать  полную область данных, представляющих интерес для библиотек, и способствовать обмену такими данными, как внутри библиотечного сообщества, так и со взаимосвязанными сообществами.

Ещё один важнейший побудительный мотив для пересмотра существующего библиографического окружения - это серьёзные бюджетные ограничения, которые испытывают библиотеки и информационные центры всего мира. В этих условиях многие организации вынуждены упрощать стандарты качества библиографических данных, поскольку от них требуют расширения сервисов, особенно в отношении цифровых данных. Эффективность в создании и разделении ресурсов становится, следовательно, обязательной: производители информации должны пересмотреть то, как они используют свои небогатые финансовые ресурсы, и это касается как отдельных организаций, так и всего библиотечного сообщества в целом. 

В самом общем плане можно выделить три основные тенденции пересмотра библиографического концептуального окружения:

первая – это разработка новых моделей организации данных, призванных обеспечить пользователям навигацию по взаимосвязям между сущностями, такими как персоналии, географические объекты, организации и понятия, - для осуществления более точного поиска в библиотечных каталогах и во внешнем Интернете.

Вторая – это разработка специальных средств интеграции библиотечных ресурсов в web-пространство.

И третья тенденция - это развитие средств семантического Webа,  с целью обеспечить максимальное использование существующих метаданных в расширенном Web-овском поисковом окружении так, чтобы конечные пользователи могли обращаться к более качественным метаданным и/или использовать их по-новому.

Кажется, что по существу третья тенденция не сильно отличается от второй, однако мы нашли нужным выделить её, поскольку она выражает совершенно новый уровень кооперации, когда библиотечные сотрудники работают совместно с IT-специалистами на высшем уровне современных информационных технологий. В данном случае речь идёт о работе совместно с консорциумом World Wide Web.

Первой тенденции обязаны своим рождением Функциональные требования к библиографическим записям (Functional Requirements for Bibliographic Records или FRBR) – модель иерархической взаимосвязи сущностей, продвигаемая IFLA.

В 2010 году три национальные библиотеки Соединённых Штатов (Библиотека Конгресса, Национальная Медицинская библиотека и Национальная Сельскохозяйственная библиотека) организовали проведение на национальном уровне тестирования RDA (Resource Description and Access) – набора инструкций по реализации FRBR, призванного заменить действующие ныне Англо-Американские правила каталогизации (AACR2). По результатам тестирования, опубликованным 13 июня 2011 года, рекомендовано начать пробное внедрение RDA в этих трёх национальных библиотеках с января 2013 года, проведя необходимую подготовительную работу.
 

Что касается второй тенденции, т.е. развития XML форматов для библиографических и связанных с ними данных, то более новые [по сравнению с MARCформатом] структуры, такие как активно внедряемый XML (eXtensible Markup Language), имеют почти безграничные возможности в части определения тегов полей и делают, например, возможным создание вполне, или интуитивно, понятных тегов. К тому же XML инструменты не только хорошо продуманы, но и продолжают развиваться быстрыми темпами, в частности, вспомогательные XML стандарты, поддерживающие XML окружение, такие как XSLT (eXtensible Styleshit Language Transformation), обеспечивающий возможность конверсии между различными XML схемами данных и XML Query (XQuery), дающий действенный метод поиска информации в XML данных.
Также в последние годы была разработана альтернативная форматная структура
MARCXML – и её развитие MarcXchange и ISO 25 577 – являющиеся простой трансформацией стандарта ISO 2709 в XML структуру, но сохраняющие в неприкосновенности MARC- овские теги.   

Нельзя не упомянуть также известный уже довольно давно и широко используемый XML-формат представления и передачи данных Dublin Core.

Ещё одно направление внедрения XML в деятельность библиотек - это развитие MODS (Metadata Object Description Schema) и MADS (Metadata Authority Description Schema) – XML схемы, абсолютно совместимые с MARC-овскими библиографическими и авторитетными данными, но имеющие более простые с точки зрения восприятия словесно-ориентированные теги. Развитие этих схем вызвано также некоторыми организационными нуждами, направленными на расширение области применения и связей библиографических данных сегодня. Это попытка преодолеть ограничения в определении MARC-овских тегов и организации данных в MARC-записи, при сохранении возможности работы с насыщенными библиографическими данными, которые к тому же существуют в современном техническом окружении. Отчасти в ответ на давление библиотечных администраций в последнее десятилетие (финансовые ограничения и оперативность) MODS намеренно избегает подробной простановки тегов и некоторой чрезмерности MARC-овских записей.

Как MARCXML, так и MODS развивались отчасти для того, чтобы синхронизировать MARC-овские записи с такими коммуникационными протоколами, как SRU (Search and Retrive via URL) и OAI, и такими форматами, как METS (Metadata Encoding and Transfer Standard), для которых данные в XML являются либо предпочтительными, либо вовсе необходимыми.

Необходимо обратить внимание на развитие сравнительно нового протокола OAI, как в версии OAI-PMH (протокол сбора метаданных), так и в версии OAI-ORE (находящийся в стадии разработки протокол сбора данных о Web-ресурсах).

Протокол OAI продвигается специально созданным OAI Technical Committee, в состав которого входят в частности представители Библиотеки Конгресса, Британской библиотеки, CERN, OCLC, различных университетов Соединённых Штатов Америки, а также ряд европейских представителей.

     Наиболее значительным примером внедрения OAI-PMH в Европе является Европейская электронная библиотека (TEL).

    

     Третья тенденция – развитие семантического Webа, т.е. предоставление через Интернет специальным образом отформатированных смысловых данных, так, что они становятся пригодными для компьютерной обработки.

     В более узком смысле – это проект консорциума W3С, цель которого определить стандартные пути выражения взаимосвязи между Web-страницами, так чтобы позволить машинам понимать значение взаимосвязанной информации.

Библиотека Конгресса объявила о начале экспериментов с семантическим Webом в рамках инициативы по пересмотру библиографического концептуального окружения, о чём сделано соответствующее заявление в мае этого года. В частности ведутся работы по внедрению словарей Библиотеки Конгресса в качестве stable and trust словарей семантического webа.

 

2.    Отражение рассматриваемых тенденций в России.

 

Первая тенденция: принципы FRBR нашли своё отражение в новых Российских Правилах каталогизации главным образом в части терминологии и анализа структур библиографических записей. Что касается RDA, библиотечное сообщество находится в ожидании результатов экспериментов трёх американских национальных библиотек.

Однако наличие инструментов, способных перевести решение проблемы из области теоретических рассуждений в предметное исследование, позволило бы российским библиотекарям сформировать свою точку зрения на пути и способы внедрения принципов FRBR в практику каталогизации.

Достаточно остро стоит задача оптимальной организации больших многосвязных массивов данных, таких, как СКБР, и в этой связи одной из первоочередных мер представляется построение или обоснованный выбор моделей внедрения принципов FRBR (таких, например, как RDA), разработка инструментария их реализации, анализ работоспособности и предложение готовых решений для внедрения в стране.

 

Вторая тенденция:

В мае 2010 года на конференции РБА Национальная Служба развития системы форматов RUSMARC озвучила своё предложение по организации новой технологии работы с нормативной документацией, когда требуемые стандартные параметры загружаются  в автоматизированные системы прямо из нормативного документа, размещённого на сайте той организации, которая данный документ разработала. Мы предлагали и предлагаем осуществить схему такого взаимодействия на примере RUSMARC/XML. При этом может быть разработан и стандартный инструментарий для обработки записей в формате RUSMARC  и представления текста формата в различных средах.

Гораздо скромнее подвижки по внедрению в стране протокола OAI. На базе протокола OAI-PMH реализовано и проходит апробацию взаимодействие между Российской национальной библиотекой и Центром ЛИБНЕТ. Национальной Службой развития системы форматов RUSMARC подготовлено техническое задание для объединения распределённых полнотекстовых ресурсов в рамках НЭБ.

В части разработки новых библиотечных IT стандартов, Национальной Службой развития системы форматов RUSMARC создана тонкая XML (UniSlim) - схема, учитывающая встроенные поля и предлагаемая ныне в качестве новой версии стандарта ISO 25 577.
Однако отсутствие представителя России в техническом комитете 46
ISO (Information and documentation), занимающимся главным образом, как раз, IT стандартами, относящимися к библиотекам, информационным центрам, архивам, музеям, - говорит о том, что в России этому направлению не уделяется должного внимания.

Третья тенденция: работы консорциума W3C по  созданию семантического Webа и нового, следовательно, внедрения библиографической информации непосредственно в web-пространство, пока лежат вообще вне поля зрения российских библиотекарей, в отличие от наших коллег из Библиотеки Конгресса.

Важнейший вопрос, связанный с развитием структур Linking Data и семантического webа – как перевести огромные массивы данных, существующие ныне в MARC-форматах в элементы семантического webа.

Вообще, возникновение различных схем представления данных безусловно диктует необходимость указания правил переноса данных из одной структуры в другую.

В своём докладе я постарался отразить мощнейший пласт актуальных задач, ныне активно разрабатываемый за рубежом и почти нетронутый в России.

Достаточно очевидно, что библиографическое сообщество с достаточно высокой частотой генерирует качественно новые стандарты, целый пласт таких стандартов, которые с одной стороны являются IT-стандартами, с другой они – чисто библиографические.

И здесь огромное поле для деятельности Национальной Службы развития системы форматов RUSMARC. У нас есть уже определённый опыт работы в означенной сфере, у нас есть, или мы знаем, где найти специалистов в выделенной тематике, и при определённой поддержке, в сотрудничестве и координации с другими организациями, имеющими схожий опыт, работа Национальный Службы может быть переведена на качественно новый уровень, соответствующий требованиям сегодняшнего – да и завтрашнего – дня.

С другой стороны, нужно понимать, что и MARC-форматы не умрут немедленно и одномоментно. Колоссальная информация, накопленная в этих форматах будет существовать и накапливаться ещё долгое время параллельно с более новыми структурами. А значит и развиваться они должны в необходимой части параллельно с этими структурами.

Результатом работы Службы может являться, как и прежде, нормативная документация, в части форматов RUSMARC, а также, методические рекомендации и, в необходимых случаях, логические схемы, функциональные требования, технические задания и даже готовые программные решения, направленные на адаптацию библиотечных  процессов в современной информационной среде и развитию необходимых сервисов.

В заключение я хотел бы вернуться к юбилейной части своего доклада и выразить признательность Министерству культуры Российской Федерации и центру ЛИБНЕТ за многолетнюю и постоянную поддержку деятельности Службы. Эта поддержка всегда была очень значимой для нас, а в нынешних условиях она приобрела буквально решающее значение.