GeologyScience.ru

О проекте

ПРОЕКТ ГОСУДАРСТВЕННОГО ГЕОЛОГИЧЕСКОГО МУЗЕЯ ИМ В.И.ВЕРНАДСКОГО РАН (ГГМ РАН)
«РАЗРАБОТКА ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ ГЕОЛОГИЧЕСКОЙ СРЕДЫ ДЛЯ ПОДДЕРЖКИ НАУЧНЫХ ИССЛЕДОВАНИЙ
GEOLOGYSCIENCE.RU»

В 2014-2017 г. авторами проводились работы по проектированию и реализации первой версии Интернет – инфраструктуры для поддержки и сопровождения научных геологических исследований на Дальнем Востоке России.

Основная цель данного Проекта, который начат в 2018 г.,  заключается в организации единой очки доступа к геологическим данным на территорию России и системам их обработки с использованием возможностей поиска данных в территориально распределенных разнородных источниках, а также с использованием территориально-распределенных вычислительно-аналитических узлов для обработки данных, взаимодействие с которыми осуществляется с использованием технологии web-сервисов. Интеграция разнотипных геологических данных и сервисов обработки в единую информационно-аналитическую среду на основе единых политик обеспечивает возможность комплексного анализа информации и позволит получать качественно новые знания о геологических объектах.

В основе предложенного подхода лежит слабосвязанная блочная инфраструктура, основанная на различии в типах геологических данных: пространственных, количественных, библиографических и основанных на экспертных знаниях. В каждом отдельном информационном блоке Среды для интеграции, хранения и поиска данных применяются различные подходы и технологические решения.

Сформулированы основные требования для организации Среды:

  • Доступ к информационным ресурсам на основе международных стандартов и единых политиках;
  • Сквозной поиск информации в Среде как на логическом, так и на физическом уровне;
  • Организация мониторинга территориально распределенных источников данных и вычислительных узлов, а также основных узлов Среды;
  • Поддержка сквозной авторизации и разграничения прав.

На рисунке 1 представлена обобщенная схема Информационно-аналитической геологической среды.  Среда содержит 2 основных уровня: информационный и вычислительный.

Рисунок 1 – Обобщенная функциональная схема Информационно-аналитической геологической среды

Информационный уровень Среды

Среда представляет собой единую точку доступа к разнотипным геологическим данным по территории России, включая пространственные, спутниковые, количественные, музейные данные, научные публикации и т.д.:

  • Блок пространственных данных https://geologyscience.ru/spatial_information – доступ к Государственным геологическим картам по территории Российской федерации на основе данных Всероссийского научно-исследовательского геологического института им. А.П. Карпинского. Для поиска и получения доступны геологические карты масштаба 1:1 000 000 и метаданные геологических карт масштаба 1: 200 000.
  • Блок количественных данных https://geologyscience.ru/quantitative_data – доступ к базам количественных данных;
  • Блок музейных данных http://data.sgm.ru – доступ к данные мировых музеев естественной истории по территории РФ, включая данные Государственного геологического музея им. В.И. Вернадского РАН;
  • Блок спутниковых данных http://sputnik.geologyscience.ru – унифицированный доступ к данным спутниковых платформ Aqua, Terra, Landsat, Orbview-3 и другим данным среднего и высокого пространственного разрешения. Основные источники спутниковых данных: информационные системы ИАПУ ДВО РАН, USGS и NASA;
  • Блок научных публикаций http://repository.geologyscience.ru – доступ к научным публикациям по тематике “Науки о Земле” (геология, геохимия, петрология, минералогия, тектоника, геоморфология, вулканология, палеонтология и т.д.);
  • Блок геологических БД https://geologyscience.ru/bd_rosnedra – доступ к государственным геологическим базам данных. Доступ к метаданным по месторождениям и геологическим отчётам базы данных ОАО “Роснедра”;
  • Блок тематических БД https://geologyscience.ru/thematicdb – доступ к информации из различных тематических БД по геологии;
  • Конференции https://geologyscience.ru/conferences – доступ к сайтам Конференций ГГМ РАН “Современные информационные технологии для научных исследований в области наук о Земле”;
  • Медиа-блок https://geologyscience.ru/media – доступ к медиа ресурсам;
  • Энциклопедия https://geologyscience.ru/expert_data – Wiki –педия по геологии РФ;
  • Геологи РФ https://geologyscience.ru/geologists – информация о выдающихся геологах РФ;
  • Новости https://geologyscience.ru .

Вычислительная-аналитическая блок Среды – облачный инструментарий пользователей для обработки различных типов геологических данных. Предложенный при построении подход предполагает использование внешних вычислительных узлов для обработки данных, взаимодействие с которыми осуществляется с использованием технологии web-сервисов, в частности OGC Web Processing Service.

В настоящее время Вычислительно-аналитическая геологическая среда включает в себя следующие узлы обработки:

  • Многомерные методы анализа данных. Включает в себя набор методов для многомерного анализа количественных данных, таких как факторный анализ, кластерный анализ, регрессионный анализ и т.д. Узел разработан и поддерживается в Государственном геологическом музее им. В.И.Вернадского РАН.
  • Обработка спутниковых данных. Включает в себя методы первичной обработки спутниковых данных, такие как калибровка и пространственная привязка спутниковых данных.
  • Обработка петролого-геохимических данных. В Институте Физики Земли РАН разработана интерактивная база методов обработки петролого-геохимических данных. Система предоставляет сервисы построения спайдерграмм, гистограмм и классификационных диаграмм; сервис идентификации минералов по их химическому составу; сервис интерпретации состава минерала и разложение на миналы и т.д.
  • Структурный анализ публикаций. В междисциплинарном центре математического и вычислительного моделирования (Университет Варшавы, Польша) разработан сервис для извлечения метаданных из научных публикаций. Метаданные включают в себя авторов, принадлежность организации, абстракт, ключевые слова, название журнала, объем, год выпуска, разобранные библиографические ссылки, структуру разделов документа, заголовки разделов и абзацы.
  • Обработка естественного языка. В Университете Шеффилда в рамках проекта GATE (General Architecture for Text Engineering) разработан ряд сервисов по обработке текстовых данных для различных языков. Для обработки текстовых данных на русском языке предоставляются сервисы по определению частей речи слов, а также выделению именованных сущностей, таких как имена и фамилии, названия организаций, географические названия, даты, денежные единицы и т. Д

Использованные подходы и модульная архитектура при проектировании Информационно-аналитической геологической среды позволяют трансформировать ее в Единое цифровое пространство научных геологических знаний для решения широкого круга задач для наук о Земле (рисунок 2). А простота использования и гибкость персональной настройки под определённые задачи позволит привлечь к её использованию широкий круг учёных-исследователей. Для этого предполагается разработать систему тематических рабочих пространств, сочетающих в себе необходимые инструменты, алгоритмы, источники данных для решения тех или иных прикладных задач.

Рисунок 2 — Концептуальная схема Единого цифрового пространства научных геологических знаний, созданная на базовой основе Информационно-вычислительной геологической среды по поддержке научных исследований

Работы выполнялись в рамках Государственного задания ГГМ РАН по Теме № 0140-2019-0005 «Разработка информационной среды интеграции данных естественнонаучных музеев и сервисов их обработки для наук о Земле».

 

Исполнители:

Наумова В.В., руководитель работ
Еременко А.С., к.т.н.
Ерёменко В.С.
Загумённов А.А.
Патук М.И., к.г.-м.н.

Контакт

Государственный геологический музей им. В.И.Вернадского РАН
125009, г.Москва, ул. Моховая, д.11, стр.11
Наумова В.В., зав. Научным отделом ГГМ РАН, г.н.с., д.г.-м.н.
E-mail: v.naumova@sgm.ru