13 декабря в Штабе «Космопоиска» (Москва) А.Б. Петухов прочитал следующий доклад на тему Уфологических Баз Данных (публикуется с небольшими сокращениями):
ОСНОВНЫЕ ПРИНЦИПЫ
ФОРМИРОВАНИЯ УФОЛОГИЧЕСКИХ БАЗ ДАННЫХ
А. Петухов
В последнее время на нашем сайте появилось достаточно много разноплановой информации и мнений о создании Единой уфологической базы данных (БД) для Космопоиска. В обсуждении вопроса о БД участвовали и москвичи, и группы из Латвии и Беларуси, Украины и т.д. Это хорошо потому, что такое многообразие отзывов говорит о говорит об интернациональности Космопоиска, о понимании единства наших задач. Встречались на сайте взвешенные, продуманные подходы и мнения, но было и иное. Особо меня насторожила позиция Беларуси, а именно мнение координатора Беларуси, Линника по Базам данных:
«Господа Россияне. Создание базы данных (при умном её построении, что всё же было достигнуто) является единственным шагом к серьёзному анализу, систематизации и совмещении доселе разнообразных аномалий. На данный момент вынужден признать, что Россия выражает слабую инициативу в реализации данного проекта. По крайней мере, именно такое впечатление создаётся с первого взгляда. Тем не менее, Беларусь уже приступила к разработке опытного образца базы данных, поиск в которой будет осуществляется по принципу ключевых слов.» И далее: «Может кому не понравится, но следует признать, что контакты первого рода наблюдения НЛО в базу фиксироваться не будут, поскольку целью её создания является систематизация аномальных явлений, о которых известен хотя бы минимум информации. А классификация НЛО - это уже цель других баз.»
Попытку притормозить мнение Руслана Линника предпринял его коллега Илья Бутов: «Понимаешь еще в чем фишка, Руслан. Ну, посуди сам - если выбросить все случаи, как ты выражаешься, и "наблюдения НЛО" в базу не вносить, сколько у нас останется случаев? В самом лучшем случае, если взять все-при-все случаи, для себя я их количество определяю равным 1000. А теперь посуди сам, сколько работы в России? Украинская база вообще состоит из одних НЛО... Мое мнение однозначное - вносить в базу нужно все случаи, это, во-первых. Во вторых, честно сказать, не совсем понимаю, куда нам торопиться? Дождаться этих результатов – это, наверное, правильный поступок. А то не успеваю опомниться, как концепция базы меняется! Нужно ориентироваться не на Белорусов, а на Россиян».
Безусловно, такая позиция Линника, и мне представляется неоправданно поспешной, но он, к сожалению, не одинок в своей шапкозакидательской позиции. Но все же критика коллег повлияла на мнение Руслана. Через несколько дней он меняет свое мнение на противоположное и пишет на сайте следующее: «То же и на счёт НЛО. Я понял, что их вносить стоит. Но не стоит забывать, что мы учёные, а не шайка сектантов-любителей. База данных делается для результата, а не для того, чтобы впихнуть туда как можно больше и сказать - а у нас в огороде миллион случаев барабашек». Если это на самом деле так, то я рад за Руслана.
Тем не менее, дискуссия на сайте по поводу БД показывает очень широкий разброс мнений. Поэтому я хочу особо подчеркнуть, что речь пойдет, прежде всего, именно об основных принципах формирования уфологической базы данных, а не об ее компьютерном воплощении. Что касается компьютерного воплощения, то в этом вопросе Маркони совершенно прав, что, прежде всего, надо со всеми техническими деталями сделать грамотное техническое задание, то есть некую «печку», от которой программисты будут «танцевать» при ее физическом, вернее, виртуальном создании. Вот тогда, может, пригодятся мои наработки в части ключевых слов, установление связей между ними и другие специальные вопросы. Материалы эти я готов предоставить и готов их обсуждать.
Прежде всего, хотелось бы еще раз отметить, что прежний подход Руслана Линника, напоминает попытку взять штурмом открытые ворота. Дело в том, что первичная БД уже создана В. Чернобровом и продолжает пополняться. В настоящее время этим занимается в программе «Microsoft Word» член отряда «Сталкер» Ирина Кондеева. И насчитывает эта БД уже более 2000 единиц первичных сообщений. Поэтому любая попытка перебивки этой БД в другой стиль или формат чревата накоплением ошибок. Тем более, что Вадим никогда не сидел верхом на своих сообщениях, как большинство уфологов. Часть сообщений он уже опубликовал. Остальное он готов свою БД предоставить в качестве основы для дальнейшей работы. В эту базу будут в этом же формате и стиле добавляться другие сообщения. Согласитесь, подкорректировать «шапку» сообщений в нескольких десятков единиц в региональных группах и добавить их в уже существующую БД проще и легче (в виду их меньшей численности), чем переделывать большую БД Черноброва. Это, так сказать, общий подход, общая концепция, с чего надо начинать.
Но что, собственно является базой данных. Классическое определение таково:
Под базой данных понимается некоторая унифицированная совокупность данных, совместно используемая персоналом/населением группой, предприятия, региона, страны, мира... Задача базы данных состоит в хранении всех представляющих интерес данных в одном или нескольких местах, причем таким способом, который заведомо исключает ненужную избыточность. В хорошо спроектированной базе данных избыточность данных исключается, и вероятность сохранения противоречивых данных минимизируется. Таким образом, создание баз данных преследует две основные цели: понизить избыточность данных и повысить их надежность.
В части стоящих перед нами, исследователями аномальных явлений задач, это определение нуждается в некоторых уточнениях. Прежде всего, в части требований к избыточности информации. Не смотря на все имеющиеся гипотезы о генезисе НЛО, они остаются только предположениями. Поэтому мы обязаны создавать БД, ориентированную на некоторую избыточность информации. Это требование справедливо потому, что мы до сих пор не знаем, какую информацию нужно считать избыточной и ненужной. Для нас необходима вся информация. Упомянутый Линник из Беларуси, первоначально хотел, выкинув все наблюдательные данные, составить свою БД, включив туда и приведения, и полтергейсты и другие аномальные явления, на первый взгляд, не имеющих отношения к НЛО. Однако, на мой взгляд, такое решение слишком поспешно, поскольку в настоящий момент мы не знаем внутренние связи между этими явлениями. Они могут иметь место, а могут и нет. С другой стороны, может и следует создавать различные БД по разным категориям АЯ, но при условии, что эти БД будут унифицированы, и их легко можно будет подгружать к уфологическим БД.
Другими обязательными требованиями к Базе данных является то, что она:
• Удовлетворяет всем требованиям пользователей по ее содержимому Поэтому перед проектированием базы необходимо провести обширные исследования требований пользователей к функционированию этой базы данных.
• Гарантирует непротиворечивость и целостность данных. При проектировании таблиц нужно определить их атрибуты и некоторые правила, ограничивающие возможность ввода пользователем неверных значений. Для верификации данных ( т.е. их проверки) перед непосредственной записью их в таблицу база данных должна осуществлять вызов правил модели данных и тем самым гарантировать сохранение целостности информации.
• Обеспечивает естественное, легкое для восприятия структурирование информации. Качественное построение базы позволяет делать запросы к базе более “прозрачными” и легкими для понимания; следовательно, снижается вероятность внесения некорректных данных и улучшается качество сопровождения базы.
• Удовлетворяет требованиям пользователей к производительности базы данных. При больших объемах информации вопросы сохранения производительности начинают играть главную роль, сразу “высвечивая” все недочеты этапа проектирования.
Кроме того, не следует забывать, что в уфологической практике уже существует уже опыт, в т.ч. и зарубежный, который апробирован и полностью себя оправдал. Речь идет об опыте работы французской группы по изучению аномальных аэрокосмических явлений при национальном центре космических исследований в Тулузе– GEPAN. Об этом чуть ниже.
Прежде, чем заниматься базой данных, необходимо подумать о том, чем мы ее будем наполнять. В настоящее время почти все группы Космопоиска заняты формированием Массива первичных сообщений (МПС), то есть сбором информации.
Формирование Массива Первичных Сообщений, характеризуется, как правило, постепенным накоплением количества первичных сообщений. Обычно серьезный МПС характеризуется сотнями и тысячами первичных сообщений. Первичные сообщения в МПС могут располагаться по нарастающим номерам, в хронологическом, географическом или другом порядке.
ОСОБЕННОСТИ ФОРМИРОВАНИЯ МАССИВА ПЕРВИЧНЫХ ДОКУМЕНТОВ О НАБЛЮДЕНИИ (ПРОЯВЛЕНИИ) НЛО(АЯ)
Перед формированием МПС, документы с фактологическим содержанием, в которых изложено несколько случаев наблюдения НЛО(АЯ), разбиваются на этапе копирования на отдельные фрагменты, содержащие сведения только об одном наблюдении. В МПС должны входить все фактологические сообщения, независимо от содержания. При вводе текста сообщения с письма очевидца в компьютерную базу данных нельзя искажать текст, то есть печатать его так, как это попроще и по удобней. Текст вводится таким образом, как написал его очевидец. Допускается только исправление грамматических ошибок, но не стилистики, которая, сама по себе, может являться предметом исследования для психологов. Кроме того, исследования стилистики могут подсказать нам, имеем ли мы дело с нормальным человеком или психически неуравновешенным или больным.
Дальнейшая работа с МПС связана с составлением предварительного каталога – ПК и Рабочего каталога – РК, и требует особой процедуры. Каждый из перечисленных массивов может служить самостоятельным предметом исследований.
ОСОБЕННОСТИ ФОРМИРОВАНИЯ ПРЕДВАРИТЕЛЬНОГО КАТАЛОГА
Формирование ПК представляет собой логическое продолжение работы с МПС и проводится, соответственно, на его базе. ПК включает в себя документы также только с фактологическим содержанием.
Не исключено, что один и тот же очевидец может прислать дополнительные подробности или уточнения по ранее сделанному наблюдению. Возможен вариант, в котором группа независимых и не связанных между собой наблюдателей может выслать сообщения об одном конкретном наблюдении НЛО(АЯ). Такие первичные документы на этапе формирования ПК систематизируются и сортируются по датам, времени и месту наблюдения. Совокупность совпадений первичных документов по этим параметрам и образует случай. В свою очередь, совокупность случаев составляет собственно предварительный каталог случаев - ПК.
ОСОБЕННОСТИ ФОРМИРОВАНИЯ РАБОЧЕГО КАТАЛОГА РК-1
Дальнейший этап – формирование РК – связан с анализом случаев и их идентификацией с известными природными и техногенными явлениями. Для этой цели целесообразно использовать опыт классификации случаев (по категориями A, B, C, D), принятый и апробированный французской группой по изучению аномальных аэрокосмических явлений при национальном центре космических исследований – GEPAN:
Категория А – случаи, которые удалось надежно отождествить с известными природными и техногенными объектами и явлениями.
Категория В – случаи, которые не удалось надежно отождествить с известными природными и техногенными объектами и явлениями, но, вероятно, это можно было бы сделать при наличии более полных и точных данных об изучаемом явлении (объекте).
Категория С – случаи, о которых нельзя сказать ничего определенного из-за отсутствия информации или неясности данных.
Категория D – случаи, по которым имеется полная, детальная и исчерпывающая информация, но на ее основании и в рамках имеющихся знаний невозможно отождествить изучаемое явление (объект) с известными природными и техногенными явлениями (объектами).
Совокупность случаев Категории D, т.е. ИСТИННЫХ НЛО, и образует РК.
Хочу особо подчеркнуть, что при идентификации случаев наблюдения объектов по категории «D» нельзя только уповать на их несхожесть с техногенными причинами (запуски ИСЗ, эксперименты в высоких слоях атмосферы и т.п.. Необходимо учитывать и ошибки наблюдателя и особенности его восприятия. Другими словами, подход «похоже – непохоже» тут не пригоден. Необходим строгий и тщательный анализ любого сообщения, являющегося кандидатом в категорию «D».
Целесообразно проводить формирование РК в две стадии. На первой стадии силами экспертов Космопоиска проводится вся подготовительная работа по
идентификации сообщений и завершается созданием РК-1. Именно предварительная.
Хотелось бы, что мы, представители общественной организации, четко понимали, что на нашем современном уровне, не вся информация по идентификации, на основе которой можно сделать 100-% вывод к какой категории можно отнести тот или иной объект, нам доступна. Например, при проведении идентификации, наши эксперты из Космопоиска, вооружившись таблицами запусков ИСЗ, могут с высокой степенью точности определить, видел ли очевидец запуск спутника или что-то другое. Наши эксперты (астрономы) могут подсказать, мог ли объект, наблюдаемый в темное время суток, быть звездой или планетой. И так далее. С другой стороны, надо отчетливо признавать, что мы, далеко не всегда можем идентифицировать технические эксперименты в высоких слоях атмосферы или секретные запуски стратегических или баллистических ракет, осуществляемых военными. Поэтому каталог РК-1 может содержать определенный процент ложных сообщений о наблюдении НЛО(АЯ), то есть ошибочно отнесенных к категории D. Сформированный таким образом РК-1, должен передаваться (в идеальном случае) для проведения окончательного анализа и составления РК-2 профессиональным экспертам.
Поэтому, опять же в идеале, окончательный анализ и отбор случаев для формирования РК-2 требует привлечения профессиональных экспертов. По идее, этот анализ профессиональными экспертами в полном объеме должен проводиться в рамках какой-либо специализированной официальной организации, имеющей доступ к засекреченным пускам ракетно-космической техники и другим явления, которые могут неподготовленными очевидцами приниматься за НЛО. Но это дело будущего.
Собственно говоря, окончательный каталог РК, содержащий наблюдения по категории «D», и должна обслуживать база данных. В противном случае, если мы запихнем в базу данных все сообщения из МПС, то мы будем сами себя водить за нос, поскольку среди нормальной рабочей информации наверняка окажутся и запуски ИСЗ, и шаровые молнии, и технические эксперименты в космическом пространстве. А мы, при этом будем гордиться объемом такой БД, в которой, на самом деле, будет изрядное количество информационного «шума», то есть ложной, по отношению к категории «D», информации. Вот этого и не понимают молодые люди, недавно пришедшие в уфологию. Они считают, что раз уж сообщение попало к ним в руки, то оно наверняка подлинное и без всяких подробных экспертиз причисляют его к категории «D». И на этом основании стремятся побыстрее сколотить БД.
Остается добавить, что сами каталоги – МПС, ПК, РК-1, РК-2 могут служить самостоятельным предметом исследований (психологический, социальный и иных характеристик наблюдателей).
Я думаю понятно, что только на базе каталога РК, то есть работая с категорией сообщений группы «D», имеет смысл проводить любые статистические исследования, связанные с физическими, временными и иными характеристиками НЛО. Но это тема отдельного разговора, и, отнюдь, не вследствие особой секретности этих работ, а по причине специфики этих работ, когда обсуждаются вопросы кодирования информации и методы ее анализа.
Картинка
Здесь была слишком широкая картинка. Я заменил ее гиперссылкой, а то читать не возможно. Neir0mancer.