Списки выбора в базе данных “Пам’ятки України”
М.В.Панченко
Структурный элемент типа списка выбора постоянно сопутствует работе пользователя практически в любой из прикладных программ. Столь интенсивное его применение продиктовано вполне очевидной необходимостью автоматического отбора некоей, актуальной на текущий момент информации. Эти списки могут иметь сложное иерархическое строение, что обусловлено наличием взаимоподчиненных понятий, объединяемых в логические группы. Подчиненные группы (далее используется термин “уровни”) обычно невидимы для пользователя до раскрытия списка. В сущности, схеме списка выбора соответствует и простой перечень предлагаемых к исполнению сервисных команд (рис. 1):
В данном же случае, подробней будет рассматриваться тот тип списков (или индексированных словарей), которые занимают особое место в специализированных БД, т.к. предлагаемые ими значения служат критериями для отбора хранящихся данных. Обычно они тесно связаны с предметной областью, которая и определяет их количество, внутреннее строение и лексикон. Способы решения этих задач вариабельны, а часто и дискуссионны, особенно при проектировании систем, обслуживающих отрасли с неустоявшимся классификационным и терминологическим аппаратом. Последнее более чем характерно и для предметной области БД “Пам’ятки України”. Разумеется, некоторые из задействованных в ней списков имеют вполне очевидное содержание, следуя за исторически сложившейся исследовательской традицией. Таков, например, словарь основных хронологических этапов, определяющих, помимо прочего, специализацию внутри отрасли. Собственно, ориентиентируясь на последнее и была предложена возможность подобного отбора, позволяющего сократить объем обрабатываемой информации до интересующего исследователя уровня (здесь – до эпохи). На данной стадии вполне достаточным является использование общепринятого деления на ранний (нижний) и поздний (верхний) палеолит, мезолит, неолит, энеолит, эпоху бронзы, эпоху античности и раннего железного века и, наконец, раннего, развитого [вместо термина “развитое средневековье” рядом специалистов предложено обозначение “древнерусский период”] и позднего средневековья (при необходимости – с более дробным традиционным делением внутри перечисленных групп).
Еще один список выбора, который следует упомянуть, составляют типы зафиксированных в базе памятников. По поводу его назначения (а, соответственно и структуры) возникло два существенно отличных мнения. В первом случае, отстаивалась необходимость деления объектов на памятники истории, археологии, искусства, архитектуры и градостроительства и т.д., то есть – на категории, нашедшие отражение в официальной административной документации [предложение о сохранении такого деления прозвучало и в поправках отдела охраны памятников МКМУ к проекту Закона об охране историко-культурного наследия] и призванные нести собственно памятникоохранную нагрузку. Во втором случае, предлагалось сориентировать словарь на нужды специализированного исследовательского отбора. Здесь необходимо отметить, что оба подхода не являются взаимоисключающими, поскольку программа обеспечивает возможность двойной (и более) ссылки, что формально позволяет объединить категории обоих видов в рамках одного списка. Целесообразнее, однако, сделать первый список самостоятельным, добавив в качестве вложенного уровня еще и статусы охраны. Состав второго списка еще требует своего уточнения, но можно считать очевидным, что он должен иметь иерархическую, ступенчатую структуру, охватывая различные виды поселений и других мест проживания [необходимо выработать обобщающий термин для городищ, открытых поселений, селищ, стоянок и других памятников, определяемых как точки компактного (временого или стационарного) проживания, характеризуемые наличием культурного слоя, объектов внутренней структуры и т.д. На этом этапе используется термин “места проживания”, понимаемый как неидентичный широкой зоне (территории, ареалу) обитания древних обществ], типы погребальных памятников, памятники архитектуры и фортификационные сооружения (не входящие в качестве структурного элемента в состав других объектов), самостоятельно рассматриваемые объекты производственного назначения, местонахождения (т.е. места фиксации единичных и спорадических находок) и, возможно, виды мемориальных зон, ландшафтных памятников и других охраняемых территорий. Глубина соподчинения внутри перечисленных групп требует взвешенного подхода, во избежание излишней, затрудняющей пользование детализации и дублирования задач, обслуживаемых другими словарями. Например, деление погребальных памятников на ингумационные и кремационные лучше проводить в другой структуре, среди признаков, определяющих обрядность, а не тип памятника как таковой. Здесь мы касаемся аспекта, благодаря которому рассматриеваемый список заслуживает особого внимания, а именно – значительного влияния, которое он оказывает на форму пользования уже на этапе наполнения базы. Действительно, каждый тип памятника имеет собственную специфику описания; таким образом, избрав одно из предлагаемых значений, пользователь должен получить адаптированный под задачу бланк заполнения, имеющий наряду с общеупотребимыми и специальные поля (а также собственную панель стандартных команд, внутренние списки выбора и т.д.).
Противоположную ситуацию можно наблюдать со списками, обслуживающими географические объекты. По своей природе они имеют жесткую структуру, стандартную для каждого типа памятников. Собственно, памятник как таковой должен иметь свой географический “адрес”, фиксируемый в базе поэтапным избранием нужной позиции в “древовидном” списке выбора [подробней структура и семантика связей географических объектов рассмотрена в опубликованной в данном сборнике статье Н.И.Жарких “Нерухомі пам’ятки України : об’єктний аналіз предметної області”]. Для административной привязки он соответствует официальному административному делению, для гидрографической – структуре бассейнов главных рек – от водоема вблизи которого находится памятник до основной реки впадения. Во втором случае словарь должен иметь специфичную черту – возможность вспомогательного бинарного выбора, уточняющего, правый или левый берег (приток) имелся ввиду.
Самоочевидное содержание имеют словари археологических культур и этнических названий. Их внутреннее строение несколько отлично – если для первого из них лучше ограничиться одним уровнем [преемственность в происхождении некоторых культур в списке отражать не обязательно, т.к. это не несет поисковой нагрузки; критерием поиска и отбора данных может являться какая-либо определенная культура, а не цепочка ее генезиса. Определение последней скорее может выступать в качестве научного вывода, основанного на результатах выполнения поисковых задач], то для второго желательно предусмотреть вложенность, соответсвующую “дереву” этнического развития; например, восточнославянские (“летописные”) племена на следующем уровне могут быть конкретизованы по этнонимам “поляне”, “северяне”, “дреговичи” и т.д. Подобное строение позволит как сужать, так и расширять круг поиска по этническому признаку. Состав обоих упомянутых списков выбора можно варьировать сообразно эпохе, к которой принадлежит памятник.
Подробнее следует рассмотреть структуру еще одного словаря, задействуемого при описании любого памятника, вне зависимости от его типа и хронологической принадлежности. Он призван обслуживать массив информации о находках – т.е., о том вещевом материале, который будучи одним из главных объектов научной обработки и определяет (или уточняет) хронологию, культурную и этническую принадлежность памятника и позволяет решать другие вопросы, связанные с его исследованием. Необходимость системного рассмотрения этого материала обусловила появление большого числа специализированных типологий, основанных на изучении морфологических признаков конкретных предметов. Надо сказать, что в научном плане они играют весьма заметную роль, позволяя посредством изучения эволюционных процессов в материальной культуре делать выводы о различных аспектах развития древних обществ. Однако при проектировании необходимо учитывать противоречие между углубленной специализацией (характерной для упомянутых построений) и требованиями некоторой универсальности, предъявляемыми к такому списку выбора как к инструменту управления разнотипными данными. Действительно, большинство разработанных типологических схем действенны лишь для своих хронологических и региональных рамок. Кроме того, исследователи часто не могут договориться о предпочтениях в отношении дублирующих друг друга построений. И, наконец, список основанный на морфологических признаках, должен будет состоять – во-первых, из суммы наименований ВСЕХ подвергшихся типологизации предметов, и, во-вторых, из всех их типов и подтипов (пусть даже в виде вложенных уровней). При попытке создать единый список на находки как таковые, он приобретет огромные, крайне неудобные для пользования размеры. Разумеется, полностью отбрасывать подобный подход нецелесообразно – выше уже говорилось о научной ценности типологического метода (кроме того, гибкий инструментарий проектируемой базы допускает возможность любых классификационных построений, притом в форме, избираемой пользователем). Тем не менее, учитывая только что рассмотренные проблемы, приходится согласиться, что фазе работы с конкретными артефактами должна предшествовать возможность некоего предварительного отбора, сокращающего массив обрабатываемых данных. Для этого предложено создать список основанный на темах, определяемых самыми общими функциональными признаками [естественно, он призван обслуживать данные о вещевых находках; другие материалы (документальные и изобразительныте) имеют собственный набор структурирующих категорий], притом разбитый на два логических уровня. Это придает ему уже вполне обозримые размеры. Например, общие группы первого уровня “Вооружение” или “Сосуды” имеют следующее, более глубокое деление:
Вооружение | Сосуды |
ручное холодное оружие | хозяйственные (“кухонные”) сосуды |
метательное оружие | столовые сосуды |
защитное снаряжение | декоративные сосуды |
огнестрельное оружие и боезапас | тарные сосуды |
предметы оружейного декора | туалетные сосуды |
сосуды культового назначения | |
посудная гарнитура |
Нетрудно заметить, что словарь построен так, чтобы возможно полнее охватить все хронологические периоды, к которым могут относиться исходные объекты (памятники). Это вполне логично – само понятие “список выбора” предполагает, что ненужные на текущий момент (для данной эпохи, в этом случае) пункты могут просто не задействоваться. Конечно, для находок каменного века, например, можно создать отдельный словарь, изначально отбрасывающий ряд несообразных эпохе понятий (“сфрагистика”, “нумизматика” и др.) и даже предлагающий собственную классификацию каменных орудий. Правда, при таком подходе следует определить, будет ли он выступать как некий подуровень общего списка, или приобретет автономность; в любом случае целесообразность этого шага подлежит обсуждению.
Возвращаясь к первоначальной теме, необходимо рассмотреть логическую емкость предложенного словаря – т.е., достаточен ли он для столь обширного массива данных, который формируют возмож-ные находки. Речь идет не о дополнении каких-либо функциональных групп – любые неучтенные пункты могут вноситься и в процессе эксплуатации. Вопрос состоит в том, верно ли избран сам принцип ориентации списка. Интересы исследователей часто вращаются вокруг древних технологий, материаловедения и т.д., что придает соответсвующую направленность их пользовательским запросам. В профессиональном жаргоне даже закрепились выражения, ограничивающие зону прикладных интересов “черным металлом”, “лепной керамикой” и т.п. (обычно в отношении какой-либо культуры или географического региона). Учитывать такую направленность необходимо, но объединение разных, неродственных по своей природе признаков в рамках одного списка нецелесообразно : во-первых, неоправдано возрастают его размеры; во-вторых – размываются понятийные границы между примененными терминами. В то же время, заключив описание материала и техники изготовления в самостоятельные списки выбора, всегда можно сформировать комбинированный запрос, достаточно полно отражающий интересы пользователя.
Коснемся другого аспекта построения “словаря функциональных групп” – глубины его иерархичности. С формальной точки зрения его двухуровневая схема не окончательна – каждая из вложенных групп легко подразделяется на последующие. Но на практике это обернется значительными затруднениями. Информация о находках может оказаться весьма обширной, и многократная отметка каждого предмета в разных уровнях словаря резко замедлила бы как процесс накопления базы, так и процесс ее использования. Кроме того, возникает проблема со множественными ссылками, которые могут иметь место в рамках этого списка (например, украшение может одновременно быть и амулетом, светильник – предметом церковной утвари и т.д.). При двухуровневой структуре количество предметов, подчиненных сразу нескольким пунктам списка, не так велико как могло бы показаться – даже двойную ссылку предполагают сравнительно немногие наименования; тройные ссылки встречаются гораздо реже, а еще более дробные практически отсутствуют (не считая надуманных курьезных примеров). Но стоит увеличить глубину иерархии хотя бы на один порядок, число двойных и более ссылок резко возрастет, причем как они, так и сами дополнительные уровни приобретают чисто формальную значимость. Дело в том, что после проведения поиска по первым двум уровням, дальнейший отбор данных реально детализировать уже не по функциональному признаку, а непосредственно по наименованию предмета. Собственно, уже на этом этапе пользователь может осуществлять свои собственные классификационные построения (используя любые виды альтернативных и взаимодополняющих типологий) и не рискует запутаться в огромном числе разнообразных артефактов.
Подводя итог этому краткому обзору основных списков выбора, можно еще раз задаться вопросом об их практической значимости – ведь вполне очевидно, что излишняя формализация замедляет процесс ввода данных в базу. Именно поэтому, в частности, нужно доводить ее лишь до минимально необходимого уровня, о чем, собственно, шла речь в предыдущем абзаце. Однако, неоспоримое преимущество использования индексированных словарей состоит в значительном ускорении отбора и компоновки данных. Альтернативный вариант организации поиска – по лексемам (неиндексированным, свободно избираемым слогам), хотя и позволяет произвольно излагать вводимую информацию, не обеспечивает достаточного быстродействия при работе с большими массивами данных. Кроме того, тут возможны ошибки, связанные с субъективным подходом к используемой терминологии, или просто с неточностями написания. При работе же со списками выбора это практически исключено; мало того, отчетливо структурированная информация позволяет избежать многих ошибок на логическом уровне. Впрочем, ничто не обязывает пользователя решительно отказаться от одного из вариантов – как уже упоминалось, после осуществления запроса путем произвольной компоновки индексированных полей, вполне возможно задействовать поиск по корневым слогам нужных слов – в сокращенном массиве данных он будет достаточно эффективным. Таким образом, предлагается гибкий инструмент управления информацией, владение которым обеспечит успешное использование базы данных.
Джерело : Археометрія та охорона історико-культурної спадщини, 1997 р., вип. 1, с. 63 – 66.