НАУЧНО-МЕТОДИЧЕСКИЙ АППАРАТ ОПИСАНИЯ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ В РЕЛЯЦИОННЫХ БД
Функционирование материальных систем может быть описано в форме сообщений. Сообщение о событиях, происходящих в материальной системе, представляет собой информационное отображение материальных процессов.
Сообщение может быть выражено на естественном языке, однако часто применяют форматированные сообщения, когда в них приводятся названия опорных свойств (параметров) происходящего события и их значения.
Форматированные сообщения — наиболее массовый вид сообщений, хранимых и обрабатываемых в ЭИС.
Набор сообщений, истинных для соответствующей материальной системы, непротиворечивых по отношению друг к другу и к концептуальной схеме, является базой данных.
Сообщения в БД обычно представляются в форматированном виде и хранятся в виде единиц информации. Единицей информации называется набор символов, которому придается определенный смысл.
Минимально необходимы две единицы информации — атрибут и составная единица информации (СЕИ).
Атрибутом называется информационное отображение отдельного свойства некоторого объекта, процесса или явления. Лю-
бое сообщение, как правило, записывается в форматированном виде как указание свойств (параметров) предметов, о которых мы говорим. Поэтому информационное отображение любого явления представляет собой набор соответствующим образом подобранных атрибутов.
Составная единица информации — это набор, состоящий из атрибутов и, возможно, других СЕИ. Простейшими СЕИ являются таблицы. СЕИ позволяет создавать произвольные комбинации из атрибутов.
Разработка баз данных, как известно, начинается с построения ее концептуальной схемы (модели).
Концептуальная схема (от слова concept — понятие) представляет собой описание структуры всех единиц информации, хранящихся в БД. Под структурой понимается вхождение одних единиц информации в состав других единиц информации.
Следует отметить, что БД в целом также является единицей информации. Если рассматривать единицы информации как информационные объекты, то можно говорить об их свойствах. В то же время единицы информации — это нефизические объекты, так как они не занимают место в пространстве.Простейшими характеристиками СЕИ являются имя, структура и значение. Имя СЕИ — это ее условное обозначение в процессах обработки информации. Структура СЕИ показывает взаимосвязь входящих в нее единиц информации.
Существует сравнительно много способов описания структуры СЕИ. Для описания, не зависимого от конкретных языков программирования и СУБД, достаточно указывать после имени СЕИ список имен входящих в нее атрибутов и СЕИ. Этот список указывается в круглых скобках, а имена внутри скобок перечислять через запятую. Имя СЕИ может сопровождаться размерностью, т.е. указанием на количество одинаковых по. структуре значений этой СЕИ. Размерность, если она не равна 1, указывается в скобках после имени СЕИ.
Значением СЕИ называются набор значений непосредственно входящих в нее атрибутов и набор собраний непосредственно входящих в нее СЕИ. Одно значение СЕИ при хранении ее в памяти ЭВМ часто называется записью. Все языки программирования содержат средства описания структуры СЕИ. Над СЕИ производятся нижеследующие операции.
Присвоение единице информации нового имени называется переименованием, объявление синонима — это установление второго, третьего и т.д. равноценного имени для единицы информации.
Над значением атрибута производится всего одна операция — перекодирование, т.е. существующий код заменяется на новый для всех значений.
Выборка — операция выделения подмножества значений СЕИ, которые удовлетворяют заранее поставленным условиям выборки.
Корректировка означает выполнение одной из операций:
- добавление нового значения СЕИ;
- исключение существующего значения СЕИ;
- замена некоторого значения СЕИ на новое значение.
Декомпозиция — операция преобразования исходной СЕИ в
несколько СЕИ с различными структурами.
В результате декомпозиции одновременно производится преобразование множества значений.Композиция — операция преобразования нескольких СЕИ с различными структурами в одну СЕИ. Декомпозиция и композиция являются взаимообратными операциями.
Нормализация — это операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой. Одновременно происходит перекомпоновка значений СЕИ.
Свертка — операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой.
При анализе экономических документов ставится задача разделения документа на элементарные осмысленные фрагменты, называемые показателями. Это позволяет установить смысловые взаимосвязи между различными документами, обеспечить одинаковое понимание всеми пользователями применяемых единиц информации и их единое обозначение, использовать полученные результаты для определения структуры базы данных.
Показатель представляет собой полное описание количественного параметра, характеризующего некоторый объект или процесс. Соответствующее описание произвольного свойства (необязательно количественного) называется атомарным фактом.
Чтобы точнее характеризовать атрибуты, образующие показатель, необходимо отметить существенные различия свойств, которые отображаются атрибутами. Материальные процессы, как известно, имеют качественную и количественную характери-
стики. Соответственно и атрибуты должны разделяться на два класса, которые называются "атрибуты-признаки" и "атрибуты- основания". Атрибут-признак представляет собой информационное отображение качественного свойства некоторого объекта, предмета, процесса, а атрибут-основание является отображением их количественного свойства. В состав показателя должны входить один атрибут-основание и несколько атрибутов-признаков, однозначно характеризующих условия существования основания.
Как единица информации, показатель является разновидностью СЕИ. Схематично структура показателя П представляется выражением
іде РьР2,-,Рк— атрибуты-признаки;
Q — атрибут-основание.
Если представить себе показатель с двумя, например, атрибутами-основаниями, то его можно разделить на две части, в каждой из которых будут один атрибут-основание и характеризующие его признаки. Полученные части содержат меньше атрибутов и поэтому соответствуют определению показателя.
Таким образом, в показателях отображаются количественные свойства объектов и процессов. Вместе с тем существуют документы, не содержащие атрибутов-оснований, например анкеты кадрового учета, сведения о структуре подразделений предприятия и т. д. Следовательно, не вся экономическая информация может быть представлена в форме показателей.
Минимальный набор атрибутов показателя должен содержать:
- атрибуты, отображающие идентификаторы объектов;
- атрибуты, отображающие признак времени;
- атрибут, отображающий некоторое количественное свойство объекта или взаимодействия.
При установлении признаков и оснований в конкретных документах необходимо учитывать следующие закономерности:
- если значение атрибута является исходным данным или результатом арифметической операции — это основание;
- если значение текстовое — это признак;
- если атрибут обозначает предмет — это признак;
- если атрибут в некотором показателе является признаком (основанием), он будет играть эту роль и в других показателях;
- если показатели описывают сходные процессы, их признанные части совпадают;
- если основание показателя вычисляется по значениям других оснований, то набор признаков такого показателя есть объединение признаков, связанных с этими основаниями.
Критерием качества создания базы данных может служить минимальная избыточность хранимой информации. Обычно минимальная избыточность выражается принципом: каждое сообщение хранится в БД один раз. Соблюдение этого принципа дает ряд преимуществ:
- сокращается объем памяти ЭВМ, требуемой для хранения базы данных;
- сокращается трудоемкость ввода данных в ЭВМ и упрощается контроль за достоверностью вводимой информации;
- упрощаются алгоритмы корректировки данных, так как корректировка сообщения может быть проведена за одно обращение к базе данных.
Использование аппарата экономических показателей позволяет создать структуру БД с минимальной избыточностью, если сначала расчленить все сведения, циркулирующие в ЭИС, на показатели, а потом объединить атрибуты родственных показателей по принципу: в один файл включается группа экономических показателей с одинаковым составом атрибутов-признаков.
Одна из причин выделения показателей в особую разновидность единиц информации заключается в том, что показатель является минимальной группой атрибутов, сохраняющей информативность (осмысленность) и поэтому достаточной для образования самостоятельного документа.
Для показателей, описывающих экономические процессы (взаимодействие объектов), можно классифицировать их составные части:
- формальную характеристику, указывающую на алгоритм получения атрибута-основания в показателе;
- перечень объектов, участвующих в процессе;
- название процесса;
- единицу измерения атрибута-основания;
- определение момента времени или периода времени;
- название функции управления;
• название экономической системы, в которой происходит описываемый процесс.
Указание всех названных частей необходимо для точного обозначения показателя. Атрибуты-признаки показателя должны отображать в обязательном порядке лишь перечень объектов, участвующих в процессе, и период (момент) времени. Очень часто в показатель включается признак, отмечающий единицу измерения, а остальные характеристики показателя обычно указываются в его названии, а не в хранимых значениях.
Показатель удобно применять как обобщающую единицу измерения объема данных.
Существует аналогия между экономическими показателями и переменными с индексами, которые рассматриваются, например, в линейной алгебре. Так, показатель П (Код материала, Цена) соответствует величине С(0, где С — цена материала с г-м Кодом материала. Переменная С соответствует атрибуту-основанию Цена, индекс i — атрибуту-признаку Код материала. В общем случае переменная всегда отображает атрибут-основание, а индексы этой переменной — значения соответствующих атрибутов- признаков показателя.
Естественное отличие состоит в том, что индекс / переменной С обычно изменяется от 1 до некоторого фиксированного значения, а номенклатурные номера материалов (и вообще любые значения атрибутов-признаков) могут кодироваться не только порядковыми кодами, но и другими способами.
Закономерности, установленные в математике для арифметических операций над переменными с индексами, естественно, трансформируются в правила арифметических действий над показателями.