НАЗНАЧЕНИЕ  И  ПРЕИМУЩЕСТВА

 

 

ОГЛАВЛЕНИЕ

 

НАЗНАЧЕНИЕ  И  ПРЕИМУЩЕСТВА

СТРУКТУРА  БАЗЫ  ДАННЫХ

ИНТЕРФЕЙС  НА  C++

ФОРМАТЫ  ФАЙЛОВ

ИНСТРУМЕНТЫ

ТЕРМИНЫ

 

 

 

Многомерные базы данных предназначены для хранения и обработки информации; их главное отличие от реляционных баз состоит в способе хранения информации. Если в реляционных базах данные хранятся в двумерных объектах – таблицах (*), то в многомерных они хранятся в гиперкубах, то есть множествах с размерностью, не обязательно равной двум.

 

К преимуществам многомерных форматов вообще и предлагаемого формата в частности можно отнести следующее:

 

1. «Логичность» хранения данных: один тип данных хранится на одном измерении; данные не дублируются в разных таблицах, как в реляционных базах. Как следствие –минимальная избыточность данных, так как нет необходимости хранить NULL’и, как это бывает в таблицах реляционных баз. Заметим, что избыточность в нашем формате полностью отсутствует только в случае, если все «витрины» удалены, то есть база находится в сжатом виде.

2. Многовариантность способов хранения данных: выбираемый способ (набор измерений и иерархий) должен обеспечивать требуемую скорость обработки данных.

3. Возможность создавать «витрины», то есть блоки информации необходимого формата, предназначенные для быстрого считывания информации данной конкретной задачей.

4. Независимость нашего формата от стандартных драйверов, предназначенных для управления базами данных стандартных форматов (dbf, mdb и пр.). Стандартные драйвера иногда отказываются корректно работать на новых версиях операционных систем.

 

В настоящее время различные многомерные базы данных используются, как правило, лишь в достаточно крупных организациях (крупнейшие банки, нефтяные и другие монополии, правительственные и военные организации, поисковые системы), что является следствием их высокой стоимости для потребителя. Кроме того, Microsoft с некоторых пор встраивает в Windows приложения, использующие многомерный формат MDX, но этот факт известен лишь «продвинутым» пользователям.

 

За отправную точку для разработки описываемого формата взят формат MDX, созданный М.Пасуманским сотоварищи (Microsoft), с некоторыми усовершенствованиями: например, наш формат обладает хорошими возможностями для одновременной обработки данных разной размерности.

 

Для работы с базами данных на языке C++ создан класс Fct, функции которого добавляют и удаляют различные объекты базы данных (измерения, уровни иерархии, факты, функции), выполняют поиск фактов, а также осуществляющие групповые операции с данными, такие, как пересечение наборов данных.

 

 

 

*   Точнее, двумерной можно считать таблицу из 2- х столбцов (полей); о размерности таблицы с несколькими полями можно долго рассуждать, так как размерность таблицы – категория довольно непрозрачная…

 

 

 

 

 

 

 

Рейтинг@Mail.ru