Классификация БД: варианты, модели данных и основные характеристики

В качестве БД обозначается набор данных, которые необходимо упорядочить, а система управления базой данных (СУБД) отвечает за ее администрирование, определяя, таким образом, структуру, порядок, права доступа и зависимости. Для этой цели используется собственный компилятор и подходящая модель, которая определяет архитектуру системы базы данных. На базе архитектуры проводят классификацию БД.

История создания

Базы данных (БД) представляют собой логически структурированные системы для электронного администрирования, которое производится с помощью системы управления базами данных (СУБД), добавив ее в репозиторий. Большинство БД можно открывать, редактировать и консультировать только с использованием конкретных приложений. По этим принципам выполняют классификацию БД. В 1960-х годах концепция электронной информационной базы стала разрабатываться как отдельный слой программного обеспечения между ОС и прикладной программой.

Идея системы электронных БД стала одним из наиболее актуальных нововведений в компьютерных разработках. Первыми моделями, которые были разработаны, были иерархические и сетевые базы данных. IBM в семидесятых произвела революцию в этом секторе, с разработкой модели реляционных БД. Наиболее успешными продуктами в то время были язык запросов БД Oracle SQL и преемники IBM, SQL/DS и DB2.

Понятие БД и классификация БД

Сегодня системы баз данных имеют важное значение во многих областях науки, техники и пользовательского применения. Любой тип программного обеспечения, разработанный для компаний, основан на надежных БД с большим количеством опций и инструментов для системных администраторов. Безопасность данных также приобретает все большее значение, в электронных БД хранятся и шифруются пароли, личные данные и даже электронные валюты.

Современная финансовая система представляет собой не что иное, как сеть баз данных, в которой большая часть денежных сумм существует только в виде электронных единиц информации, защита которых с помощью безопасных БД является одной из основных задач финансовых учреждений.

В зависимости от изменчивости базы данных ее тип относят по классификации БД к статическому или динамическому.

Функции статических БД:

  1. Позволяют только чтение данных, исключая модификацию.
  2. Применяются для биографий и исторических фактов или сценариев, к которым можно обращаться для исследования, без необходимости изменения содержания.
  3. Они безопасны и просты в использовании при подключении к сети.

Функции динамических БД:

  1. Они обладают понятием самоуправления.
  2. Могут быть связаны с динамическими сетями.
  3. Эта структурная ассоциация позволяет хранить и обновлять информацию базы данных.
  4. Использует HTML в качестве языка связи между сетью и динамической БД.
  5. Наиболее используемые языки для создания динамических сетей, связанных с BBDD: Perl, CGI, PHP, JSP и ASP.

Основными СУБД, которые работают с динамическими веб-страницами, являются PostgresQL, MySQL, Oracle и Microsoft SQL.

Для того чтобы понять, какие существуют варианты классификации БД, используемых в научной и образовательной среде, рассматривают:

  • библиографические;
  • документальные;
  • специализированные;
  • справочники.

Функциональные возможности библиографических БД:

  1. Связаны со старыми записями, которые содержат информацию о местонахождении книги или документа.
  2. Не содержат полный текст, только ссылку.
  3. Благодаря таким форматам, как PDF, позволяет получать доступ к оригинальным статьям, на которые есть ссылки.
  4. С развитием технологий включаются ссылки из других СМИ.

Особенности специализированных БД:

  1. Содержат точную информацию и ориентированы на конкретную тему.
  2. Используются в академической и научной среде.
  3. Для некоторых случаев не рассматриваются как правильные BBDD: например, телефонный справочник, список контактов компании или международной компании.

Модели электронной обработки

Для того чтобы подробно изучить вопрос, какие существуют варианты классификации БД, нельзя обойти тему моделей. Иерархические базы данных были первыми, разработанными в 60-х годах в трудах Холлерита, они зависели от типа хранения информации 1N/ NN в форме перевернутого дерева.

Отношения имеют тип 1N, когда родительский узел может иметь несколько дочерних подузлов, но дочерний узел не может принадлежать нескольким родительским. Их недостаток в том, что избыточность данных представлена не очень хорошо.

Модель базы данных в сети, предложенная CODASYL, является его первой системой управления (IMS), появилась она в 1968 году для программы НАСА "Аполлон". Она решала некоторые проблемы предыдущей иерархической модели, которые уже практически не используются в современном IT-процессе.

Для того чтобы понять современную модель, нужно рассмотреть, какие в классификации БД существуют отношения между родительскими и дочерними узлами. Сегодня используются отношения типа NN, когда дочернему подузлу разрешено принадлежать нескольким родительским узлам. Вместе с иерархической моделью она формирует первое поколение БД.

Преимущества модели: они предлагают отличную стабильность, хорошую производительность и лучшую избыточность обработки. Недостатком модели является сложность системы, которая требует знаний в области программирования.

Особенности транзакционных баз данных:

  1. Единственная цель - отправка и получение данных с высокой скоростью.
  2. Они нацелены на качественный анализ и производственные данные.
  3. Уникальным назначением является сбор и восстановление данных с максимально возможной скоростью, поэтому избыточность и дублирование информации не является проблемой, как с другими БД.
  4. Позволяют соединение с реляционными БД.
  5. Операции являются атомарными, в этом типе возможно только то, что они выполняются полностью (целостность) или не выполняются вообще.

Основные различия в базах данных

Документальные - возвращают содержимое, работают с когнитивными и концептуальными документами, принадлежат к интеллектуальной и академической среде. У них есть менеджеры документов и контента, такие, как CDS/ISIS, Filemaker, Knosys или Imagic Text для терминологического контроля. Они легкодоступны при использовании стандартизированных языков запросов и имеют классификацию БД по типу модели данных.

Реляционные основаны на установлении связей между наборами данных, организованы в виде таблиц, которые соответствуют некоторым основным требованиям. Они имеют фиксированное количество полей. У каждого атрибута есть имя и множество возможных значений. Каждая запись уникальна и идентифицируется с помощью ключа. Они реализуют язык запросов SQL и основаны на модели, разработанной Эдгаром Коддом в 70-х годах.

Объектно ориентированные базы данных возвращают физические файлы или программный код, появились они в конце ХХ века. Используются в промышленном производстве и дизайне. Работают с объектно ориентированным языком, таким как C++ или Python. Соблюдают "золотое правило": постоянство, менеджер вторичного хранилища, параллелизм, восстановление и объект запроса.

Системы управления СУБД

Система управления базами данных (СУБД) - термин для описания функций и требований транзакций в системе управления БД, сокращенно это ACID (АСИД) от атомарности, согласованности, изоляции и долговечности. Эти четыре параметра охватывают наиболее важные требования к СУБД, совместимые с ACID:

  1. Atomicity (атомарность) обозначает свойство "все или ничего" менеджеров БД для того, чтобы запрос был действительным, транзакция была выполнена правильно и реализована с верным порядком процедур.
  2. Консистенция, или когерентность, когда сделка БД остается стабильной, требующей постоянного контроля всех операций.
  3. Изоляция является условием и гарантией, что транзакции не мешают друг другу, что обычно достигается путем блокирования определенных функций, которые изолируют данные, участвующие в сделке.
  4. Долговечность означает, что в СУБД все данные хранятся в долгосрочной перспективе даже после заключения сделки, а также в случае аварии системы, если падает СУБД. Для этого условия необходимы записи транзакций, которые протоколируют все происходящие процессы.

Классификация функций и требований

База данных хранит информацию и связывает ее в логическую единицу вместе с метаданными, необходимыми для обработки. Это очень полезный инструмент для управления большими файлами с простым запросом, обладающий системой разрешений, которая определяет, какие пользователи или программы имеют право доступа.

Классификация БД:

Функция

Назначение

Хранить данные

В БД хранятся тексты, документы, пароли. В электронном формате, доступ к данным можно получить через консультации.

Изменить данные

В зависимости от того, какие разрешения доступны, большинство БД позволяют редактировать фильтры защиты данных.

Очистить данные

Записи в большинстве вариантов классификации БД могут быть полностью удалены, не оставляя пробелов. В некоторых случаях удаленные данные могут быть восстановлены, но в других они удаляются навсегда.

Управление метаданными

Обычно информация хранится с метаданными или метатегами, которые поддерживают порядок в БД и делают возможной функцию поиска. Метаданные также часто используются для регулирования разрешений.

Безопасность данных

БД должны быть защищены, чтобы предотвратить доступ неуполномоченных лиц к информации, которую они хранят.

Целостность данных

Целостность данных означает, что они должны соответствовать определенным правилам для обеспечения их корректности и определения бизнес-логики банка данных.

Многопользовательская функция

Приложения БД обеспечивают доступ с разных устройств. Распределение разрешений и безопасность данных являются элементарными в многопользовательском использовании.

Оптимизировать запросы

Технически БД должна быть в состоянии обрабатывать запросы наилучшим образом, чтобы гарантировать хорошую производительность.

Триггеры и хранимые процедуры

Эти две процедуры представляют собой мини-приложения, хранящиеся в СУБД. Триггеры и хранимые процедуры являются типичными процессами реляционных баз данных.

Прозрачность системы

Прозрачность системы актуальна, особенно в распределенных моделях классификации БД.

Иерархическая модель

Различия между наиболее распространенными моделями БД являются результатом технической эволюции электронной передачи данных, которая не только преследовала цели эффективности и управляемости, но также расширяла возможности наиболее известных производителей. Это самая старая модель, которая сегодня значительно превосходит реляционную, хотя в последнее время наблюдается рост ее популярности.

XML использует эту систему для хранения информации. Некоторые страховые компании и банки обращаются к иерархическим базам данных в самых старых приложениях. Наиболее известная - это база IBM IMS/DB.

В иерархической модели классификации данных БД существуют строгие и однозначные зависимости. Каждая запись имеет только один прецедент (Parent-Child Relationships, PCR), за исключением корня (root), составляющего древовидную схему. Хотя каждый дочерний узел может иметь только один родительский, «родители» могут иметь столько дочерних узлов, сколько они хотят.

Учитывая строгое иерархическое упорядочение, уровни, не имеющие прямой связи, не взаимодействуют друг с другом, поэтому соединить два разных дерева непросто. При этом иерархические структуры баз данных чрезвычайно гибки и понятны. Записи с "детьми" называются записями, а те, которые без, - листьями, и обычно являются документами в записи для листьев в классификации БД. Запросы к иерархической базе данных достигают листьев, начиная с корня и проходя через различные записи.

Графически ориентированная DMS

Сетевая модель развивалась почти одновременно с реляционной, хотя со временем она была побеждена конкурентами. В отличие от иерархической модели здесь записи не раскрывают строгих отношений "родитель - потомок", но каждая может иметь несколько прецедентов, что дает ей сетевую структуру своего имени. Для доступа к записи также существует уникальный и неизменный путь.

В модели сетевой базы данных нет фиксированной иерархии, и поэтому существует несколько путей, ведущих к одному и тому же пункту назначения. Запись, расположенная в центре изображения, может быть теоретически доступна из пяти других, а получив к ней доступ, можно получить доступ к пяти другим записям.

В сетевой модели также могут быть определены зависимости - регистр, расположенный выше. Он не связан напрямую с регистром в крайнем правом положении, поэтому для его достижения должен проходить через регистр в центре, который может принять или отклонить. Можно связаться с расположенным слева вверху. В сетевой модели записи добавляются или удаляются без влияния на глобальную структуру.

Сегодня эта модель используется на больших компьютерах. В других областях по-прежнему полагаются на иерархическую модель или обращаются к реляционной модели, гораздо более гибкой и простой в использовании. Некоторые известные модели сетевых баз данных - это UDS Siemens и DMS Sperry Univac. Со временем оба производителя также разработали интересные смешанные формы между сетевой моделью и реляционной. Графически ориентированная база данных благодаря своей ретикулярной структуре считается современной эволюцией сетевой модели.

Масштабируемость хранилищ

В документноориентированной модели базы данных документы являются основной единицей хранения информации. Эти единицы являются теми, которые структурируют данные, и их не следует путать с документами программ обработки текста. Здесь данные хранятся в так называемых парах "ключ - значение".

Поскольку ни структура, ни количество пар не определены, документы, составляющие базу данных, ориентированную на документы, могут сильно отличаться друг от друга. Каждый документ сам по себе является закрытой единицей, и установить отношения между документами непросто.

В последние годы благодаря успеху NoSQL документарные базы данных пережили большой бум, особенно благодаря хорошей масштабируемости. Примером системы баз данных этого типа является MongoDB. В модели базы данных, ориентированной на документы, данные хранятся в отдельных документах, а не в таблицах, как в реляционной модели.

Эти системы особенно интересны для веб-приложений, поскольку они позволяют сохранять полные HTML-формы. Необходимо подчеркнуть, что среди различных основанных на документе систем есть заметные различия, от синтаксиса до внутренней структуры, поэтому не все ориентированные на документы базы данных подходят для этого сценария. Именно из-за этих различий существует несколько систем баз данных, ориентированных на репутационные документы Lotus Notes, Amazon SimpleDB, MongoDB, CouchDB, Riak, ThruDB и OrientDB.

Преимущества и недостатки

Надлежащие системы управления базами данных помогают получить лучший доступ к данным, а также оптимизировать управление ими. В свою очередь, точечный доступ помогает конечным пользователям быстро и эффективно обмениваться данными в рамках выполнения задач организации.

Модель базы данных

Год создания

Преимущества

Недостатки

Иерархическая

1960-й

Очень быстрый доступ для чтения, четкая структура, технически простой.

Исправлена структура в дереве, которая не допускает связи между деревьями.

Сетевая

Начало 1970-х

Поддерживает несколько способов доступа к записи, без строгой иерархии.

Плохой обзор с большими базами данных.

Реляционная

1970-й

Простое, гибкое создание и редактирование, легко расширяемое, быстрый ввод в эксплуатацию, простое расширение, быстрый запуск, очень динамичный контекст.

Неуправляемый с большими объемами данных, плохой сегментацией, атрибутами искусственного ключа, внешним интерфейсом программирования, плохо отражает свойства и поведение объектов.

Ориентирована на объекты

Конец 1980-х

Лучшая поддержка объектноориентированных языков программирования, хранение мультимедийного контента. Поддерживает объектноориентированные языки программирования, позволяет хранить мультимедийный контент.

Более низкая производительность с большими объемами данных, мало совместимых интерфейсов.

Ориентирована на документы

1980-е

Соответствующие данные хранятся централизованно в независимых документах, свободной структуре, концепции мультимедиа, относится к классификации сущностей БД.

Организационная работа относительно высока, часто требует навыков программирования.

Области применения

Человек можете не осознавать этого, но базы данных есть везде. Независимо от того, знает ли он о них что-нибудь или нет, их влияние на повседневную жизнь очень велико. От погодных приложений до фильмов онлайн, базы данных отвечают за многие услуги, которыми люди пользуются ежедневно, и чтобы не запутаться в выросшем объеме информации, используют классификацию данных в БД.

Области применения СУБД:

  1. Банковское дело - для информации о клиентах, счетов и займов, а также банковских операций.
  2. Авиакомпании - для бронирования и информации о расписании. Авиакомпании были одними из первых, кто использовал базы данных в географически распределенном порядке: терминалы, расположенные по всему миру, обращались к центральной системе баз данных через телефонные линии и другие сети передачи данных.
  3. Университеты - для информации о студентах, регистрации курсов и оценок.
  4. Операции с кредитными картами - для покупок по кредитным картам и формирования ежемесячных выписок.
  5. Телекоммуникации - для ведения записей о совершенных вызовах, составления ежемесячных счетов, поддержания баланса на телефонных карточках с предоплатой и хранения информации о сетях связи.
  6. Финансы - для хранения информации о запасах, продажах и покупках финансовых инструментов, таких, как акции и облигации.
  7. Продажи - информация о клиенте, продукте и покупке.
  8. Производство - для управления цепочкой поставок и для отслеживания производства товаров на фабриках, запасов товаров на складах, в магазинах и заказов на товары.
  9. Человеческие ресурсы - для получения информации о сотрудниках, заработной плате, налогах на заработную плату и льготах, а также для получения зарплат.

Будущие тенденции

В будущем мировоззрении баз данных по-прежнему важным аспектом будет оставаться World Wide Web (WWW, или, в сокращенном виде, веб) как средство публикации документов и как средство обмена информацией. WWW предоставляет одну из самых разнородных и сложных сред в области взаимодействия.

В последнее время появились технологии и стандарты, направленные на то, чтобы сделать сеть масштабируемой и управляемой инфраструктурой. Одной из таких технологий является XML, которая преобразована в Интернет, в систему базы данных, в стиле обработчиков традиционной БД, которая дает гораздо лучшие результаты, чем машины поиска. Задача состоит в том, чтобы интегрировать эту функциональность в XML и максимально использовать стратегическую информацию, которую пользователь может найти в Интернете.

Новыми тенденциями являются упреждающий и прогнозирующий анализ производительности, нагрузочное тестирование базы данных, использование NOSQL - mongodb и cassandra и BigData (Hadoop) в корпоративных и облачных средах.

Комментарии