8. Хранение информации. Классификация данных. Проблемы представления данных

Меню

Лекция 8. Хранение информации. Классификация данных. Проблемы представления данных

Надежное хранение данных – задача, которую приходится решать каждой организации. Проблемы возникают, когда повышаются объемы информации и растут требования к ее защите. Современные системы хранения данных – это сложные программно-аппаратные комплексы, каждый из которых специально разрабатывается под нужды конкретного заказчика.

8.1. Хранение информации
Хранение информации — это фундаментальная функция в сфере информационных технологий, заключающаяся в записи, сохранении и извлечении данных для дальнейшего использования. Эффективное управление информацией является критически важным для любой организации, так как от этого зависит оперативность, точность и надежность бизнес-процессов. В современном мире существует множество способов и технологий хранения данных, которые можно классифицировать по различным критериям.

8.2. Классификация данных
Классификация по носителю информации

Физические носители: Это традиционные методы хранения информации, такие как бумага, магнитные ленты и оптические диски. Хотя их популярность уменьшается, они всё ещё находят применение в архивах и резервном копировании.
Электронные носители: Современные устройства хранения, такие как жёсткие диски (HDD), твердотельные накопители (SSD), флеш-накопители и карты памяти. Эти устройства обеспечивают более высокую скорость доступа к данным и большую ёмкость хранения.

Классификация по методам доступа к информации:

Локальное хранение: Данные хранятся на устройствах, которые физически находятся в распоряжении пользователя или организации. Примеры включают персональные компьютеры, серверы и NAS-системы (Network Attached Storage).
Облачное хранение: Данные хранятся на удалённых серверах, доступ к которым осуществляется через интернет. Примеры включают сервисы, такие как Google Drive, Dropbox и Amazon S3. Преимущества облачного хранения включают масштабируемость, доступность и снижение затрат на инфраструктуру.

Современные технологии хранения информации:

Базы данных: Системы управления базами данных (СУБД), такие как MySQL, PostgreSQL и MongoDB, позволяют структурировать и управлять большими объёмами данных. Они обеспечивают эффективный доступ и манипуляцию с данными, поддерживая различные типы запросов и транзакций.
RAID-массивы: Технология RAID (Redundant Array of Independent Disks) объединяет несколько жёстких дисков в единый логический блок для повышения надёжности и производительности. Существуют разные уровни RAID (например, RAID 0, 1, 5), каждый из которых предлагает свои преимущества в зависимости от требований к скорости и устойчивости данных.
Виртуализация хранилища: Эта технология позволяет объединять ресурсы хранения с различных устройств в единое виртуальное пространство. Это облегчает управление ресурсами и обеспечивает гибкость в распределении хранилища.
Блокчейн: Эта технология децентрализованного хранения информации особенно актуальна для финансового сектора и других областей, требующих высокой безопасности и неизменности данных. Блокчейн обеспечивает прозрачность, защищённость и надёжность благодаря распределённой структуре и криптографическим методам.

Проблемы и вызовы
Хранение информации сталкивается с рядом вызовов, таких как безопасность данных, защита от потери и повреждения, а также вопросы конфиденциальности. В связи с ростом объёмов данных особое внимание уделяется масштабируемости и эффективности систем хранения. Технологии, такие как дедупликация данных и сжатие, помогают справляться с этими вызовами, уменьшая объём хранимых данных без потери информации.

Хранение информации — это динамичная область, в которой постоянно появляются новые технологии и методы. Организации должны постоянно адаптироваться и внедрять передовые решения для обеспечения надёжного и эффективного управления данными. Интеграция различных технологий, таких как облачные сервисы, базы данных и виртуализация, позволяет создавать гибкие и масштабируемые системы хранения, отвечающие современным требованиям бизнеса.

Данным приписываются несколько классификационных признаков. Важным из их является тип данных. Тип данных определяет:

набор их допустимых значений;
правила их обработки (преобразования);
порядок их размещения в ОЗУ и ВЗУ при хранении;
порядок доступа к ним (т.е. воззвание и извлечение по мере надобности с места хранения).

Допустимый набор типов данных и их особенности определяются программной системой либо языком программирования, на котором система написана. При всем этом способности языков по обилию допустимых типов данных, также построению новых типов различаются очень очень. Ясно, что чем более широкой и гибкой оказывается типизация данных в программной системе либо языке, тем больше способностей предоставляется юзеру в решении задачки рационального представления, хранения и внедрения данных. Типизация данных оказывает влияние и на компактность самой исполняемой программки. К примеру, в языке BASIC отсутствует тип данных «записи»; в итоге для сотворения и использования базы данных пришлось бы организовывать параллельную обработку нескольких массивов.
Последующим признаком является деление данных на простые (одиночные, обыкновенные) и структурированные (сложные).
К простым данным относятся знаки, числа (целые и вещественные) и логические данные. Общей и неотклонимой особенностью одиночных данных будет то, каждое из их имеет одно значение и собственное имя. Значение — это содержимое тех ячеек памяти, где данное размещается. Имя (его именуют также идентификатор) — это обозначение данного в тексте программки. Правила построения идентификаторов простых данных определяются языком программирования написанной программки.
Простые данные являются «кирпичиками», методом объединения которых строятся сложные данные. Вариантов объединения существует много — это приводит к возникновению огромного количества типов структур данных.
Информационный массив, объединяющий данные и связи (дела) меж ними именуется структурированными данными.

Список объединяемых одиночных данных, их свойства, также особенности связей меж ними образуют структуру данных.
Примерами структурированных данных является страничка из потрясающего журнальчика с фамилиями учеников, датами занятий и отметками, телефонный справочник, организационная структура учреждения и т.п.
Список допустимых структур данных, как уже было сказано, определяется языком программирования либо прикладной программкой. Он может быть фиксированным (нерасширяемым), как в языке BASIC либо прикладных программках без интегрированных способностей программирования. В развитых языках программирования (PASCAL, С и др.) и ряде прикладных систем вместе с зарезервированными типами структур данных допускается создание новых типов, при этом, элементами структуры могут быть сложные данные, к примеру, массив записей.
Сложные данные, как и простые, имеют значения и идентификаторы. Значения располагаются в ячейках ОЗУ по определенным схемам (см. п.6.3.3.). Правила построения идентификаторов инсталлируются языком программирования либо программной системой. Исключение составляют правила формирования названий файлов — они задаются операционной системой и должны соблюдаться всеми работающими в ней программками и языками. К примеру, в MS-DOS в качестве названий файлов допустимы композиции из латинских букв, цифр и неких спецсимволов общей длиной менее 8 символов; в Windows 95 (98), имеющую 32-х разрядную файловую систему, разрешены имена длиной до 255 символов без ограничений используемого набора знаков.
По способности конфигурации значений данных (как обычных, так и структурированных) в процессе общей обработки их подразделяют на переменные и неизменные (константы). Из наименования разумеется, что переменные могут изменять свое значение по ходу выполнения программки, а константы — нет. На уровне операционной системы различие меж переменными и неизменными величинами отсутствует, потому у их однообразный порядок размещения в ОЗУ и доступа к ним. Разделение может выполняться в языке программирования и, соответственно, в сделанной с его помощью прикладной программке; такое разделение служит дополнительной мерой синтаксического контроля правильности программки.
Зависимо от того, на каком шаге обработки данные употребляются, они разделяются на начальные (входные), промежные и выходные. К начальным относятся данные, нужные для выполнения программки и вводимые в нее до либо в процессе работы. Начальные данные могут быть за ранее записаны на неком носителе и вводиться с него, поступать по линиям связи от каких-либо датчиков либо с других компов, вводиться юзером программки средством устройств ввода. Промежные данные формируются в процессе выполнения программки и, в большинстве случаев, юзеру недосягаемы; они не показываются на устройствах вывода, но есть в ОЗУ либо на ВЗУ. Идентификаторы промежным данным присваивает разработчик программки либо задает сама программка по заложенным в нее правилам. Выходные данные являются результатом работы программки — ради их и делается обработка входных. Выходные данные, созданные для человека, представляются в требуемой для него форме (тексты, картинки, звуки); при хранении выходных данных на носителях либо передаче по сетям сохраняется двоичный компьютерный формат их представления. Таким макаром, работу программки можно рассматривать как деяния по преобразованию входных данных в выходные через нужные для этого промежные. Исходя из убеждений самой программки все эти виды равноправны, т.е. обрабатываются исключительно в согласовании с их типом, а не многофункциональным предназначением либо шагом.

8.3. Тест