Сделай Сам Свою Работу на 5

ЭТАПЫ ЭВОЛЮЦИИ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

 

Эволюция информационных технологий наиболее ярко просле­живается на процессах хранения, транспортирования и обработки информации.

В управлении данными, объединяющем задачи их получения, хранения, обработки, анализа и визуализации, выделяют шесть временных фаз (поколений) [10], которые представлены на рис. 3.1. Вначале данные обрабатывали вручную. На следующем шаге использовали оборудование с перфокартами и электромеханиче­ские машины для сортировки и табулирования миллионов записей. В третьей фазе данные хранились на магнитных лентах, и сохра­няемые программы выполняли пакетную обработку последователь­ных файлов. Четвертая фаза связана с введением понятия схемы базы данных и оперативного навигационного доступа к ним. В пя­той фазе был обеспечен автоматический доступ к реляционным ба­зам данных и была внедрена распределенная и клиент-серверная обработка. Теперь мы находимся в начале шестого поколения сис­тем, которые хранят более разнообразные типы данных (докумен­ты, графические, звуковые и видеообразы). Эти системы шестого поколения представляют собой базовые средства хранения для по­являющихся приложений Интернета и Интранета.

 

Рис. 3.1. Временные фазы развития управления данными

В нулевом поколении (4000 г. до н.э. — 1900 г.) в течение шести тысяч лет наблюдалась эволюция от глиняных таблиц к па­пирусу, затем к пергаменту и, наконец, к бумаге. Имелось много новшеств в представлении данных: фонетические алфавиты, сочи­нения, книги, библиотеки, бумажные и печатные издания. Это были большие достижения, но обработка информации в эту эпоху осуществлялась вручную.

Первое поколение (1900—1955) связано с технологией перфокарт, когда запись данных представлялась на них в виде дво­ичных структур. Процветание компании IBM в период 1915—1960 гг. связано с производством электромеханического оборудования для записи данных на карты, сортировки и составления таблиц. Громоздкость оборудования, необходимость хранения громадного количества перфокарт предопределили появление новой техноло­гии, которая должна была вытеснить электромеханические компь­ютеры.

Второе поколение (программируемое оборудование обработки записей, 1955—1980 гг.) связано с появлением техноло­гии магнитных лент, каждая из которых могла хранить информа­цию десяти тысяч перфокарт. Для обработки информации были разработаны электронные компьютеры с хранимыми программами, которые могли обрабатывать сотни записей в секунду. Ключевым моментом этой новой технологии было программное обеспечение, с помощью которого сравнительно легко можно было программи­ровать и использовать компьютеры.

Программное обеспечение этого времени поддерживало модель обработки записей на основе файлов. Типовые программы после­довательно читали несколько входных файлов и производили на выходе новые файлы. Для облегчения определения этих ориенти­рованных на записи последовательных задач были созданы COBOL и несколько других языков программирования. Операционные сис­темы обеспечивали абстракцию файла для хранения этих записей, язык управления выполнением заданий и планировщик заданий для управления потоком работ.

Системы пакетной обработки транзакций сохраняли их на кар­тах или лентах и собирали в пакеты для последующей обработки. Раз в день эти пакеты транзакций сортировались. Отсортирован­ные транзакции сливались с хранимой на ленте намного большей по размерам базой данных (основным файлом) для производства нового основного файла. На основе этого основного файла также производился отчет, который использовался как гроссбух на сле­дующий бизнес-день. Пакетная обработка позволяла очень эффективно использовать компьютеры, но обладала двумя серьезными ограничениями: невозможностью распознавания ошибки до обра­ботки основного файла и отсутствием оперативного знания о теку­щей информации.

Третье поколение (оперативные базы данных, 1965—1980 гг.) связано с внедрением оперативного доступа к дан­ным в интерактивном режиме, основанном на использовании сис­тем баз данных с оперативными транзакциями.

Технические средства для подключения к компьютеру интерак­тивных компьютерных терминалов прошли путь развития от теле­тайпов к простым алфавитно-цифровым дисплеям и, наконец, к сегодняшним интеллектуальным терминалам, основанным на тех­нологии персональных компьютеров.

Оперативные базы данных хранились на магнитных дисках или барабанах, которые обеспечивали доступ к любому элементу дан­ных за доли секунды. Эти устройства и программное обеспечение управления данными давали возможность программам считывать несколько записей, изменять их и затем возвращать новые значе­ния оперативному пользователю. В начале системы обеспечивали простой поиск данных: либо прямой поиск по номеру записи, либо ассоциативный поиск по ключу.

Простые индексно-последовательные организации записей бы­стро развились в более мощную модель, ориентированную на набо­ры. Модели данных прошли эволюционный путь развития от ие­рархических и сетевых к реляционным.

В этих ранних базах данных поддерживались три вида схем дан­ных:

• логическая, которая определяет глобальный логический про­ект записей базы данных и связей между записями;

• физическая, описывающая физическое размещение записей базы данных на устройствах памяти и в файлах, а также индексы, нужные для поддержания логических связей;

• предоставляемая каждому приложению подсхема, раскры­вающая только часть логической схемы, которую использует про­грамма.

Механизм логических и физических схем и подсхем обеспечи­вал независимость данных. И на самом деле многие программы, написанные в ту эпоху, все еще работают сегодня с использовани­ем той же самой подсхемы, с которой все начиналось, хотя логиче­ская и физическая схемы абсолютно изменились.

К 1980 г. сетевые (и иерархические) модели данных, ориентиро­ванные на наборы записей, стали очень популярны. Однако нави­гационный программный интерфейс был низкого уровня, что по­служило толчком к дальнейшему совершенствованию информаци­онных технологий.

Четвертое поколение (реляционные базы данных: архитектура «клиент — сервер», 1980—1995 гг.) явилось альтернати­вой низкоуровневому интерфейсу. Идея реляционной модели со­стоит в единообразном представлении сущности и связи. Реляци­онная модель данных обладает унифицированным языком для оп­ределения данных, навигации по данным и манипулирования дан­ными. Работы в этом направлении породили язык, названный SQL, принятый в качестве стандарта.

Сегодня почти все системы баз данных обеспечивают интер­фейс SQL. Кроме того, во всех системах поддерживаются собствен­ные расширения, выходящие за рамки этого стандарта.

Кроме повышения продуктивности и простоты использования реляционная модель обладает некоторыми неожиданными преиму­ществами. Она оказалась хорошо пригодной к использованию в ар­хитектуре «клиент—сервер», параллельной обработке и графиче­ских пользовательских интерфейсах. Приложение «клиент—сервер» разбивается на две части. Клиентская часть отвечает за поддержку ввода и представление выходных данных для пользователя или клиентского устройства. Сервер отвечает за хранение базы данных, обработку клиентских запросов к базе данных, возврат клиенту об­щего ответа. Реляционный интерфейс особенно удобен для ис­пользования в архитектуре «клиент—сервер», поскольку приводит к обмену высокоуровневыми запросами и ответами. Высокоуров­невый интерфейс SQL минимизирует коммуникации между клиен­том и сервером. Сегодня многие клиент—серверные средства стро­ятся на основе протокола Open Database Connectivity (ODBC), ко­торый обеспечивает для клиента стандартный механизм запросов высокого уровня к серверу. Архитектура «клиент—сервер» продол­жает развиваться. Как разъясняется в следующем разделе, имеется возрастающая тенденция интеграции процедур в серверах баз дан­ных. В частности, такие процедурные языки, как BASIC и Java, были добавлены к серверам, чтобы клиенты могли вызывать при­кладные процедуры, выполняемые на них.

Параллельная обработка баз данных была вторым неожидан­ным преимуществом реляционной модели. Отношения являются однородными множествами записей. Реляционная модель включа­ет набор операций, замкнутых по композиции: каждая операция получает отношения на входе и производит отношение как резуль­тат. Поэтому реляционные операции естественным образом пре­доставляют возможности конвейерного параллелизма путем на­правления вывода одной операции на вход следующей.

Реляционные данные также хорошо приспособлены к графиче­ским пользовательским интерфейсам (GUI). Пользователи легко могут создавать отношения в виде электронных таблиц и визуально манипулировать ими.

Между тем файловые системы и системы, ориентированные на наборы, оставались «рабочими лошадками» многих корпораций. С годами эти корпорации построили громадные приложения и не могли легко перейти к использованию реляционных систем. Реля­ционные системы скорее стали ключевым средством для новых клиент-серверных приложений.

Пятое поколение (мультимедийные базы данных, с 1995 г.) связано с переходом от традиционных хранящих числа и символы, к объектно-реляционным, содержащим данные со слож­ным поведением. Например, географам следует иметь возможность реализации карт, специалистам в области текстов имеет смысл реализовывать индексацию и выборку текстов, специалистам по гра­фическим образам стоило бы реализовать библиотеки типов для работы с образами. Конкретным примером может служить распро­страненный объективный тип временных рядов. Вместо встраива­ния этого объекта в систему баз рекомендуется реализация соответ­ствующего типа в виде библиотеки классов с методами для созда­ния, обновления и удаления временных рядов.

Быстрое развитие Интернета усиливает эти дебаты. Клиенты и серверы Интернета строятся с использованием апплетов и «хелперов», которые сохраняют, обрабатывают и отображают данные того или иного типа. Пользователи вставляют эти апплеты в брау­зер или сервер. Общераспространенные апплеты управляют зву­ком, графикой, видео, электронными таблицами, графами. Для каждого из ассоциированных с этими апплетами типов данных имеется библиотека классов. Настольные компьютеры и Web-браузеры являются распространенными источниками и при­емниками большей части данных. Поэтому типы и объектные мо­дели, используемые в настольных компьютерах, будут диктовать, какие библиотеки классов должны поддерживаться на серверах баз данных.

Подводя итог, следует отметить, что базы данных призваны хранить не только числа и текст. Они используются для хранения многих видов объектов и связей между этими объектами, что мы видим в World Wide Web. Различие между базой данных и осталь­ной частью Web становится неясным.

Чтобы приблизиться к современному состоянию технологии управления данными, имеет смысл описать два крупных проекта, в которых используются предельные возможности сегодняшней технологии [10]. Система Earth Observation System/Data Information System (EOS/DIS) разрабатывается агентством NASA и его подрядчиками для хранения всех данных, которые начали поступать со спутников серии «Миссия к планете Земля» с 1977 г. Объем базы данных, включающей данные от удаленных сенсор­ных датчиков, будет расти на 5 Тбайт в день (1 Тбайт —106 Гбайт). К 2007 г. размер базы данных вырастет до 15 Пбайт. Это в 1000 раз больше объема самых больших современных оперативных баз данных. NASA желает, чтобы эта база данных была доступна каж­дому в любом месте и в любое время. Любой человек сможет осуществлять поиск, анализ и визуализацию данных из этой базы. Для построения EOS/DIS потребуются наиболее развитые методы хранения, поиска и визуализации данных. Большая часть данных будет обладать пространственными и временными характеристи­ками, так что для системы потребуются существенное развитие технологии хранения данных этих типов, а также библиотеки классов для различных научных наборов данных. Например, для этого приложения потребуется библиотека для определения снеж­ного покрова, каталога растительных форм, анализа облачности и других физических свойств образов.

Другим впечатляющим примером базы данных является созда­ваемая всемирная библиотека. Многие ведомственные библиоте­ки открывают доступ к своим хранилищам в режиме on-line. Но­вая научная литература публикуется в режиме on-line. Такой вид публикаций поднимает трудные социальные вопросы по поводу авторских прав и интеллектуальной собственности и заставляет решать глубокие технические проблемы. Пугают размеры и мно­гообразие информации. Информация появляется на многих язы­ках, во многих форматах данных и в громадных объемах. При применении традиционных подходов к организации такой инфор­мации (автор, тема, название) не используются мощности компь­ютеров для поиска информации по содержимому, для связывания документов и для группирования сходных документов. Поиск тре­буемой информации в море документов, карт, фотографий, ау­дио- и видеоинформации представляет собой захватывающую и трудную проблему.

Быстрое развитие технологий хранения информации, коммуни­каций и обработки позволяет переместить всю информацию в киберпространство. Программное обеспечение для определения, по­иска и визуализации оперативно доступной информации — ключ к созданию и доступу к такой информации. Основные задачи, кото­рые необходимо решить:

• определение моделей данных для их новых типов (например, пространственных, темпоральных, графических) и их интеграция с традиционными системами баз данных;

• масштабирование баз данных по размеру (до петабайт), про­странственному размещению (распределенные) и многообразию (неоднородные);

• автоматическое обнаружение тенденций данных, структур и аномалий (поиск, анализ данных);

• интеграция (комбинирование) данных из нескольких источ­ников;

• создание сценариев и управление потоком работ (процессом) и данными в организациях;

• автоматизация проектирования и администрирования базами данных.

Контрольные вопросы

 

1. Укажите основные уровни информатики.

2. Поясните суть понятия информации.

3. Что такое абстрагирование информации и каковы его основные способы?

4. Что такое агрегирование информации?

5. Дайте определение информационной технологии и поясните ее содержание.

6. Перечислите основные уровни информационных технологий.

7. Раскройте содержание прикладного уровня информационных технологий.

8. Выделите основные фазы (поколения) эволюции информационных технологий.

 

 

Глава 4



©2015- 2017 stydopedia.ru Все материалы защищены законодательством РФ.