Кластерные архитектуры в системах управления
Основными проблемами построения вычислительных систем для критически важных систем управления, связанных с обработкой транзакций[10], управлением базами данных и обслуживанием телекоммуникаций, являются обеспечение высокой производительности и продолжительного функционирования систем. Наиболее эффективный способ достижения требуемого уровня производительности - применение параллельных масштабируемых архитектур. Задачи обеспечения эффективного продолжительного функционирования информационной системы связаны с обеспечением надежности, готовности и удобства обслуживания. Все эти составляющие направлены, в первую очередь, на предотвращение неисправностей системы, вызванных отказами и сбоями в ее работе. Все три направления взаимосвязаны и применяются совместно.
Повышение надежности достигается путем снижения интенсивности отказов и сбоев за счет применения электронных схем и компонентов с высокой и сверхвысокой степенью интеграции, снижения уровня помех, облегченных режимов работы схем, обеспечение тепловых режимов их работы, а также за счет совершенствования методов сборки аппаратуры.
Повышение уровня готовности достигается в определенных пределах за счет уменьшения влияния отказов и сбоев на работу системы управления, с помощью применения средств контроля и коррекции ошибок, а также средств автоматического восстановления вычислительного процесса после проявления неисправности. Используя также аппаратурную и программную избыточность, на основе которой конструируются различные варианты отказоустойчивых архитектур. Повышение готовности снижает время простоя информационной системы.
Основные эксплуатационные характеристики системы также существенно зависят от удобства обслуживания, в частности, от ремонтопригодности, контролепригодности.
В целом комплекс указанных мероприятий направлен на создание "систем высокой готовности" (High Availability Systems). Все типы систем высокой готовности имеют общую цель - минимизацию времени простоя информационной системы.
Различают плановое и неплановое время простоя компьютерной системы. Минимизация каждого из видов простоя требует различной стратегии и технологии.
Плановое время простоя обычно включает время, выделенное руководством для проведения работ по модернизации системы и для ее обслуживания.
Неплановое время простоя является результатом отказа системы или ее компонента. Системы высокой готовности обеспечивают как минимизацию неплановых простоев, так и уменьшение планового времени простоя.
Существует несколько типов систем высокой готовности, отличающиеся своими функциональными возможностями и стоимостью. Следует отметить, что высокая готовность не дается бесплатно. Стоимость систем высокой готовности намного превышает стоимость обычных систем. Поэтому наибольшее распространение в мире получили кластерные системы, которые обеспечивают достаточно высокий уровень готовности систем при относительно низких затратах.
Термин "кластеризация" в компьютерной технологии имеет много различных значений. Одно из определений устанавливает, что кластеризация - это "реализация объединения машин, представляющегося единым целым для операционной системы, системного программного обеспечения, прикладных программ и пользователей".
Машины, кластеризованные вместе таким способом, могут при отказе одного процессора быстро перераспределить работу, загрузив исправные процессоры внутри кластера. Это наиболее важная задача систем высокой готовности.
Первой концепцию кластерной системы анонсировала компания DEC, представив на рынок группу объединенных между собой вычислительных машин, представляющих собой единый узел обработки информации (VAX-кластер), который представляет собой многомашинную систему с общей внешней памятью, обеспечивающую единый механизм управления и администрирования. Развитием VAX-кластера стали UNIX-кластеры на базе операционной системы UNIX.
Разделение ресурсов. Компьютеры в кластере могут иметь раздельный доступ к общим накопителям. Все компьютеры в кластере могут обращаться к отдельным файлам данных как к локальным.
Высокая готовность. Если происходит отказ одного из компьютеров, задания его пользователей автоматически могут быть перенесены на другой компьютер кластера. Если в системе имеется несколько контроллеров внешних накопителей и один из них отказывает, другие контроллеры автоматически выполняют его работу.
Высокая пропускная способность. Ряд прикладных систем могут пользоваться возможностью параллельного выполнения заданий на нескольких компьютерах кластера.
Удобство обслуживания системы. Общие базы данных могут обслуживаться одной из машин кластера. Прикладные программы могут инсталлироваться однократно на общих дисках кластера и разделяться между всеми компьютерами кластера.
Расширяемость. Увеличение вычислительной мощности кластера достигается подключением к нему дополнительных компьютеров. Дополнительные накопители становятся доступными для всех компьютеров, входящих в кластер.
Работа любой кластерной системы определяется двумя главными компонентами: высокоскоростной связью процессоров между собой и системным программным обеспечением, которое предоставляет клиентам доступ к системному сервису.
Технология параллельных баз данных. Эта технология позволяет множеству процессоров разделять доступ к единственной базе данных. Распределение заданий по множеству процессорных ресурсов и параллельное их выполнение позволяет достичь более высокого уровня пропускной способности транзакций, поддерживать большее число одновременно работающих пользователей и ускорить выполнение сложных запросов.
Существуют три различных типа архитектуры, которые поддерживают параллельные базы данных:
· симметричная многопроцессорная архитектура с общей памятью (Shared Memory SMP Architecture). Эта архитектура поддерживает единую базу данных, работающую на многопроцессорном сервере под управлением одной операционной системы. Увеличение производительности таких систем обеспечивается наращиванием числа процессоров, устройств оперативной и внешней памяти.
· архитектура с общей (разделяемой) памятью (дисками) (Shared Disk Architecture). Эта архитектура построения кластерной системы поддерживает единую базу данных при работе с несколькими компьютерами, объединенными в кластер (обычно такие компьютеры называются узлами кластера), каждый из которых работает под управлением автономных операционной системы. В таких системах все узлы разделяют доступ к общим дискам, на которых и располагается единая база данных. Производительность таких систем может увеличиваться как путем наращивания числа процессоров и объемов оперативной памяти в каждом узле кластера, так и посредством увеличения количества самих узлов
· архитектура без разделения ресурсов (Shared Nothing Architecture). Как и в архитектуре с общими дисками, в этой архитектуре поддерживается единый образ базы данных при работе с несколькими компьютерами, работающими под управлением автономной операционной системы. В этой архитектуре каждый узел системы имеет собственную оперативную память и собственные диски, которые не разделяются между отдельными узлами системы. В таких системах разделяется только общий коммуникационный канал между узлами системы. Производительность таких систем может увеличиваться путем добавления процессоров, увеличения объемов оперативной и внешней (дисковой) памяти в каждом узле, а также путем наращивания количества таких узлов.
Таким образом, среда для работы параллельной базы данных в кластере обладает двумя важными свойствами: высокой готовностью и высокой производительностью. В случае кластерной организации несколько компьютеров или узлов кластера работают с единой базой данных. В случае отказа одного из таких узлов, оставшиеся узлы могут взять на себя задания, выполнявшиеся на отказавшем узле, не останавливая общий процесс работы с базой данных. Поскольку логически в каждом узле системы имеется образ базы данных, доступ к базе данных будет обеспечиваться до тех пор, пока в системе имеется по крайней мере один исправный узел. Системы такого типа легко масштабируются, путем добавления дополнительных процессоров, объемов оперативной и дисковой памяти и новых узлов в системе в любое время, когда это действительно требуется.
Параллельные базы данных находят широкое применение в системах обработки транзакций в реальном масштабе времени (on-line), системах поддержки принятия решений и часто используются при работе с критически важными для работы предприятий и организаций приложениями, которые эксплуатируются по 24 часа в сутки.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|