Сделай Сам Свою Работу на 5

Время поиска/время переключения головок/время переключения между цилиндрами





Время поиска (seek time) минимально только в случае необходимости операции с дорожкой, которая является соседней с той, над которой в данный момент находится головка. Наибольшее время поиска соответственно при переходе с первой дорожки на последнюю. Как правило, в паспортных данных на жесткий диск указывается среднее время поиска (average seek time).

Все магнитные головки диска находятся в каждый момент времени над одним и тем же цилиндром, и время переключения определяется тем, насколько быстро выполняется переключение между головками при чтении или записи.

Время переключения между цилиндрами - это время, требуемое для перемещения головок на один цилиндр вперед или назад.

Все времена указываются в документации на жесткие диски в миллисекундах (ms).

Задержка позиционирования

После того, как головка оказывается над желаемой дорожкой, она ждет появления требуемого сектора на этой дорожке. Это время называется задержкой позиционирования и также измеряется в миллисекундах (ms). Среднее время задержки позиционирования считается как время поворота диска на 180 градусов и, поэтому зависит только от скорости вращения шпинделя диска. Конкретные данные по величине задержки сведены в таблицу.



Скорость вращения,об/мин Задержка,миллисекунды
8.3
6.7
5.7
4.2
3.3

 

Время доступа к данным

Время доступа к данным по сути - это комбинация из времени поиска, времени переключения головок и задержки позиционирования, измеряется также в миллисекундах (ms). Время поиска, как вам уже известно, это только показатель того, как быстро головка оказывается над нужным цилиндром. До тех пор, пока данные не записаны или считаны, следует добавить время на переключение головок и на ожидание необходимого сектора.

Кэш-память на жестком диске

Как правило, на всех современных жестких дисках есть собственная оперативная память, называемая кэш-памятью (cache memory) или просто кэшем. Производители жестких дисков часто называют эту память буферной. Размер и структура кэша у фирм-производителей и для различных моделей жестких дисков существенно отличаются. Обычно кэш память используется как для записи данных так и для чтения, но на SCSI дисках иногда требуется принудительное разрешение кэширования записи, так обычно по умолчанию кэширование записи на диск для SCSI запрещено. Есть программы, позволяющие, определить, как установлены параметры кэш-памяти, например ASPIID от фирмы Seagate. Как это многим не покажется странным, размер кэша не является определяющим для оценки эффективности его работы. Организация обмена данными с кэшем более важна для повышения быстродействия диска в целом.



Некоторые производители жестких дисков, такие как Quantum, используют часть кэша под свое программное обеспечение (для модели Quantum Fireball 1.3 Gb, например, под firmware занято 48 Kb из 128). Как нам кажется, более предпочтителен способ, используемый фирмой Western Digital. Для хранения firmware используются специально отведенные сектора на диске, невидимые для любых операционных систем. По включению питания эта программа загружается в обычную дешевую DRAM на диске и при этом отпадают затраты на микросхему флэш-памяти для хранения firmware. Такой способ позволяет легко исправлять встроенное программное обеспечение жесткого диска, что часто фирма Western Digital и делает.

Размещение данных на диске

О том, что конфигурация диска задается через количество цилиндров, головок и секторов на дорожке, все знают с начала эпохи PC. Хотя еще несколько лет тому назад точное указание в программе SETUP всех этих параметров диска было обязательным, сейчас это не так. Строго говоря, те параметры диска, которые вы видите в разделе SETUP Standard CMOS Setup, как правило, ничего общего не имеют с реальными параметрами диска, причем вы можете заметить, что эти параметры меняются в зависимости от вида трансляции геометрии диска - Normal, LBA и Large. Normal - геометрия в соответствии с данной производителем в документации на диск и не позволяет DOS увидеть более чем 504 Mb (1 Mb - 1048576 байт). LBA - Logical Block Address - эта установка позволяет видеть DOS диски объемом до 4 Gb. Large используется такой операционной системой, как Unix. Параметры, установленные в SETUP, преобразуются в реальные логикой управления жестким диском. Многие современные операционные системы работают с диском через LBA, минуя BIOS. В последнее время IDE и в большей степени SATA жесткие диски все чаще и чаще используются для построение отказоустойчивых дисковых подсистем на базе RAID контроллеров и/или внешних дисковых массивов. Большая емкость на один диск, низкая стоимость и вполне приличная надежность делает эти диски в ближайшей перспективе серьезными конкурентами для SCSI в серверных системах, а во внешних дисковых системах для работы с оцифрованным кино и видео SCSI диски уже практически не применяются. Но при использовании обычных IDE/SATA жестких дисков в RAID массивах может возникнуть одна довольно неприятная проблема, о решении которой мы и расскажем в этой заметке.



Суть проблемы

Чаще всего в RAID-массивы устанавливают стандартные жесткие диски, изначально предназначенные для обычных desktop компьютеров, по той простой причине, что иных SATA/IDE дисков просто нет. Они обладают большой емкостью, высокой надежностью и сравнительно низкой стоимостью. Казалось бы, чего же боле? Однако, здесь и существует проблема! Дело в том, что во все современные IDE/SATA жесткие диски для повышения надежности хранения данных встроена автоматическая функция коррекции ошибок. При ее разработке исходили из здравого посыла, что жесткий диск не должен отправлять куда-либо сообщение о каждой обнаруженной ошибке чтения, загружая тем самым другие устройства (в том числе процессор компьютера) ненужной дополнительной работой. Напротив, он должен предпринять все возможное для самостоятельной коррекции обнаруженной ошибки, для начала многократно пытаясь прочитать сбойный блок, а потом исключив его из использования, сделав переназначение (remap) плохого сектора на хороший. Погрузившись в данную "внутреннюю" операцию, диск начинает отвечать на внешние запросы с большой задержкой, тем большей, чем интенсивней поступают на него команды записи/чтения.

И это правильно до тех пор, пока этот диск функционирует сам по себе, являясь самостоятельным, не входящим ни в какие RAID массивы, устройством хранения данных. Однако, когда он является частью сложной системы из многих дисков в RAID массиве, некоторые диски в которых выделены для хранения резервных данных на случай любой ошибки, т.е. системы, управляемой специализированным интеллектуальным RAID контроллером, подобная "самостоятельность" установленного в систему диска может приводить к проблемам. Одной из важнейших задач контроллера RAID является постоянный анализ распределяемых между дисками данных на предмет возможного появления и немедленной коррекции ошибок. Поэтому RAID контроллер, отвечая за работоспособность всей системы, ожидает ответа от каждого диска строго определенное время (обычно 8 секунд), по истечении которого считает, что вовремя не ответивший диск неисправен, и принимает решение об его исключении из системы с последующим перераспределением данных между оставшимися дисками. При этом нагрузка на них возрастает, и в этих условиях и второй диск может вовремя не ответить, что уже приведет к крушению всей системы с потерей данных (напомним, что в наиболее популярных RAID уровнях 3 и 5 резервные данные хранятся только на одном диске и выход сразу двух фатален - все данные теряются). Но в результате последующего анализа может оказаться, что отключенные диски были вполне работоспособны и могли далее использоваться, но уже будет слишком поздно.

Здесь не поможет и наличие диска в "горячем" резерве - пока RAID контроллер будет вводить его в массив (этот процесс может занять часы и дни, в зависимости от нагрузки на RAID), вполне может "отвалиться" следующий диск в массиве и данные также будут безвозвратно потеряны. Эта ситуация иллюстрируется на рисунке ниже.

Безусловно, такая проблема возникает только при интенсивной работе дисков в RAID массиве на запись/чтение данных. Но, достаточно совпадения буквально минутной "тяжелой" нагрузки на RAID массив и начала автоматической процедуры восстановления ошибки на каком-то жестком диске, как ложный выход из строя жесткого диска станет вполне реальным. Трудность решения этой проблемы в том, что диск и на самом деле, реально, может выйти из строя, поэтому удлинение допустимого времени отклика от жесткого диска, что иногда, к сожалению, делают некоторые производители RAID контроллеров не решает проблему, а наоборот, загоняет ее вглубь. Ведь в том случае, если диск на самом деле сломался, промедление в реакции RAID контроллера на это событие чревато полной потерей данных.

Наличие данной проблемы (задержка отклика из-за встроенной функции коррекции ошибок) не зависит от того, диски какого производителя вы планируете использовать. Ее возможное решение в другом – ввести ограничение на максимально допустимую длительность обработки ошибок жестким диском с обязательным информированием RAID контроллера о наличии конкретной ошибки. В этом случае RAID контроллер поймет, что диск исправен, но у него есть конкретная ошибка в конкретном месте, которую контроллер легко скорректирует.

К сожалению, единственной компанией, которая предложила такое понятное и очевидное любому грамотному специалисту решение, стала Western Digital Corporation. Она разработала специальную серию дисков RAID Edition c функцией TLER(TimeLimitedErrorCorrection - Ограниченное время на коррекцию ошибки). TLER-диски при возникновении ошибки начинают нормальный процесс ее коррекции, но, не уложившись в 7 секунд, сообщают RAID-контроллеру о возникшей ошибке, откладывая дальнейшую обработку ошибки на "лучшее" время (например, на момент простоя системы). При этом контроллер легко справится с возникшей ошибкой чтения данных с данного диска – ведь для этого в его распоряжении всегда есть резервная информация. Такой алгоритм иллюстрируется на рисунке ниже.

Отметим, что RAID Edition диски от Western Digital кроме функции TLER отличает и увеличенное вдвое время наработки на отказ. Несмотря на то, что случаев возникновения этой ошибки довольно мало в массивах с SATA дисками, но довольно много случаев в массивах с IDE дисками, мы настоятельно рекомендуем применение дисков с TLER в любых RAID массивах, особенно рассчитанных на работу под серьезной нагрузкой или имеющих хотя бы пики с с ней. Надеемся, что и другие компании-производители жестких дисков начнут выпуск аналогичных дисков.

 

 

5.Интерфейсы жестких дисков

На данный момент самым распространенным интерфейсом является SATA 2. SATA хоть и можно встретить в продаже, однако интерфейс уже считается устаревшим, к тому же уже начали поступать жесткие диски с SATA 3. Не стоит путать SATA 3 с SATA 3,0 Гбит/с, во втором случае речь идет об интерфейсе SATA 2, который имеет пропускную способность равную до 3,0 Гбит/с (у SATA 3 пропускная способность равна до 6 Гбит/с) Интерфейс – устройство, передающее и преобразующее сигналы, от одного компонента оборудования к другому. Виды интерфейса. PATA, SATA, SATA 2, SATA 3 и тд. Накопители различных поколений использовали такие интерфейсы: IDE (ATA), USB, Serial ATA (SATA), SATA 2, SATA 3, SCSI, SAS, CF, EIDE, FireWire, SDIO и Fibre Channel. IDE (АТА – Advanced Technology Attachment) - параллельный интерфейс подключения накопителей, именно поэтому был изменен (с выходом SATA) на PATA (Parallel ATA). Раньше использовался для подключения винчестеров, но был вытеснен интерфейсом SATA. В настоящее время используется для подключения оптических накопителей. SATA (Serial ATA) – последовательный интерфейс обмена данными с накопителями. Для подключения используется 8-pin разъем. Как и в случае с PATA – является устаревшим, и используется только для работы с оптическими накопителями. Стандарт SATA (SATA150) обеспечивал пропускную способность равную 150 МБ/с (1,2 Гбит/с). SATA 2 (SATA300). Стандарт SATA 2 увеличивал пропускную способность в двое, до 300 МБ/с (2,4 Гбит/с), и позволяет работать на частоте 3 ГГц. Стандартны SATA и SATA 2 совместимы между собой, однако для некоторых моделей необходимо вручную устанавливать режимы, переставляя джамперы. SATA 3, хотя про требованию спецификаций правильно называть SATA 6Gb/s. Этот стандарт в двое увеличил скорость передачи данных до 6 Гбит/с (600 МБ/с). Также к положительным нововведениям относится функция программного управления NCQ и команды для непрерывной передачи данных для процесса с высоким приоритетом. Хоть интерфейс и был представлен в 2009 году, особой популярностью у производителей он пока не пользуется и в магазинах встречает не так часто. Кроме жестких дисков этот стандарт используется в SSD (твердотельные диски). Стоит заметить, что на практике пропускная способность интерфейсов SATA не отличаются скоростью передачи данных. Практически скорость записи и чтения дисков не превышает 100 Мб/с. Увеличение показателей влияет только пропускную способность между контроллером и кеш-памятью накопителя. SCSI(Small Computer System Interface) – стандарт применяется в серверах, где необходима повышеная скорость передачи данных. SAS (Serial Attached SCSI) – поколение пришедшее на смену стандарта SCSI, использующее последовательную передачу данных. Как и SCSI используется в рабочих станциях. Полностью совместив с интерефейсом SATA. CF (Compact Flash) – Интерфейс для подключения карт памяти, а также для 1,0 дюймовых винчестеров. Различают 2 стандарта: Compact Flash Type I и Compact Flash Type II, отличие в толщине. FireWire – альтернативный интерфейс более медленному USB 2.0. Используется для подключения портативных жестких дисков. Поддерживает скорость до 400 Мб/с, однако физическая скорость ниже, чем у обычных. При чтении и записи максимальный порг 40 Мб/с.

 

6. Развитие технологий: технология вертикальной записи данных; «твердотелые» жесткие диски

Большие Данные начинаются с больших проблем, вызванных необходимостью хранить и обеспечивать доступ к массивам данных, причем оказалось, что требуются новые решения как на уровне архитектур систем хранения (облачное хранение и резервирование, распределенные хранилища), так и на физическом уровне. Сейчас хранение данных распределено по четырем основным типам устройств: жесткие диски (Hard Disk Drive, HDD), оптические диски (Optical Disk Drive, ODD),твердотельные накопители (Solid State Drive, SSD) и магнитные ленты. Принятая прежде двухуровневая схема из дисков SAS, SATA и лент устарела — сегодня требуются новые технические решения. Флэш-память NAND и переход на трехуровневую стали первыми шагами в этом направлении.

Тенденции

На сегодняшний день 70–80% всех данных в мире приходится на HDD, емкость которых растет главным образом за счет повышения плотности хранения — ежегодный прирост составляет 40%. Кроме этого, имеется еще ряд направлений усовершенствования качества HDD — например, для улучшения соотношения сигнал-шум предложена канальная технология IDRC (Iterative Detection Read Channel), развиваются методы передачи данных, использующие коды с исправлением ошибок, усовершенствованные сервомеханизмы в приводах головок.

Современный жесткий диск представляет собой сложную сбалансированную композицию взаимосвязанных технологий, причем изменение одной из них влияет на другие и на систему хранения в целом. Например, улучшение соотношения сигнал-шум открывает возможности к переходу на облегченные коды с малой плотностью проверок на четность (Low-Density Parity-Check code, LDPC code) вместо применения более «тяжелых» кодов Рида — Соломона с исправлением ошибок (Reed-Solomon Error Connection Code, RS-ECC), что позволяет повысить суммарную производительность систем хранения. Однако самая критичная характеристика — плотность записи, и в ближайшие годы ее рост обеспечат несколько новых технологий: размеченный (структурированный) носитель данных ( Bit Patterned Media, BPM), запись с энергетической поддержкой (Energy Assisted Magnetic Recording, EAMR) и черепичный метод записи (Shingled Magnetic Recording, SRM). Менее радикальным будет появление дисков, корпуса которых заполняются гелием. Ожидается, что благодаря этим новациям к 2017 году плотность записи на HDD приблизится к 5 Тбайт на квадратный дюйм.

Диски на флэш-памяти при всех их достоинствах все еще уступают HDD по живучести носителя (write endurance), по числу циклов записи, которое выдерживает ячейка, а также по сохранению записанных данных (data retention). Дальнейшее развитие технологий SSD будет нацелено на компенсацию этих недостатков — будут развиваться методы повышения живучести, способы продления жизни ячеек (wear leveling technique), технологии сборки мусора и консолидации фрагментов, а также другие технологии, попадающие в разряд S.M.A.R.T (Self-Monitoring, Analysis and Reporting Technology). Для продления сохранности данных создаются специальные средства наблюдения (SSD patrol functionality), а комитет инженеров, специализирующихся в области электронных устройств (Joint Electron Device Engineering Council, JEDEC), куда входят все основные производители флэш-памяти, разрабатывает соответствующие стандарты.

Нынешние продукты SSD делятся на клиентские (для персональных устройств) и корпоративные (для серверов и систем хранения). В клиентских используется дешевая многоуровневая технология (Multi Level Cell, MLC), а в корпоративных — одноуровневая (Single Level Cell, SLC) и (реже) MLC, гарантирующие в 3–5 раз больший срок жизни [1]. Корпоративные SSD используются в критически важных приложениях, поэтому имеют более высокую надежность и производительность. Переход с SLC на MLC связан с необходимостью уменьшения стоимости хранения.

SSD и HDD удачно дополняют друг друга, а если учесть, что HDD делятся на две категории — более медленные, но емкие 3,5-дюймовые, вращающиеся со скоростью 7,2 тыс. оборотов в минуту, и более быстрые, но менее емкие 2,5-дюймовые, вращающиеся со скоростью 10–15 тыс. оборотов в минуту, — то появилась возможность строить трехуровневые системы хранения. На Tier-0 размещают SSD — 80% всех данных системы хранения, а оставшиеся 20% — на всех остальных уровнях.

HDD

Из распространенных определений Больших Данных (например, «4V»: Volume — объем, Velocity — скорость, Veracity — достоверность, Variety — разнообразие) следует, что поддерживающие системы хранения должны сочетать два качества — быть одновременно емкими и быстрыми. Однако сегодня нет какой-то одной единственной предпочтительной технологии хранения, отвечающей сразу двум этим требованиям: классические HDD удовлетворяют первому, а SSD — второму. Потенциал HDD далеко не исчерпан, а потенциал SSD еще только раскрывается.

За восемь лет, прошедших с момента публикации [2], многое изменилось — тогда о вертикальной или перпендикулярной записи (Perpendicular Magnetic Record, PMR), обеспечивающей большую плотность, чем традиционная горизонтальная или продольная, говорилось в будущем времени, а сегодня этот метод стал основным. Одновременно многие из названных тогда технологий стали реальностью и нацелены на так называемую трилемму магнитной записи: способность к чтению (Readability), способность к записи (Writeability) и стабильность (Stability).

Гелиевые диски

Заполненные гелием диски представляются сегодня наиболее простым и, следовательно, практичным решением. Если корпуса дисков сделать герметичными и заполнить гелием, то в результате уменьшится внутренняя турбулентность, возникающая вокруг головок, а значит, откроется возможность увеличить число пластин и головок, что, в свою очередь, позволит увеличить емкость накопителя (в первых версиях до 6 Тбайт) и повысить производительность. Одновременно уменьшается трение вращающихся поверхностей о воздух — значит, уменьшается энергопотребление и открывается возможность устанавливать в стойку больше дисков при той же системе питания.

Размеченный носитель

Начиная от первого диска IBM RAMAC 350 (Random Access Method of Accounting and Control), имевшего плотность записи примерно 2 Кбит на кв. дюйм, и до современных дисков с перпендикулярной записью, у которых теоретический предел плотности равен 1 Тбит на кв. дюйм, поверхность носителя представляет собой непрерывное пространство магнитных доменов, способных менять магнитную ориентацию. При записи одного бита осуществляется перемагничивание группы из нескольких десятков или нескольких сотен доменов, и чем меньше размер доменов и меньше число доменов в группе, тем плотнее запись. Непрерывность предполагает использование группы доменов, что десятилетиями сохранялось неизменным, однако любое масштабирование вверх или вниз не бесконечно — рано или поздно возникают физические ограничения, например: соотношение шум-сигнал (signal-to-noise ratio, SNR) и термостабильность. Чем меньше размер домена, тем менее стабильно его состояние, размер одного домена определяет предел миниатюризации, ниже которого опускаться невозможно. Однако это не тупик в развитии магнитной записи — есть близкое по смыслу решение, построенное на примерно тех же принципах магнитной записи. Можно увеличить размер доменов, но уменьшить их число в группе до одного: в итоге плотность заметно повысится — в соответствие одному записываемому биту можно поставить один, но достаточно крупный и, следовательно, более стабильный магнитный домен. Этот домен может быть как однокристаллическим, так и поликристаллическим. Теоретически плотность записи можно повысить на порядки по сравнению с вертикальной записью, но в первых экспериментальных дисках полученная плотность была существенно ниже — 2–3 Тбит на кв. дюйм.

Рис. 1. Диск BPM

Для того чтобы одному биту соответствовал один домен, нужен предварительно размеченный носитель данных, и первый патент на BPM был получен японскими учеными еще в 1989 году. Однако более двадцати лет ушло на преодоление трех видов проблем: физика на уровне отдельно взятого домена; литография для нанесения магнитного слоя на носитель; принципиально новая механика головок. Ключевым моментом в технологии BPM является электронно-лучевая литография (Electron Beam Lithography, EBL), и основная сложность состоит в том, что прецизионную технологию надо распространять на изделия, выпускаемые миллионными тиражами. В 2007 году компания HGST, ныне входящая в Western Digital, вместе с Seagate разработала план производства дисков по технологии BPM, в основе которого была технология тиражирования. Сначала изготавливается один эталонный шаблон (master template), затем он копируется в 10 тыс. экземплярах, в свою очередь служащих шаблонами, и, наконец, по каждому из них может быть воспроизведено еще 10 тыс. рабочих дисков. Изготовление эталонного шаблона и его копирование — два совершенно разных технологических процесса, причем первый с научной точки зрения более сложен. Потребовалось создать новые методы литографии и использовать материалы, обладающие способностью к «самосборке» (Self-assembling). Не последнюю проблему составляет и принципиально новая механика BPM, которая должна обеспечивать взаимодействие с управляющими серводорожками, расположенными на диске (рис. 1).

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.