Алфавитный подход к измерению информации.

Кодирование Информации.

Термин «информация» восходит к латинскому informatio– разъяснение, изложение, осведомленность. Информацию можно классифицировать разными способами, и разные науки это делают по-разному. Например, в философии различают информацию объективную и субъективную. Объективная информация отражает явления природы и человеческого общества. Субъективная информация создается людьми и отражает их взгляд на объективные явления.
В информатике отдельно рассматривается аналоговая информация и цифровая. Это важно, поскольку человек благодаря своим органам чувств, привык иметь дело с аналоговой информацией, а вычислительная техника, наоборот, в основном, работает с цифровой информацией.
Разница между аналоговой информацией и цифровой, прежде всего, в том, что аналоговая информация непрерывна, а цифровая дискретна.
К цифровым устройствам относятся персональные компьютеры – они работают с информацией, представленной в цифровой форме, цифровыми являются и музыкальные проигрыватели лазерных компакт дисков.

Количество информации.

Содержательный подход к измерению информации.

Для человека информация — это знания человека. Рассмотрим вопрос с этой точки зрения. Получение новой информации приводит к расширению знаний. Если некоторое сообщение приводит к уменьшению неопределенности нашего знания, то можно говорить, что такое сообщение содержит информацию.
Отсюда следует вывод, что сообщение информативно (т.е. содержит ненулевую информацию), если оно пополняет знания человека. Например, прогноз погоды на завтра — информативное сообщение, а сообщение о вчерашней погоде неинформативно, т.к. нам это уже известно.
Нетрудно понять, что информативность одного и того же сообщения может быть разной для разных людей. Например: «2x2=4» информативно для первоклассника, изучающего таблицу умножения, и неинформативно для старшеклассника.
Получение всяких знаний должно идти от простого к сложному. И тогда каждое новое сообщение будет в то же время понятным, а значит, будет нести информацию для человека.
Очевидно, различать лишь две ситуации: «нет информации» — «есть информация» для измерения информации недостаточно. Нужна единица измерения, тогда мы сможем определять, в каком сообщении информации больше, в каком — меньше.
Неопределенность знаний о некотором событии — это количество возможных результатов события.

Рассмотрим один пример.
На книжном стеллаже восемь полок. Книга может быть поставлена на любую из них. Сколько информации содержит сообщение о том, где находится книга?
Применим метод половинного деления. Зададим несколько вопросов уменьшающих неопределенность знаний в два раза.

Задаем вопросы:
- Книга лежит выше четвертой полки?
- Нет.
- Книга лежит ниже третьей полки?
- Да .
- Книга — на второй полке?
- Нет.
- Ну теперь все ясно! Книга лежит на первой полке!

Каждый ответ уменьшал неопределенность в два раза.
Всего было задано три вопроса. Значит набрано 3 бита информации. И если бы сразу было сказано, что книга лежит на первой полке, то этим сообщением были бы переданы те же 3 бита информации.
Если обозначить возможное количество событий, или, другими словами, неопределенность знаний N, а буквой I количество информации в сообщении о том, что произошло одно из N событий, то можно записать формулу:
2^I = N
Количество информации, содержащееся в сообщении о том, что произошло одно из N равновероятных событий, определяется из решения показательного уравнения: 2^I = N.

Единицы измерения информации

Единицы измерения информации. Бит. Байт. Бит – наименьшая единица представления информации. Байт – наименьшая единица обработки и передачи информации. Количество информации в сообщении, таким образом, зависит от того, насколько ново это сообщение для получателя. Если в результате получения сообщения достигнута полная ясность в данном вопросе (т.е. неопределенность исчезнет), говорят, что получена исчерпывающая информация. Это означает, что нет необходимости в дополнительной информации на эту тему. Напротив, если после получения сообщения неопределенность осталась прежней (сообщаемые сведения или уже были известны, или не относятся к делу), значит, информации получено не было (нулевая информация).
Единица измерения информации называется бит (bit) – сокращение от английских слов binary digit, что означает двоичная цифра. В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено – не намагничено, есть отверстие – нет отверстия. При этом одно состояние принято обозначать цифрой 0, а другое – цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding). В информатике часто используется величина, называемая байтом (byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из 256 (28).

Алфавитный подход к измерению информации.

А теперь познакомимся с другим способом измерения информации. Этот способ не связывает количество информации с содержанием сообщения, и называется он алфавитным подходом.
При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.
Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык.
Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами.
Полное количество символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54.
В каждой очередной позиции текста может появиться любой из N символов. Тогда, согласно известной нам формуле, каждый такой символ несет I бит информации, который можно определить из решения уравнения: 2I = 54. Получаем: I = 5.755 бит.
Применение алфавитного подхода удобно прежде всего при использовании технических средств работы с информацией. В этом случае теряют смысл понятия «новые — старые», «понятные — непонятные» сведения. Алфавитный подход является объективным способом измерения информации в отличие от субъективного содержательного подхода.
Удобнее всего измерять информацию, когда размер алфавита N равен целой степени двойки. Например, если N=16, то каждый символ несет 4 бита информации потому, что 24 = 16. А если N =32, то один символ «весит» 5 бит.
Ограничения на максимальный размер алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. С ним мы скоро встретимся при работе с компьютером. Это алфавит мощностью 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания....
Поскольку 256 = 28, то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ей даже присвоили свое название — байт.
1 байт = 8 бит.
Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.
В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.
В любой системе единиц измерения существуют основные единицы и производные от них.
Для измерения больших объемов информации используются следующие производные от байта единицы:
1 килобайт = 1Кб = 2^10 байт = 1024 байта.
1 мегабайт = 1Мб = 2^10 Кб = 1024 Кб.
1 гигабайт = 1Гб = 2^10 Мб = 1024 Мб.

Название	Условное обозначение	Соотношение с другими единицами
Килобит	Кбит	1 Кбит = 1024 бит = 2^10 бит
Мегабит	Мбит	1 Мбит = 1024 Кбит = 2^20 бит
Гигабит	Гбит	1 Гбит = 1024 Мбит = 2^30 бит
Килобайт	Кбайт (Кб)	1 Кбайт = 1024 байт = 2^10 байт
Мегабайт	Мбайт (Мб)	1 Мбайт = 1024 Кбайт = 2^20 байт
Гигабайт	Гбайт (Гб)	1 Гбайт = 1024 Мбайт = 2^30

Прием-передача информации могут происходить с разной скоростью. Количество информации, передаваемое за единицу времени, есть скорость передачи информации или скорость информационного потока.

Очевидно, эта скорость выражается в таких единицах, как бит в секунду (бит/с), байт в секунду (байт/с), килобайт в секунду (Кбайт/с) и т.д.

СИСТЕМЫ СЧИСЛЕНИЯ(СС) - способы кодирования числовой информации,т.е. способ записи чисел с помощью некоторого алфавита, символы которого называют цифрами. Бывают позиционные и непозиционные СС.

НЕПОЗИЦИОННАЯ СИСТЕМА СЧИСЛЕНИЯ – в ней величина, которую обозначает цифра не зависит от положения в числе.

Самой популярной системой кодирования чисел оказалась позиционная, десятичная. Используются десять цифр. Значение каждой определяется той позицией, которую цифра занимает в записи числа.
Эта система пришла из Индии, где она появилась не позднее VI века,европейцы заимствовали ее у арабов,назвав ее арабской. Из арабского языка заимствовано слово "цифра". Причина ее возникновения анатомическая-10 пальцев АНАТОМИЧЕСКАЯ система счисления (существовали пятиричные, двадцатиричные системы счисления)

В десятичной позиционной системе особую роль играет число 10 и его степени, например, 1996 - 6 единиц, 9 десятков, 9 сотен 1 тысяча или 1996=6+9*10+9*100+1*1000, т.к.1000=10³ в третьей степени, 100=10², 10=10¹, т.о. 1996=1*10³ + 9*10² + 9*10¹ +6*10^0.

ЛЮБОЕ ЧИСЛО В НУЛЕВОЙ СТЕПЕНИ РАВНО ЕДИНИЦЕ 10^0 = 1

Т.е. любое 4-х значное число можно записать в следующем виде:

N=a₃*10³+a₂*10²+a₁*10¹+a₀*10⁰

a₃, a_2,a₁, a₀-десятичные цифры, от 1 до 9 или коэффициенты, 3 2 1 0 -разряды, степени,
число 10 со степенями называют основанием системы счисления

Но основанием системы может быть не обязательно число 10, т.о. мы можем записать число в
р-ичной системе, где основанием будут степени числа р Т.о. любое число N в р-ичной системе мы можем представить в виде формулы:

N=a_n*Pⁿ+a_n-1*P^n-1+...+a₁*P¹+a₀*P⁰

Если взять за основание 60, то придется использовать 60 разных цифр. Такая система была в Древнем Вавилоне.

Если основанием возьмем 2, получим систему всего с двумя цифрами:
0 и 1. К сожалению в этой системе даже небольшие числа записываются слишком длинно, так 1995 в двоичной системе записывается

1995₁₀=11111001011₂

Не нашли, что искали? Воспользуйтесь поиском по сайту: