Кодирование информации

КОДИРОВАНИЕ ИНФОРМАЦИИ

Кодирование информации — процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической переработки.

История технических способов кодирования информации

Контрольные вопросы

Правила кодировки

Способы кодировки

арифметические операции в двоичной системе счисления

практические задания

История технических способов кодирования информации

С появлением технических средств хранения и передачи информации возникли новые идеи и приемы кодирования. Первым техническим средством передачи информации на расстояние стал телеграф, изобретенный в 1837 году американцем Сэмюэлем Морзе. Телеграфное сообщение — это последовательность электрических сигналов, передаваемая от одного телеграфного аппарата по проводам к другому телеграфному аппарату. Эти технические обстоятельства привели С.Морзе к идее использования всего двух видов сигналов — короткого и длинного — для кодирования сообщения, передаваемого по линиям телеграфной связи. Такой способ кодирования получил название азбуки Морзе. В ней каждая буква алфавита кодируется последовательностью коротких сигналов (точек) и длинных сигналов (тире). Буквы отделяются друг от друга паузами — отсутствием сигналов.

Сэмюэль Финли Бриз Морзе (1791–1872)

Характерной особенностью азбуки Морзе является переменная длина кода разных букв, поэтому код Морзе называют неравномерным кодом. Буквы, которые встречаются в тексте чаще, имеют более короткий код, чем редкие буквы. Например, код буквы “Е” — одна точка, а код твердого знака состоит из шести знаков. Это сделано для того, чтобы сократить длину всего сообщения. Но из-за переменной длины кода букв возникает проблема отделения букв друг от друга в тексте. Поэтому приходится для разделения использовать паузу (пропуск). Следовательно, телеграфный алфавит Морзе является троичным, т.к. в нем используется три знака: точка, тире, пропуск.

Равномерный телеграфный код

Был изобретен французом Жаном Морисом Бодо в конце XIX века. В нем использовалось всего два разных вида сигналов. Не важно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала. Длина кода всех символов одинаковая и равна пяти. В таком случае не возникает проблемы отделения букв друг от друга: каждая пятерка сигналов — это знак текста. Поэтому пропуск не нужен. Код Бодо — это первый в истории техники способ двоичного кодирования информации. Благодаря этой идее удалось создать буквопечатающий телеграфный аппарат, имеющий вид пишущей машинки. Нажатие на клавишу с определенной буквой вырабатывает соответствующий пятиимпульсный сигнал, который передается по линии связи. Принимающий аппарат под воздействием этого сигнала печатает ту же букву на бумажной ленте.

Жан Морис Эмиль Бодо (1845–1903)

Проанализируем разнообразные виды информации и особенности ее кодирования. По принципу представления все информационные сведения можно классифицировать на следующие группы:

Способы кодировки

Самый широко используемый метод кодирования информации – двоичное кодирование. Кодирование данных двоичным кодом применяется во всех современных технологиях.

символьная (текстовая) информация

аудиоинформация (звуковая)

графическая информация

видеоинформация

числовая информация

Текстовое кодирование информации

Текст – осмысленный порядок знаков. С использованием компьютера кодирование и обработка текстовой информации (набор, редактирование, обмен и сохранение письменного текста) значительно упростилось. Кодирование текстовой информации – присвоение любому символу текста кода из кодировочной системы. Различают следующие стандарты кодировки: ASCII – первая международная система кодировки, содержащая коды на 256 знаков. Unicode – расширенный стандарт ASCII, превышающий ее размером в 256 раз. КОИ-8, СР1251, СР866, ISO – русские таблицы кодировки букв. При этом следует понимать, что документ, закодированный одним стандартом, не будет читаться в другом. В задачах на кодирование текстовой информации часто встречаются следующие понятия: мощность алфавита; единицы измерения памяти (биты и байты). Например, мощность алфавита ASCII составляет 256 символов. При этом один знак занимает 8 бит (или 1 байт) памяти, а Unicode – 35536 символов и 16 бит (или 2 байта) соответственно.

Преобразование звука

Компьютерные технологии успешно внедряются в различные сферы деятельности, включая кодирование и обработку звуковой информации. С физической точки зрения, звук – это аналоговый сплошной сигнал. Процесс его перевода в ряд электрических импульсов называется кодированием звуковой информации. Задачи, которые необходимо решить для успешной оцифровки сигнала: дискретизировать (разделить аудиоданные на элементарные участки путем измерения колебаний воздуха через одинаковые интервалы времени); оцифровать (присвоить каждому элементу числовой код).

Различают следующие методы кодирования звуковой информации: Метод FM. Суть его сводится к разделению звука аналого-цифровыми преобразователями (АЦП) на одинаковые простейшие элементы, которые в дальнейшем кодируются бинарным кодом. Несовершенство метода FM проявляется в низком качестве звукозаписи из-за потери некоторого объема исходного звукового сообщения. Метод Wave-Table (таблично-волновой) позволяет получить высококачественный продукт, поскольку разработанные таблицы сэмплов (образцов «живых» звуков) позволяют выразить бинарными числами разнообразные параметры поступающего сигнала.

Преобразование звука: а) аналоговый сигнал; б)дискретный сигнал.

Обработка графических изображений

Современные люди для работы с графическими данными все чаще применяют компьютерные технологии.

Кодирование графической информации – это процедура присвоения каждому компоненту изображения определенного кодового значения. Способы кодирования графической информации подчиняются методам представления изображений (растрового или векторного): Принцип кодирования графической информации растровым способом заключается в присвоении бинарного шифра пикселям (точкам), формирующим изображение. Код содержит сведения о цветовых оттенках каждой точки. Примером служат снимки, сделанные на цифровом фотоаппарате.

Векторная кодировка осуществляется благодаря использованию математических функций. Компонентам векторных изображений (точкам, прямым и другим геометрическим фигурам) присваивается двоичная последовательность, определяющая разнообразные параметры. Такая графика зачастую применяется в типографии.

Кодирование видеоинформации

Для того чтобы сохранить видео в памяти компьютера, необходимо закодировать звук и изменяющееся изображение. При этом нужно обеспечить их синхронность (одновременность), т. е. звук не должен ни «отставать» от изображения, ни опережать его. Для кодирования звука чаще всего используют оцифровку с частотой 48 кГц. Изображение состоит из отдельных растровых рисунков, которые меняются с частотой не менее 25 кадров в секунду, так что глаз человека воспринимает смену кадров как непрерывное движение. Это значит, что для каждой секунды видео нужно хранить в памяти 25 изображений. Подсчитаем, сколько памяти потребуется для хранения видео. Если размер картинки 768 х 576 точек (стандарты PAL/SECAM) и глубина цвета 24 бита на пиксель, то закодированная 1 секунда видео (без звука) будет занимать примерно 32 Мбайт, а 1 минута — около 1,85 Гбайт. Это недопустимо много, поэтому в большинстве форматов видеоизображений используется сжатие. Упаковку и распаковку видеоданных выполняют специальные программы — кодеки. Основная идея сжатия видео заключается в том, что за короткое время изображение изменяется очень мало, поэтому можно запомнить «базовый» кадр, а затем сохранять только изменения. Через 10-15 секунд изображение изменяется настолько, что необходим новый базовый кадр. Для того чтобы ещё больше уменьшить объём файла, применяют сжатие с потерями, при котором теряются некоторые детали, несущественные для восприятия человеком.

Наиболее известны следующие видеоформаты: • АVI (англ. Audio Video Interleave — чередующиеся звук и видео, файлы с расширением avi) — формат, разработанный компанией Microsoft для системы Windows; может использовать разные алгоритмы сжатия; • WMV (англ. Windows Media Video, файлы с расширением wmv) — формат, разработанный компанией Microsoft; может использовать разные алгоритмы сжатия; • MPEG (файлы с расширениями mpg, mpeg) — формат, использующий один из лучших алгоритмов сжатия, который разработала экспертная группа по вопросам движущегося изображения (англ. MPEG — Motion Picture Experts Group); • MP4 (файлы с расширением mр4) — формат, позволяющий хранить несколько потоков видео, а также субтитры (текстовые надписи на экране); • WebM — открытый (не требующий оплаты лицензии) видеоформат, который поддерживается в современных браузерах без установки дополнительных модулей.

Кодирование числовой информации

позиционные

Для записи информации о количестве объектов используются числа. Числа записываются с использованием особых знаковых систем, которые называются системами счисления. Алфавит системы счисления состоит из символов, которые называются цифрами. Система счисления - это знаковая система, в которой числа записываются по определенным правилам с помощью символов некоторого алфавита, называемых цифрами. Все системы счисления делятся на две большие группы:позиционные и непозиционные. В позиционных системах счисления количественное значение цифры зависит от ее положения в числе, а в непозиционных — не зависит.

непозиционные

Непозиционные системы счисления

Как только люди начали считать, у них появилась потребность в записи чисел. Находки археологов на стоянках первобытных людей свидетельствуют о том, что первоначально количество предметов отображали равным количеством каких-либо значков: зарубок, черточек, точек. Такая система записи чисел называется единичной, так как любое число в ней образуется путем повторения одного знака, символизирующего единицу. Единичной системой счисления пользуются малыши, показывая на пальцах свой возраст или используя для этого счетные палочки. Примером непозиционной системы, которая сохранилась до наших дней, может служить римская система счисления, которая начала применяться более двух с половиной тысяч лет назад в Древнем Риме. В основе римской системы счисления лежат знаки I (один палец) для числа 1, V (раскрытая ладонь) для числа 5, X (две сложенные ладони) для числа 10, а для обозначения чисел 100, 500 и 1000 используются латинские буквы С, D и М. В римской системе счисления количественное значение цифры не зависит от ее положения в числе. Например, в римском числе XXX (30) цифра X встречается трижды и в каждом случае обозначает одну и ту же величину — число 10, три раза по 10 в сумме дают 30. Чтобы записать число в римской системе счисления, необходимо разложить его на сумму тысяч, полутысяч, сотен, полусотен, десятков, пятков, единиц. Например, десятичное число 28 представляется следующим образом: XXVIII =10 + 10 + 5 + 1 + 1 + 1 (два десятка, пяток, три единицы). При записи чисел в римской системе счисления применяется правило: каждый меньший знак, поставленный слева от большего, вычитается из него, в остальных случаях знаки складываются. Например, римское число IX обозначает 9 (-1 + 10), а XI обозначает 11 (10 + 1). Число 99 имеет следующее представление в римской системе счисления: XCIX = -10 + 100 - 1 + 10.

Позиционные системы счисления

Каждая позиционная система счисления имеет определенный алфавит цифр и основание. Основание системы равно количеству цифр (знаков) в ее алфавите. В позиционных системах счисления количественное значение цифры зависит от ее позиции в числе. Позиция цифры в числе называется разрядом. Разряды числа возрастают справа налево, от младших разрядов к старшим, причем значения одинаковых цифр, стоящих в соседних разрядах числа, различаются на величину основания. В настоящее время наиболее распространенными позиционными системами счисления являются десятичная и двоичная. Десятичная система счисления имеет алфавит цифр, который состоит из десяти всем известных, так называемых арабских цифр {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. Алфавит двоичной системы - две цифры {0, 1}

В десятичной системе счисления цифра в крайней справа позиции обозначает количество единиц, цифра, смещенная на одну позицию влево, обозначает количество десятков, еще левее — сотен, затем тысяч и т. д. Рассмотрим в качестве примера десятичное число 555. Цифра 5 встречается в числе трижды, причем самая правая обозначает пять единиц, вторая справа — пять десятков и, наконец, третья — пять сотен. Выше десятичное число 555 было записано в привычной для нас свернутой форме. Мы настолько привыкли к такой форме записи, что уже не замечаем, как в уме умножаем цифры числа на число 10 в различных степенях, где 10 является основанием десятичной системы счисления. В развернутой форме записи числа умножение цифр числа на основание производится в явной форме. Так, в развернутой форме запись числа 555 в десятичной системе будет выглядеть следующим образом: 55510 = 5 • 102 + 5 • 101 + 5 • 100.

Числа в двоичной системе счисления в развернутой форме записываются в виде суммы основания 2 в различных степенях с коэффициентами, в качестве которых выступают цифры 0 или 1. Например, развернутая запись двоичного числа выглядит следующим образом: A2 = 1 • 22 + 0 • 21 + 1 • 20 + 0 • 2-1 + 1 • 2-2, это же число в свернутой форме: A2 = 101,012. Умножение или деление двоичного числа на 2 (величину основания) приводит к перемещению запятой, отделяющей целую часть от дробной на один разряд соответственно вправо или влево. Например: 101,012 • 2 = 1010,12; 101,012 : 2 = 10,1012.

В восьмеричной системе основание равно 8 и алфавит состоит из восьми цифр {0, 1, 2, 3, 4, 5, 6, 7}. Запишем восьмеричное число в свернутой и развернутой формах: 778 = 7 • 81 + 7 • 80.

Позиционные системы счисления

В шестнадцатеричной системе основание равно 16 и алфавит состоит из шестнадцати цифр {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, А, В, С, D, Е, F}, причем первые десять цифр имеют общепринятое обозначение, а для записи остальных цифр со значениями 10, 11, 12, 13, 14, 15 используются первые шесть букв латинского алфавита. Запишем шестнадцатеричное число в свернутой и развернутой формах: ABCDEF16= А • 165 + В • 164 + С • 163 + D • 162 + Е • 161 + F • 160 = 10 • 165 + 11 • 164 + 12 • 163 + 13 • 162+ 14 • 161 + 15 • 160.

Первая позиционная система счисления была придумана еще в древнем Вавилоне, причем вавилонская нумерация была шестидесятеричной, т. е. в ней использовалось шестьдесят цифр! Интересно, что до сих пор при измерении времени мы используем основание, равное 60 (в 1 минуте содержится 60 секунд, а в 1 часе — 60 минут). В XIX веке довольно широкое распространение получила двенадцатеричная система счисления. До сих пор мы часто употребляем дюжину (число 12): в сутках две дюжины часов, круг содержит тридцать дюжин градусов и т. д.

Перевод чисел в десятичную систему счисления

Развернутая форма записи числа В позиционной системе счисления любое число может быть представлено в развернутом виде. Возьмем число в десятичной системе счисления 247,32, и представим его в следующем виде: 247,3210 = 2*100 + 4*10+7*1+3/10+2/100 = 2*102 + 4*101 + 7*100 + 3*10-1 + 2*10-2

Развернутая форма служит для перевода чисел из любой системы счисления в десятичную.

Алгоритм перевода чисел из любой системы счисления в десятичную

Представить число в развернутой форме. При этом основание системы счисления должно быть представлено в десятичной системе счисления
Найти сумму ряда (выражения) . Полученное число является значением числа в десятичной системе счисления.

Перевод целых чисел из десятичной системы счисления в любую другую

Алгоритм перевода целых чисел

Разделить данное число на основание новой системы счисления. Зафиксировать целое частное и остаток от деления (остаток всегда меньше основания).
Если полученное частное больше основания, то разделить частное на основание и вновь зафиксировать новое частное и остаток от деления.
Повторять процесс до тех пор, пока частное не получится меньше делителя.
Полученные остатки, являющиеся цифрами числа в новой системе счисления, привести в соответствие с ее алфавитом.
Записать последнее частное и полученные остатки в обратном порядке в ряд слева направо.

В качестве примера переведем 1910 в двоичную систему счисления согласно алгоритму.

Алгоритм перевода правильных десятичных дробей

Последовательно выполнять умножение исходной десятичной дроби и получаемых дробей на основание системы до тех пор, пока не получим нулевую дробную часть или не будет достигнута требуемая точность вычислений.
Получить искомую дробную часть, записав полученные целые части произведения в прямой последовательности.

В качестве примера рассмотрим перевод десятичной дроби 0,7510 в двоичную систему, согласно алгоритму:

Ответ. 0,7510 = 0,112

Перевод произвольных чисел

Перевод произвольных чисел, т.е. содержащих целую и дробную часть, осуществляется в два этапа. Отдельно переводится целая часть, отдельно – дробная. В итоговой записи полученного числа целая часть отделяется от дробной запятой.

Арифметические операции в двоичной системе счисления

Сложение

Вычитание

Умножение

Деление

Из всех позиционных систем особенно проста двоичная система счисления. Рассмотрим выполнение основных арифметических действий над двоичными числами. Все позиционные системы счисления "одинаковы”, а именно, во всех них выполняются арифметические операции по одним и тем же правилам: - справедливы одни и те же законы арифметики: коммутативный, ассоциативный, дистрибутивный; - справедливы правила сложения, вычитания и умножения столбиком; - правила выполнения арифметических операций опираются на таблицы сложения и умножения.

Сложение

Рассмотрим примеры на сложение.

При сложении столбиком двух цифр справа налево в двоичной системе счисления, как в любой позиционной системе, в следующий разряд может переходить только единица. Результат сложения двух положительных чисел имеет либо столько же цифр, сколько у максимального из двух слагаемых, либо на одну цифру больше, но этой цифрой может быть только единица.

Вычитание

Рассмотрим примеры на вычитание.

При выполнении операции вычитания всегда из большего по абсолютной величине числа вычитается меньшее и у результата ставится соответствующий знак.

Умножение

Рассмотрим примеры на умножение.

Операция умножения выполняется с использованием таблицы умножения по обычной схеме (применяемой в десятичной системе счисления) с последовательным умножением множимого на очередную цифру множителя. При выполнении умножения в примере 2 складываются три единицы 1+1+1=11 в соответствующем разряде пишется 1, а другая единица переносится в старший разряд. В двоичной системе счисления операция умножения сводится к сдвигам множимого и сложению промежуточных результатов.

Деление

Операция деления выполняется по алгоритму, подобному алгоритму выполнения операции деления в десятичной системе счисления.

Вопросы для самопроверки

1. Что означает «кодирование информации»?

3. Какие способы кодирования чаще всего применяются?

2. Действия по восстановлению первоначальной формы представления информации принято называть...

4.Система счисления - это:

5.Что имеет большое значение при хранении информации?

Проверь свои знания

Перевод из одной системы счисления в другую

Посчитай

Закодируй изображение

Код Цезаря

Расшифруй послание

Кодирование текстовой информации

Кодирование информации

More creations to inspire you

THE GREAT WALL OF CHINA

MARS

GRAND CANYON

ALZOLA BASQUE WATER

THE PARTHENON

VISIT CAPE COD: 5 FUN FACTS YOU DIDN'T KNOW

ARE MOUNTAIN TRAILS CONDUITS FOR PLANT INVASIONS?

Transcript