Единицы измерения информации

Материал из Old-Games.RU Wiki
Перейти к: навигация, поиск

Единицы измерения информации — единицы, с помощью которых определяют величину информации, преимущественно объёма компьютерных данных.

В цифровой технике базовой единицей измерения является бит, имеющая только два состояния: 1 («да») и 0 («нет»).

Байт

Байт — Минимально адресуемая единица информации. Например, нельзя изменить в числе, хранящимся в памяти, только один бит, необходимо полностью прочитать число, потом наложить на него необходимую маску, вычленив и изменив соответствующий бит, а затем записать число обратно. Типичный размер байта изменялся за историю существования ЭВМ, на текущий момент в подавляющем большинстве систем байт состоит из 8 битов. Чтобы отличить байт как минимально адресуемую единицу информации и байт просто как 8 бит, для группы из 8 бит применяют также иное название — октет.

Байт состоит из 8 бит, соответственно, один байт может принимать 256 разных значений.

В программировании на C описывается переменной типа char/unsigned char или, как теперь принято [1] - int8_t/uint8_t, и принимает значения от −27 (−128) до 27 -1 (127) (знаковый тип) или же от 0 до 28 -1 (255) (беззнаковый тип).

Word и Dword

Word — Это машинное слово. Каждый процессор имеет свою разрядность (этим долгое время кичились консоли), которая обозначает, какое количество бит составляет их машинное слово. В процессоре, в его арифметико - логическом устройстве все операции проводятся над машинными словами. В процессорах Intel 8086, 80186 и 80286 Размер машинного слова был равен 16 битам или двум байтам. В процессорах, начиная с Intel 80386 процессор стал 32 битным, однако в целях совместимости размер word был оставлен 16 битным. Dword — двойное слово. Впервые понятие появилось в ассемблере для процессоров Intel 8086 и обозначало 2 слова, идущие подряд в памяти ЭВМ. Этот тип был введён из-за того, что результатом многих операций процессора были 32 битные числа ,располагающиеся в паре регистров. Также полный адрес в Intel процессорах был 20 битным и не вмещался в одно слово, а с учётом разделения на сегмент+смещение, занимал ровно 32 бита. Позднее, начиная с процессора Intel 80386 стал вмещать его машинное слово.

Приставки

  • Килобайт

Килобайт согласно международной системе единиц СИ равен 1000 байтам[2], записывается как kB или кБ или кбайт.

  • Мегабайт

Мегабайт равен 1000 килобайтам, записывается как MB или МБ.

  • Гигабайт

Гигабайт равен 1000 мегабайтам, записывается как GB или ГБ.

  • Кибибайт

Чтобы стандартизировать приставки СИ и исключить путаницу, комитет СИ решил ввести двоичные приставки, основание которых равно двум, а степень кратна 10 (В обычных приставках основание равно 10, а степень кратна 3)[3]. В кибибайте 1024 байта и он обозначается kiB или КиБ.

  • Мебибайт

Мебибайт равен 1024 Кибибайтам, записывается как MiB или МиБ.

  • Гибибайт

Гибибайт равен 1024 Мебибайтам, записывается как GiB или ГиБ.

Изначально стандартные приставки СИ применялись в значении двоичных, однако не везде, не всегда и не всеми. В частности, размер жестких дисков измеряется с условием, что в килобайте 1000 байтов. Естественно, это создавало путаницу. Однако ввод новых приставок только усложнил дело. Многие считают двоичные приставки "Неблагозвучными". Однако в рамках научной и технической литературы необходимо соблюдать регламент, а значит, необходимо различать обычные приставки и двоичные.

  1. http://en.wikipedia.org/wiki/Stdint.h
  2. http://ru.wikipedia.org/wiki/Приставки_СИ
  3. http://ru.wikipedia.org/wiki/Двоичные_приставки