Потужність алфавіту: що це і як вона визначається

Розвиток високих технологій призвело до появи великої кількості термінів і понять, з якими стикаються всі користувачі в процесі роботи з комп’ютерами. Просунуті користувачі мають уявлення про більшість з них, однак, для новачків розібратися з усіма термінами дуже складно. Одним з таких термінів, про які мають уявлення не всі навіть досвідчені користувачі, є потужність алфавіту. Що мається на увазі під цим поняттям і як вона розраховується?

Методи вимірювання інформації в електронному вигляді

Потужність алфавіту може стати в нагоді дуже багатьом користувачам в процесі роботи. Однак перед тим як дати визначення цьому терміну і розібратися в методах його розрахунку необхідно трохи поговорити про те, як вимірюється електронна інформація, оскільки це є матеріальною базою, на підставі якої базується подальша теорія.

Кожна людина знає про те, що будь-яка величина має свою систему вимірювань. Наприклад, температура вимірюється в градусах, відстань виражається в метрах, тимчасові інтервали будуються з секунд і так далі. Однак далеко не всі користувачі знають про те, в яких величинах вимірюється текстова інформація в електронному вигляді. Для цих цілей в інформатиці та було створено визначення потужність алфавіту.

визначення терміна

Виходячи з того, що значення абсолютно будь-якої величини, відомої в наші дні людству, є певним параметром, що складається з набору вимірювальних одиниць, то визначення поняттю потужності алфавіту найпростіше зробити наступним чином: потужність алфавіту – це кількість символів, яке входить до складу будь-якої мови .
Однак це всього-лише загальне визначення, яке відображає тільки поверхневе значення потужності алфавіту, оскільки саме визначення носить більш глибокий характер. Щоб зрозуміти всю його суть необхідно розібратися з тим, що представляють собою символи, з точки зору високих технологій. Всі символи, що використовуються в комп’ютері, включають в себе букви, цифри, розділові знаки і набір спеціальних символів. Однак це ще не все, оскільки для визначення потужності алфавіту необхідно ще враховувати і пробіл, який призначений для поділу слів між собою.

Давайте як приклад розглянемо російську розкладку клавіатури, яка використовується для друку російськомовного тексту і складається з 34 букв, 10 цифр і 11 додаткових символів, сумарна кількість яких становить 54, що, в свою чергу, класифікується як потужність алфавіту російської розкладки клавіатури ..

Інформаційний вага символів

Давайте поступово просуватися далі. Потужність алфавіту не укладається в одному лише числі букв і цифр, які використовуються в надрукованому тексті. Для визначення цього параметра необхідний більш глибокий підхід.
Давайте на секунду задумаємося про те, який мінімальний обсяг символів входить до складу однієї літери, цифри або спеціального знака? Правильна відповідь – два. Кожен символ в комп’ютері має свій інформаційним вагою, завдяки якому машина здатна розпізнавати яку інформацію ввів користувач. Вся справа в тому, що машина не здатна розпізнавати інформацію в тому вигляді, в якому її представляють люди. Замість цього, він використовує спеціальний машинний мову, що складається з нулів і одиниць, за допомогою яких відбувається перетворення текстової інформації в двійковий код, зрозумілий комп’ютерній системі.
Що стосується інформаційного ваги, то він виражається в бітах і є стандартною одиницею для вимірювання інформації в електронному вигляді.

Трохи про двійковому коді

Тепер ми маємо більш-менш доступним для розуміння визначенням потужності алфавіту. Однак для розуміння всієї глибини теорії подання електронної інформації машинами необхідно мати уявлення про двійковому коді. Давайте розглянемо це питання на прикладі потужності алфавіту, що складається з чотирьох будь-яких символів, кожен з яких має вагу два біта.

Слідуючи з усього вищесказаного, чотири символи матимуть весь чотири біта, вісім – три і так далі. На підставі цього принципу і відбувається розрахунок ваги текстової інформації, вираженої в електронному вигляді, комп’ютерними системами.

Обчислення потужності алфавіту і її практичне використання

З термінологією і основними теоретичними термінами ми розібралися, тому тепер давайте розглянемо яка існує взаємозв’язок між потужністю алфавіту і його вагою. Щоб більш наочно провести взаємозв’язок між ними давайте розглянемо одну формулу: N = 2b, в якій перша змінна відповідає кількості символів, а друга – кількості знаків, використовуваних комп’ютерами в машинній мові.
З цього математичного виразу випливає, що 21 = 2, 22 = 4, 23 = 8, 24 = 16 і так далі. На підставі цього можна зробити досить розумний і обгрунтований висновок: число символів, які використовуються в машинній мові, являє собою вагу символу.

Як вимірюється обсяг інформації?

Розглянуті вище приклади є дуже простими, на прикладі яких можна дати загальне уявлення потужності алфавіту. Однак на ділі все виглядає набагато складніше, оскільки кожен користувач в процесі набору тексту використовує не тільки малі, а й великі літери, а також різні шрифти, мовну розкладку, розділові знаки, спеціальні символи, кольори і багато іншого. Виходячи з цього можна припустити, що загальне число всіх сумарних символів дорівнює 256. Оскільки 256 дорівнює 28 в двійковому коді, то в цьому випадку вага кожного символу становить 8 бітам або одному байту.

Таким чином, володіючи всіма необхідними параметрами, ми можемо розрахувати обсяг електронної інформації. Наприклад, ми надрукували 30 сторінок друкованої інформації, на кожній з яких міститься 50 рядків по 60 різних символів. Використовуючи відому нам формулу, виробляємо необхідні обчислення:

– інформаційний вага одного рядка дорівнюватиме: 50 х 60 = 3000 байт;
– а весь текст буде важити: 3000 х 50 = 150 000 байт.

Варто зазначити, що кінцевий результат можна висловлювати не тільки в байтах, а переводити стандартну одиницю вимірювання в кілобайти, мегабайти та інші. Для цього необхідно величину більш молодшого порядку розділити на 1024, оскільки саме стільки одиниць молодшої величини утворюють старшу одиницю виміру.

висновок

Прочитавши цю статтю, ви отримали загальне уявлення про те, що являє собою потужність алфавіту, а також про методи її розрахунку. Однак було розглянуто виключно математичний підхід, в якому не враховуються деякі інші параметри, основним з яких є смислове навантаження. Цей аспект є одним з найбільш важливих для розуміння, оскільки незалежно від обсягу символів, якщо вони не несуть ніякої інформаційної цінності, то його цінність дорівнює нулю. Однак розрахувати вагу безглуздого набору символів все одно можна.

Якщо говорити в загальному, то потужність алфавіту, як один з термінів інформатики, не являє собою нічого складного для розуміння. Але багато користувачів нехтують цим термінів, оскільки вважають його непотрібним, проте, на практиці все виглядає зовсім інакше. В наші дні користувачі працюють переважно з електронною інформацією, яка з часом може повністю витіснити друковану, тому необхідно мати уявлення про те, як ця інформація виражається в машинному вигляді і яким чином вона розраховується.

Ссылка на основную публикацию