Що таке WWW?
2) Pick App... - вибрати програму-помічника, вже встановлену на вашому комп'ютері, для обробки даного файла,
3) Save File... - зберегти файл на локальному диску,
4) Cancel - відмінити завантаження даного файла. Часто команду Save File... використовують для того, щоб отримати програмне забезпечення і документацію з колекцій («архівів»).
Проблема русифікації
Творці програмного забезпечення для роботи в WWW спочатку не були дуже стурбовані потребами людей, бажаючих публікувати і читати інформацію на своїх рідних мовах, що не використовують латинський алфавіт, в тому числі і на російській мові. Останнім часом ситуація починає помітно змінюватися до кращого, але все ж перегляд і публікація документів на російській мові зв'язана з деякими труднощами.
1.6. Коди і символи
Файл, що містить гіпертекстовий WWW-документ, являє собою текстовий файл. «Всередині» комп'ютера сучасної архітектури і при передачі по мережах кожний символ тексту представляється у вигляді цілого числа, яке, в свою чергу, кодується комбінацією з восьми двійкових розрядів, званих бітами. Така комбінація з восьми біт, що обробляються ЕОМ як одне ціле, отримала назву байт. Кожний біт в байті може мати рівно два стани: «включений» і «вимкнений», або «1» і «0».Легко пересвідчитися, що існує рівно 256 комбінацій з восьми біт, кожний з яких може бути зайнятий або нулем, або одиницею. Таким чином виходить, що вісьма бітами (тобто, одним байтом) можуть бути представлені числа, або коди, від 0 до 255 (тобто, від 00000000 до 11111111 в двійковій системі числення). Кожному коду можна поставити у відповідність певний текстовий символ, наприклад, букву або цифру, або керуючий символ, такий як повернення каретки, перехід на новий рядок і т. п. Щоб текст виглядав однаково на моніторах різних комп'ютерів, необхідний певний стандарт на відповідність кодів і символів, що представляються ними для текстової інформації. Такий стандарт, прийнятий в цей час на переважній більшості комп'ютерних систем, отримав назву American Standard Code for Information Interchange (ASCII, вимовляється як «аскі»). Цей стандарт охоплює лише коди від 0 до 127. У кодовій таблиці ASCII не знайшлося місця для багатьох спеціальних символів, що часто використовуються. Також, з буквених символів там присутні тільки символи англійського алфавіта. Щоб закодувати букви національних алфавітів, в тому числі російського, зберігши при цьому сумісність з таблицею ASCII, необхідно використати коди в діапазоні від 128 до 255. Ось тут-то і починаються складності.
Кодові таблиці для кодування букв російського алфавіта (кирилиця)
Існує досить багато різних кодових таблиць, співпадаючих в діапазоні кодів від 0 до 127 зі стандартом ASCII і використовуючих діапазон кодів від 128 до 255 для спеціальних символів і букв російського алфавіта. Серед них найбільш поширені наступні чотири:
1. Microsoft Windows Cyrillic code page 1251
Відома також як CP-1251 або Windows-1251. Найбільш широко застосовується в «русифікованих» системах Microsoft Windows 3.1, 95, 98 і NT.
2. KOI8-r
Базується на державному стандарті Коду Обміну Інформацією КОІ8 (ГОСТ 19768-74). Застосовується в основному на комп'ютерах з операційною системою UNIX. Прийнята за стандарт кодування російськомовних текстів при обміні по електронній пошті. Більшість WWW-серверів зберігають російськомовні документи в цьому кодуванні. У цей час є набори шрифтів для Microsoft Windows в кодуванні KOI8-r. Вони були розроблені спеціально для мережевих програм, працюючих під Windows.
3. CP-866 Microsoft/IBM code page 866
Відома також як «альтернативне кодування ГОСТа» (в деяких документах її означають Alt-GOST або alt). Застосовується в основному на персональних комп'ютерах IBM PC з операційною системою MS-DOS при роботі в текстовому режимі. Програми перегляду під DOS практично не використовуються (звичайно на IBM-сумісних машинах вони працюють під Microsoft Windows). Однак, ми згадуємо це кодування, оскільки текст WWW-документа можна створювати в текстовому редакторі, працюючому під DOS.