Кодировкой веб-страницы называется способ кодирования текстовой информации для передачи в сети Интернет. Определяющим параметром при кодировании данных считается количество битов, с помощью которых передается один символ (значение). Например, одним битом можно закодировать два значения, двумя битами – четыре значения, а три бита кодируют восемь значений. Добавление одного бита удваивает количество значений, которое можно закодировать. Поэтому при 8 битах кодировке поддаются 256 последовательностей двоичных значений, причем каждая из этих последовательностей сама способна передать один символ текстовой информации. Кроме 8-битовой кодировки, существуют также 16 и 32-битовые кодировки, обрабатывающие 65536 и 4294967296 символов текста. Это небольшое введение в основы программирования в дальнейшем поможет понять, на основе каких параметров выбирается кодировка веб-страницы.
Если вы откроете веб-браузер Internet Explorer, входящий в комплект поставки операционной системы Windows, и выберите пункт меню Вид – Кодировка, то увидите довольно внушительный список кодировок, с которыми работает данный веб-браузер. Существует шесть основных кодировок, поддерживающих русский язык (кириллицу): Windows-1251 (получила наибольшее распространение), KOI-8R, KOI-8U, ISO-8859-5, UTF-8 и русскоязычная Mac-кодировка.
Для корректного отображения информации на веб-странице сервер и веб-браузер должны обмениваться служебной информацией, содержащей сведения о методе кодирования текста. С помощью протокола HTTP веб-браузер отправляет на сервер сообщение с данными кодировки. Затем сервер находит страницу и перекодирует ее в нужный формат. Если по какой-то причине документ (веб-страница) на сервере не обнаружен, придется вручную выбирать подходящую кодировку.
Чтобы добиться правильного воспроизведения информации на сайте, еще на стадии разработки необходимо указывать кодовый набор символов на той или иной странице. В противном случае велика вероятность того, что пользователь, загрузив страницу вашего ресурса, вместо текста увидит там непонятную «абракадабру». Вряд ли посетители сайта захотят тратить время на выяснение кодировки страницы. Они просто уйдут к вашим конкурентам. Понятно, что сайт с такими недоработками дизайна не сможет претендовать на высокие позиции в рейтинге поисковых систем.
Во избежание подобных ошибок проверьте, содержит ли html-код страниц следующую строку: . Вместо windows-1251 введите свой формат кодирования. Обратите внимание на способ записи кода, для атрибутов content и charset используется всего одна пара кавычек, а разделены они точкой с запятой. Если вы используете текстовый html-редактор, код придется добавлять вручную. Визуальные редакторы сделают это за вас, стоит только в меню «Page properties» выбрать кодировку (title/encoding)