• Автор:

    Flesha
  • Добавлено:

    мар 23, 2014
  • Комментариев:

    0
  • Просмотров:

    2299

Про кодировку UTF-8 в DataLife Engine

Про кодировку UTF-8 в DataLife Engine

Спешим ознакомить вас с новой линейкой DataLife Engine UTF Edition, которая во многом идентична обычной версии за исключение одной важной особенности – поддержке кодировки под названием UTF-8, поскольку была разработана специально для этих целей. Скачать новую версию можно начиная с версий 8.5 по 10.х версию.

Что же представляет собой эта кодировка и кому следует воспользоваться ею? Как поступить владельцам тех сайтов, которые работают, используя windows-1251?

В первую очередь, следует отметить, что кодировка под названием UTF-8 – это вовсе не модное изобретение, которое необходимо срочно применять в каждом случае. Она нужна сугубо для обеспечения возможности использовать несколько языков одновременно на одной странице ресурса. С ее помощью также облегчается процесс создания не русскоязычных интернет-продуктов. Если же разрабатываемый ресурс не предполагает таких условий, тогда смысла переходить на UTF-8 нет. Кроме того, владельцам русскоязычных ресурсов следует знать о проблемах, которые для них скрыты в новой кодировке:
1. Объем базы данных увеличится более чем на половину в сравнении с тем, который обеспечивает привычная windows-1251. От этого снизится производительность интернет-сайта.
2. Пострадает читаемость ресурса, поскольку большинству шаблонов потребуются специальные редакторы. Это связано со спецификой формата UTF-8, который не предусматривает наличия ВОМ-байтов.
По этим причинам применение кодировочной системы UTF-8 нецелесообразно на полностью русскоязычных интернет-продуктах, если в них не планируется использовать иные языки.

Как обновить сайт, созданный посредством DataLife Engine, отказавшись от windows-1251 в пользу UTF-8?

Решившись перейти с одной кодировки на другую, необходимо учитывать различие форматов, которое влечет за собой даже не обновление скрипта, а полностью новую его установку. Поэтому правильный алгоритм перехода выглядит следующим образом.

1. Создание бекапа для базы данных обновляемого ресурса в прежнем код-формате – windows-1251.
2. Осуществление переустановки скрипта посредством дистрибутива для кодировочной системы UTF-8.
3. Выполнение повторных и дополнительных настроек скрипта.
4. Конвертация файлов имеющегося образца в новый формат (при пакетном конвертировании эффективнее всего утилита Sisulizer's Kaboom). При этом отметка рядом с «Записывать ВОМ-байты» не ставится.
5. Копирование файла, содержащего бекап базы данных, в созданную по условиям первого пункта папку «backup».
6. Восстановление скрипта через админпанель. В результате осуществления этого действия скриптом будет автоматически распознана разница в системах кодирования и в процессе восстановления он сконвертируется в UTF-формат.

Памятка: Действия, связанные с переходом от windows-1251 на новые коды UTF-8, имеют необратимые последствия, поэтому каждая неточность грозит утратой данных. Чтобы избежать таких неприятностей, обновления следует осуществлять посредством локального компьютера и только потом переносить их на сам сайт.
Вернуться
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.