UTF 8

Главные вкладки

Аватар пользователя safrash safrash 11 апреля 2010 в 3:29

Здравствуйте.
Как связаны быстродействие и кодировка сайта? После возникновения ошибки "Cannot modify header information - headers already sent by" искал причину. Поменял кодировку создаваемого модуля с UTF-8 на западноевропейскую. Так вот ошибка исправилась, да и сайт быстрее заработал, чем грозит написание модуля в такой кодировке (win)?

Комментарии

Аватар пользователя Shift-Web Shift-Web 11 апреля 2010 в 3:47

Скачайте нормальный редактор. Если надо вставить русские символы непосредственно в скрипты, то оптимальный вариант это:

а). слить нужный скрипт на хард
б). открыть блокнотом (обычным)
в). сохранить в utf-8
г). редактировать нормальным редактором

Не знаю на счёт западноевропейской, но вот утф-8 при отсутствующих комментариях в коде шустрее кубаторит в сравнении с ansi. *щас закидают говном*

Аватар пользователя Dan Dan 11 апреля 2010 в 10:54

"safrash" wrote:
Cannot modify header information - headers already sent by"

UTF8 и изменение заголовков обычно не связаны. Могу предположить, что файл сохранялся с BOM, которого быть не должно.

"Shift-Web" wrote:
Не знаю на счёт западноевропейской, но вот утф-8 при отсутствующих комментариях в коде шустрее кубаторит в сравнении с ansi. *щас закидают говном*

Файл в UTF8, который содержит только латиницу ничем не отличается от ANSI. В этом собственно и фишка UTF8.

Аватар пользователя Cynicus Cynicus 11 апреля 2010 в 11:59

Не UTF8, а UTF8 without BOM, либо ANSI.
Хорошо, что ошибка выходит. Из-за этой метки в начале файла в Друпал можно и белый экран заполучить.

"Dan" wrote:
Файл в UTF8, который содержит только латиницу ничем не отличается от ANSI. В этом собственно и фишка UTF8.

В том то и дело, что иногда отличается
Quote:
Many Windows programs (including Windows Notepad) add the bytes 0xEF,0xBB,0xBF at the start of any document saved as UTF-8. This is the UTF-8 encoding of the Unicode byte-order mark (BOM), and is commonly referred to as a UTF-8 BOM even though it is not relevant to byte order. The BOM can also appear if another encoding with a BOM is translated to UTF-8 without stripping it.

Аватар пользователя Dan Dan 11 апреля 2010 в 12:17

"Cynicus" wrote:
Не UTF8, а UTF8 without BOM, либо ANSI.

Т.к. BOM опционален правильней говорить UTF8 и UTF-8 with Signature

"Cynicus" wrote:
В том то и дело, что иногда отличается

Разговор шёл про друпал, а не UTF8 вообще. В друпале UTF8 без BOM, поэтому не отличается.

Аватар пользователя Cynicus Cynicus 11 апреля 2010 в 12:31

"Dan" wrote:
Разговор шёл про друпал, а не UTF8 вообще.

Вы можете вести разговор исключительно про друпал, но по моему опыту эту ошибку вызывает наличие BOM в UTF.

Аватар пользователя Dan Dan 11 апреля 2010 в 18:01

"Cynicus" wrote:
Вы можете вести разговор исключительно про друпал, но по моему опыту эту ошибку вызывает наличие BOM в UTF.

Перечитайте мои посты. Про "одинаковость" я писал для Shift-Web, который говорил, что у него разная скорость работы системы, а топикстартеру -- про связь ошибки и BOM.

Аватар пользователя Shift-Web Shift-Web 11 апреля 2010 в 18:50

«Перечитайте мои посты. Про "одинаковость" я писал для Shift-Web, который говорил, что у него разная скорость работы системы, а топикстартеру -- про связь ошибки и BOM.»

На самом деле я не уверен, что разница есть и она обусловлена именно этим. Так как ковыряюсь обычно масштабно. Ну и хостер что-то подкручивает регулярно - это чувствуется на ходовых характеристиках.

Поэтому может и не так ...