ФАС. Кодировки. Заговор?!

Вернуться ко всем новостям

Пояснение ситуации.


27.08.2011


Совсем недавно в СМИ активно муссировалось заявление Федеральной антимонопольной службы (ФАС) РФ о том, что права русскоговорящего населения ущемлены.

Ситуация такова: ФАС узрела заговор монополистов в том, что в смс-сообщение умещается всего 70 символов кириллицей. В то время как латинских символов в сообщении может быть до 160.
ФАС пообещала разобраться и принять меры. А разобраться необходимо было бы, для начала, с механизмом работы сервиса коротких сообщений (смс).

Под текст из общего размера смс сообщения выделяется 140 байт (140*8 = 1120 бит).
Для кодирования латинских символов используется 7-битная кодировка, т.е. для кодирования одного символа необходимо 7 бит памяти.

Получаем: 1120/7 = 160 символов латиницей. Именно столько и помещается в одно сообщение.

Когда дело доходит до кодирования кириллических символов 7 бит на символ становится недостаточно. Используется кодировка UTF-16. Таким образом, для кодирования одного символа требуется 16 бит.

Получаем: 1120/16 = 70 символов кириллицей. Вот и всё.

Стоит отметить, что это касается не только кириллических символов, но и, например, китайских и арабских. А для кодирования немецких и французских символов используется 8-битная кодировка.

Все это зависит от особенностей кодирования символов. Никакого заговора монополистов тут и быть не может.

Чем закончится история с ФАС и ее заблуждениями на счет процесса отправки смс – неизвестно. Размер сообщения в байтах (140) сложился исторически, и изменять его никто не собирается. Внедрение специальной для России кодировки, позволяющей умещать большее количество символов в одном сообщении, также выглядит глупым. В таком случае телефоны иностранного производства не смогут отобразить кириллический текст.

Мы будем следить за новостями, и держать вас в курсе событий.

Коллектив SMM-project.

Заявление на сайте ФАС


Copyright SMM-project.ru Design by Mikhail Anikin