Домен
Найди свой домен
Послепродажный рынок
Управляйте своим портфелем
Рынок
Аукционы
Unicode - это универсальный стандарт кодирования символов, который используется для поддержки символов в скриптах, не относящихся к ASCII. Интернет изначально был построен наASCIIоснован на английском алфавите и состоит только из 128 символов.
Unicode позволяет поддерживать все языки мира и их уникальные наборы символов. Unicode может поддерживать более 1 миллиона символов! Принцип работы Unicode заключается в возможности использования дополнительных битов, сокращение отбдвоичный поискэто, которые являются единицами информации на машине. Для представления символов ASCII требуется всего около 7 бит, в то время как Unicode использует 16 бит. Это необходимо, так как для обработки языков, таких как китайский, арабский и русский, требуется больше бит.
Есть несколько типов Юникода, самые распространенные — UTF-8 и UTF-16. UTF-8 стал обычным стандартом в Интернете благодаря тому, что он позволяет регулировать количество бит в зависимости от символа. То есть символы ASCII в кодировке UTF-8 занимают только необходимое для них количество бит.