Сколько символов можно закодировать, используя UNICODE?

Стандарт Unicode предоставляет возможность кодирования огромного количества символов. На последнем известном мне момент времени (сентябрь 2021 года), Unicode версии 14.0 содержал более 143 000 назначенных символов.

Однако Unicode предназначен для поддержки всех известных письменных систем, а также символов и символьных наборов, используемых в различных языках и культурах. Он включает в себя символы из алфавитов, иероглифов, пунктуации, математических символов, символов для эмодзи, специальных символов и многого другого.

Благодаря использованию кодировки UTF-8, которая используется наиболее широко, Unicode может представлять более чем 1,1 миллиона символов. Это включает базовую многобайтную плоскость (BMP), а также дополнительные плоскости, такие как дополнительные многобайтные плоскости (SMP), дополнительные идеографические плоскости (SIP), плоскость абстрактных идеографов (AIP) и другие.

Количество символов, которые могут быть закодированы в Unicode, будет продолжать расти по мере добавления новых символов и плоскостей в будущих версиях стандарта Unicode.