Основные тезисы

1. Компьютеры хранят символы в виде чисел. Существует несколько возможных способов кодирования символов, но лишь некоторые из них получили всемирную популярность и широко используются в IT: это ASCII (используется в основном для кодирования латинского алфавита и некоторых его производных). и UNICODE (способный кодировать практически все алфавиты, используемые людьми).

2. Число, соответствующее определенному символу, называется кодовой позицией.

3. UNICODE использует разные способы кодирования, когда дело доходит до хранения символов с использованием файлов или памяти компьютера: два из них - UCS-4 и UTF-8 (последний является наиболее распространенным, поскольку он тратит меньше места в памяти).

Упражнение 1

Что такое BOM?

Упражнение 2

Python 3 интернационализирован?

Основные тезисы

Code