Основные тезисы
1. Компьютеры хранят символы в виде чисел. Существует несколько возможных способов кодирования символов, но лишь некоторые из них получили всемирную популярность и широко используются в IT: это ASCII (используется в основном для кодирования латинского алфавита и некоторых его производных). и UNICODE (способный кодировать практически все алфавиты, используемые людьми).
2. Число, соответствующее определенному символу, называется кодовой позицией.
3. UNICODE использует разные способы кодирования, когда дело доходит до хранения символов с использованием файлов или памяти компьютера: два из них - UCS-4 и UTF-8 (последний является наиболее распространенным, поскольку он тратит меньше места в памяти).
Упражнение 1
Что такое BOM?
Упражнение 2
Python 3 интернационализирован?