Символы
Для записи одиночных символов используются следующие формы.
- Печатные символы можно записать в апострофах: ' а ', ' N ', ' ? '.
-
Управляющие символы записываются
в апострофах с обратной наклонной чертой:
- ' \n ' — символ перевода строки newline с кодом ASCII 10;
- ' \r ' — символ возврата каретки CR с кодом 13;
- ' \f ' — символ перевода страницы FF с кодом 12;
- ' \b ' — символ возврата на шаг BS с кодом 8;
- ' \t ' — символ горизонтальной табуляции НТ с кодом 9;
- ' \\ ' — обратная наклонная черта;
- ' \" ' — кавычка;
- ' \' ' — апостроф.
- Код любого символа с десятичной кодировкой от 0 до 255 можно задать, записав его не более чем тремя цифрами в восьмеричной системе счисления в апострофах после обратной наклонной черты: ' \123 ' — буква S , ' \346 ' — буква Ж в кодировке СР1251. Не рекомендуется использовать эту форму записи для печатных и управляющих символов, перечисленных в предыдущем пункте, поскольку компилятор сразу же переведет восьмеричную запись в указанную выше форму. Наибольший код ' \377 ' — десятичное число 255.
- Код любого символа в кодировке Unicode набирается в апострофах после обратной наклонной черты и латинской буквы ц ровно четырьмя шестнад-цатеричными цифрами: ' \u0053 ' — буква S , ' \u0416 ' — буква Ж .
Символы хранятся в формате типа char (см. ниже).
Примечание
Прописные русские буквы в кодировке Unicode занимают диапазон от ' \u0410 ' — заглавная буква А , до ' \u042F ' — заглавная Я , строчные буквы от ' \u0430 ' — а , до ' \044F ' — я .
В какой бы форме ни записывались символы, компилятор переводит их в Unicode, включая и исходный текст программы.
Замечание
Компилятор и исполняющая система Java работают только с кодировкой Unicode.
Назад | Начало | Вперед |