БлогNot. Ударения в UTF-8

Ударения в UTF-8

Увы, на вебе по-прежнему проще всего подчеркнуть нужную букву - индексации поисковиком, обычно исключающей теги, это не помешает, ты не лепишь в слово символы чужого языка (если вставлять "расширенные" символы из таблиц Юникода) или некрасивую большУю.

Что со стандартным символом ударения? А ничего, его по-прежнему и Блокнот, и Notepad++ отображают криво:

ударение всё ещё отображается после символа а не над ним
ударение всё ещё отображается после символа а не над ним

Точней, ударение отображается криво, как минимум, в моноширинных шрифтах, таких как Courier New, а именно они всегда установлены по умолчанию в редакторах кода или неформатированного текста.

При этом ввод ударений с клавиатуры ни в Блокноте, ни в Notepad++ нормально всё равно не работает. Word введёт и изобразит ударение правильно, но проверка орфографии будет на такие слова ругаться, проверил на лицензионной версии 2016.

Как в Word ввести символ ударения с клавиатуры?

Клавиша NumLock включена, курсор стоит после нужной буквы, нажимаем клавишу Alt и не отпуская её, набираем нужные цифры на цифровой клавиатуре справа. Ударение появится, когда Вы отпýстите клавишу Alt, главное ударение набирается комбинацией Alt и цифр 769, побочное - Alt и 768

Тем не менее, в текстовое поле ввода браузера буквы с ударениями вставятся и из Word, и из Блокнота, и из Notepad++ (при условии, что страница браузера сохранена в кодировке Юникода UTF-8 - это видно, например, из исходного кода страницы по тегу <meta charset="UTF-8"/> в верхней части документа, и редакторы текста также настроены на эту кодировку).

Вид символа, конечно, будет зависеть от шрифта, скажем, в моём шрифте Verdana ударения над русскими буквами, особенно больши́ми, смотрятся не очень: А́а́, Е́е́, И́и́, О́о́, У́у́, Ы́ы́, Э́э́, Ю́ю́, Я́я́.

Как увидеть исходный код страницы в браузере?

Нажмите правой кнопкой мыши на свободном месте страницы, когда на ней ничего не выделено, выберите пункт меню "Исходный код страницы" или "Просмотр HTML-кода" и т.п., название пункта меню зависит от браузера, код документа откроется в новой вкладке.

Наконец, поисковые боты, индексирующие ваши страницы, едва ли будут воспринимать слова с ударениями адекватно, просто по причине дополнительных "букв" в коде страницы. Например, русская "а" с ударением всё равно будет включать после своих 2 байт дополнительный 2-байтовый код, как видно на скрине, представляющем собой 16-ричный вид файла в UTF-8, содержащего только русскую букву "a" (код D0 B0) с ударением и следом букву "а" без него.

русская "а" с ударением и без него в дампе файла UTF-8
русская "а" с ударением и без него в дампе файла UTF-8

 Старые способы ввода ударений, но проблема за столько лет так и не решена...

 Почему "ё" - моё, а ударения важны?

18.10.2020, 15:47 [513 просмотров]


теги: textprocessing язык поиск ошибка форматы word