От куда берется информация о кодировки файла?

Есть текстовый файл в кодировки UTF-8, который содержит как латинский набор символов, так и кириллический. При попытке открыть такой файл программой Notepad++ кириллические символы отображаются кракозябрами.

Вопрос: почему так происходит?

Ответ: в начале файла отсутствует байтовая последовательность EF BB BF, по которой определяется кодировка UTF-8. Соответственно, не найдя этой последовательность, Notepad++ открывает такой файл в кодировки по умолчанию, которой является ANSI.

Вот как должно быть правильно:

urf-8_byte_charset