Импорт данных из CSV-файлов — стандартная задача для аналитиков и маркетологов. Однако при работе с кириллицей пользователи часто сталкиваются с проблемой «кракозябр» (нечитаемых символов) вместо русских букв. Это происходит из-за несовпадения кодировок. В этой инструкции мы разберем, как правильно настроить импорт CSV в кодировке UTF-8, чтобы все русские буквы отображались корректно.
Способ 1. Правильный импорт CSV в Microsoft Excel
Шаг 1. Использование встроенного импорта данных
Не открывайте CSV двойным кликом. Вместо этого запустите Excel, создайте пустую книгу с помощью горячих клавиш Ctrl + N и перейдите на вкладку Данные -> Получить данные -> Из файла -> Из текстового/CSV-файла.
Шаг 2. Настройка кодировки UTF-8
В открывшемся окне импорта найдите выпадающий список Источник файла и выберите кодировку 65001: Unicode (UTF-8). В поле Разделитель укажите символ, который используется в вашем файле (обычно это запятая или точка с запятой). Нажмите кнопку Загрузить.
Способ 2. Импорт в Google Таблицы
Шаг 1. Загрузка файла
В Google Таблицах откройте меню Файл -> Импортировать. Перейдите во вкладку Загрузка и выберите ваш CSV-файл на компьютере.
Шаг 2. Параметры импорта
Google Таблицы отлично распознают UTF-8 автоматически. В окне настроек выберите тип импорта (например, ‘Заменить текущий лист’) и оставьте автоопределение разделителя. После успешного импорта структуры данных вам может пригодиться Автонумерация строк в Google Таблицах: 4 способа для быстрой разметки строк.
Важно: Если Excel упорно отказывается видеть UTF-8 даже при ручном выборе, возможно, файлу не хватает сигнатуры BOM (Byte Order Mark). Читайте ниже, как это исправить.
Дополнительно: Как принудительно сохранить CSV в UTF-8 с BOM через Блокнот или Python
Если сторонний софт выгружает некорректный CSV, откройте его через стандартный Блокнот в Windows, нажмите Ctrl + Shift + S (Сохранить как), в поле ‘Кодировка’ выберите UTF-8 с спецификацией (BOM) и сохраните файл.
Также вы можете быстро перекодировать файл с помощью простого скрипта на Python:
import pandas as pd
df = pd.read_csv('file.csv', encoding='utf-8')
df.to_csv('file_fixed.csv', encoding='utf-8-sig', index=False) Частые ошибки / Устранение неполадок
- Вместо русских букв отображаются знаки вопроса или иероглифы (РЎРўР РћРљРђ): Вы открыли файл напрямую через двойной клик, и Excel применил кодировку Windows-1251 (ANSI). Используйте импорт через вкладку «Данные» с выбором кодировки 65001.
- Все данные слиплись в одну строку или колонку: Неверно указан разделитель. Если при импорте разделитель не определился, выделите колонку, перейдите в Данные -> Текст по столбцам и укажите правильный разделитель (запятую или точку с запятой).
- Длинные числа (например, номера карт или ID) превратились в экспоненциальный вид (1E+14): При импорте через Power Query измените тип данных этого столбца на ‘Текстовый’ вместо ‘Числовой’.
Часто задаваемые вопросы
Почему Excel открывает CSV с кракозябрами по умолчанию?
Excel по умолчанию использует системную кодировку Windows (обычно Windows-1251 для РФ), в то время как большинство современных систем выгружают файлы в UTF-8.
Что делать, если разделитель в CSV — точка с запятой, а не запятая?
При импорте через вкладку ‘Данные’ в Excel или при импорте в Google Таблицы вручную укажите ‘Точка с запятой’ в поле ‘Разделитель’.








