Импорт CSV в UTF-8 с кириллицей: пошаговая инструкция

Импорт CSV в UTF-8 с кириллицей: пошаговая инструкция Google Таблицы
Как правильно импортировать CSV-файлы с русскими буквами в Excel и Google Таблицы без кракозябр. Пошаговое руководство по UTF-8.

Импорт данных из CSV-файлов — стандартная задача для аналитиков и маркетологов. Однако при работе с кириллицей пользователи часто сталкиваются с проблемой «кракозябр» (нечитаемых символов) вместо русских букв. Это происходит из-за несовпадения кодировок. В этой инструкции мы разберем, как правильно настроить импорт CSV в кодировке UTF-8, чтобы все русские буквы отображались корректно.

Способ 1. Правильный импорт CSV в Microsoft Excel

Шаг 1. Использование встроенного импорта данных

Не открывайте CSV двойным кликом. Вместо этого запустите Excel, создайте пустую книгу с помощью горячих клавиш Ctrl + N и перейдите на вкладку Данные -> Получить данные -> Из файла -> Из текстового/CSV-файла.

Шаг 2. Настройка кодировки UTF-8

В открывшемся окне импорта найдите выпадающий список Источник файла и выберите кодировку 65001: Unicode (UTF-8). В поле Разделитель укажите символ, который используется в вашем файле (обычно это запятая или точка с запятой). Нажмите кнопку Загрузить.

Способ 2. Импорт в Google Таблицы

Шаг 1. Загрузка файла

В Google Таблицах откройте меню Файл -> Импортировать. Перейдите во вкладку Загрузка и выберите ваш CSV-файл на компьютере.

Шаг 2. Параметры импорта

Google Таблицы отлично распознают UTF-8 автоматически. В окне настроек выберите тип импорта (например, ‘Заменить текущий лист’) и оставьте автоопределение разделителя. После успешного импорта структуры данных вам может пригодиться Автонумерация строк в Google Таблицах: 4 способа для быстрой разметки строк.

Важно: Если Excel упорно отказывается видеть UTF-8 даже при ручном выборе, возможно, файлу не хватает сигнатуры BOM (Byte Order Mark). Читайте ниже, как это исправить.

Дополнительно: Как принудительно сохранить CSV в UTF-8 с BOM через Блокнот или Python

Если сторонний софт выгружает некорректный CSV, откройте его через стандартный Блокнот в Windows, нажмите Ctrl + Shift + S (Сохранить как), в поле ‘Кодировка’ выберите UTF-8 с спецификацией (BOM) и сохраните файл.

Также вы можете быстро перекодировать файл с помощью простого скрипта на Python:

import pandas as pd
df = pd.read_csv('file.csv', encoding='utf-8')
df.to_csv('file_fixed.csv', encoding='utf-8-sig', index=False)

Частые ошибки / Устранение неполадок

  • Вместо русских букв отображаются знаки вопроса или иероглифы (РЎРўР РћРљРђ): Вы открыли файл напрямую через двойной клик, и Excel применил кодировку Windows-1251 (ANSI). Используйте импорт через вкладку «Данные» с выбором кодировки 65001.
  • Все данные слиплись в одну строку или колонку: Неверно указан разделитель. Если при импорте разделитель не определился, выделите колонку, перейдите в Данные -> Текст по столбцам и укажите правильный разделитель (запятую или точку с запятой).
  • Длинные числа (например, номера карт или ID) превратились в экспоненциальный вид (1E+14): При импорте через Power Query измените тип данных этого столбца на ‘Текстовый’ вместо ‘Числовой’.

Часто задаваемые вопросы

Почему Excel открывает CSV с кракозябрами по умолчанию?

Excel по умолчанию использует системную кодировку Windows (обычно Windows-1251 для РФ), в то время как большинство современных систем выгружают файлы в UTF-8.

Что делать, если разделитель в CSV — точка с запятой, а не запятая?

При импорте через вкладку ‘Данные’ в Excel или при импорте в Google Таблицы вручную укажите ‘Точка с запятой’ в поле ‘Разделитель’.

Оцените статью
TechWork
Добавить комментарий