返回文章列表

CSV 编码修复:Excel 打开乱码、分隔符错列怎么处理

围绕 Excel CSV 乱码、GBK/GB18030 转 UTF-8、分号或 Tab 分隔符错列,说明本地修复、预览和导出方法。

这个页面解决什么问题

CSV 乱码通常不是数据坏了,而是 Excel 或系统用错编码打开。这个页面会尝试识别 UTF-8、GB18030、Big5、Shift_JIS 等编码,并检测逗号、分号、Tab、竖线分隔符,适合运营表、订单表和跨系统导出数据清洗。

推荐使用步骤

  1. 先上传原始 CSV,不要在乱码状态下另存覆盖,否则可能造成不可逆损坏。
  2. 编码选自动识别;如果预览仍错,可以手动切换 GB18030、Big5 或 Shift_JIS。
  3. 检查分隔符识别结果,发现整行挤在一列时切换分号、Tab 或竖线。
  4. 查看前 10 行预览和字段数量异常行,确认表头和数据列对齐。
  5. 导出给 Excel 用 UTF-8 with BOM;导出给脚本或数据库可使用 UTF-8 no BOM 或 JSON。

输入输出示例

输入

输入:name;phone\n张三;13812345678\n李四;15900001234,原文件可能来自中文 Windows 后台或 Excel 另存。

输出

输出:name,phone\n张三,13812345678\n李四,15900001234,同时显示识别编码、分隔符、行列数和异常行提示,并可下载 JSON。

关键检查点

编码识别

中文 Windows 导出的 CSV 多数可用 GB18030 覆盖 GBK 场景;日文表格可尝试 Shift_JIS。

分隔符

欧洲系统和部分后台会用分号,数据仓库导出常见 Tab 或竖线,自动识别后会统一导出逗号 CSV。

异常行

预览会提示列数异常行,常见原因是字段里有未闭合引号或换行。

Excel 兼容

给 Excel 打开建议选择 UTF-8 with BOM;给程序读取可选 no BOM。

和普通同类工具的区别

这个页面不是简单“重新保存 CSV”,而是把编码识别、分隔符判断、空白行清理、异常行提示、CSV/JSON 导出放在一起,适合真实数据清洗。

FAQ

支持 GBK 吗?

支持常见 GBK 场景。浏览器用 GB18030 解码,通常能覆盖中文 Windows CSV。

为什么 Excel 还是乱码?

请优先导出 UTF-8 with BOM;旧版 Excel 对无 BOM 的 UTF-8 识别不稳定。

字段错列怎么办?

先检查分隔符是否正确,再看异常行提示;含英文逗号、换行或引号的字段需要标准 CSV 转义。

文件会上传吗?

不会。读取、识别、预览和导出都在本地浏览器完成。

相关工具链