解决jsPDF导出中文乱码的完整方案-代码聚汇网

解决jsPDF导出中文乱码的完整方案

南瑾i

1. 问题背景与现象分析

最近在开发一个数据报表系统时，遇到了一个典型的前端导出问题：使用jsPDF库将表格数据导出为PDF时，中文字符全部显示为乱码。这个问题看似简单，实则涉及字符编码、字体嵌入、PDF生成原理等多个技术点。作为一名经历过多次类似坑的前端开发者，我想把完整的解决方案和经验总结分享给大家。

先描述下具体现象：当我们用jsPDF的autoTable插件生成包含中文的表格时，输出的PDF文件中所有中文都变成了"口口口"或者完全不可识别的乱码字符。这个问题在纯英文环境下不会出现，只有在包含中文、日文等非拉丁字符时才暴露出来。

2. 乱码问题的根本原因

2.1 jsPDF的默认字体限制

jsPDF默认使用的是标准PDF字体（Helvetica），这些字体只包含基本的拉丁字符集。当遇到中文字符时，由于字体中不存在对应的字形，PDF阅读器就会显示为乱码或方框。

重要提示：PDF文件本身并不存储字体文件，而是引用系统或嵌入的字体。如果引用的字体不包含对应字符，就会显示异常。

2.2 字体嵌入的必要性

要让PDF正确显示中文，必须满足两个条件：

使用包含中文字形的字体
将该字体嵌入到PDF文件中

3. 完整解决方案

3.1 准备中文字体文件

首先需要获取一个合法的中文字体文件（.ttf格式）。推荐使用以下免费字体：

思源黑体（Source Han Sans）
阿里巴巴普惠体
站酷酷圆体

将字体文件放入项目的/public/fonts目录下。

3.2 创建字体加载工具函数

javascript复制// utils/loadFont.js
export async function loadChineseFont() {
  const fontUrl = '/fonts/SourceHanSansCN-Regular.ttf';
  const fontName = 'SourceHanSansCN';
  
  const response = await fetch(fontUrl);
  const fontData = await response.arrayBuffer();
  
  return {
    fontName,
    fontData
  };
}

3.3 初始化jsPDF并添加字体

javascript复制import { jsPDF } from 'jspdf';
import 'jspdf-autotable';
import { loadChineseFont } from './utils/loadFont';

async function exportToPDF(tableData) {
  // 1. 加载字体
  const { fontName, fontData } = await loadChineseFont();
  
  // 2. 初始化PDF
  const doc = new jsPDF({
    orientation: 'landscape',
    unit: 'mm'
  });
  
  // 3. 添加字体到PDF
  doc.addFileToVFS(`${fontName}.ttf`, fontData);
  doc.addFont(`${fontName}.ttf`, fontName, 'normal');
  doc.setFont(fontName);
  
  // 4. 生成表格
  doc.autoTable({
    head: [['姓名', '年龄', '部门']],
    body: tableData,
    styles: { font: fontName }
  });
  
  // 5. 保存文件
  doc.save('员工数据.pdf');
}

4. 关键参数与配置详解

4.1 字体注册的三种方式

jsPDF提供多种字体添加方式，各有适用场景：

方式	方法	适用场景	优点	缺点
addFileToVFS	动态加载字体文件	生产环境	灵活，可换肤	需要网络请求
预加载base64	字体转为base64嵌入代码	小型项目	无需网络请求	增大bundle体积
CDN引用	直接引用在线字体	快速原型	简单快捷	依赖外部资源

4.2 字体样式的精细控制

通过autoTable的styles和columnStyles可以精细控制字体：

javascript复制doc.autoTable({
  styles: {
    font: fontName,      // 全局字体
    fontSize: 10,        // 基础字号
    cellPadding: 5,      // 单元格内边距
  },
  columnStyles: {
    0: { fontStyle: 'bold' },  // 第一列加粗
    2: { fontSize: 12 }        // 第三列加大字号
  }
});

5. 常见问题与解决方案

5.1 字体加载失败排查

如果字体加载后仍然显示乱码，按以下步骤排查：

检查字体文件路径是否正确
确认字体文件是否完整（尝试用字体查看器打开）
查看浏览器开发者工具的Network面板，确认字体请求是否成功
检查控制台是否有jsPDF的警告信息

5.2 性能优化方案

当表格数据量很大时（超过1000行），建议：

分页处理：设置startY参数实现自动分页
使用Web Worker：将PDF生成放到后台线程
预加载字体：应用启动时就加载字体

javascript复制// 分页示例
let startY = 20;
doc.autoTable({
  startY,
  body: largeData.slice(0, 50),
  didDrawPage: () => {
    startY = 20;
    doc.autoTable({
      startY,
      body: largeData.slice(50),
    });
  }
});

6. 高级技巧与扩展

6.1 多语言混合排版

当表格中同时存在中英文时，建议：

使用等宽字体（如思源等宽）
设置合适的行高（lineHeight）
对数字和英文单独设置字体

javascript复制columnStyles: {
  1: { font: 'courier' }  // 数字列使用等宽字体
}

6.2 自定义单元格渲染

通过didParseCell钩子可以完全控制单元格内容：

javascript复制doc.autoTable({
  didParseCell: (data) => {
    if (data.column.index === 3) {  // 第四列特殊处理
      data.cell.text = formatCurrency(data.cell.text);
      data.cell.styles.fontStyle = 'bold';
    }
  }
});

6.3 服务端渲染方案

对于超大表格，可以考虑服务端生成方案：

使用Node.js的pdfkit库
通过API返回PDF二进制流
前端直接下载

javascript复制// Node.js示例
const PDFDocument = require('pdfkit');
const fs = require('fs');

function generatePDF(data) {
  const doc = new PDFDocument();
  doc.pipe(fs.createWriteStream('output.pdf'));
  doc.font('fonts/SourceHanSansCN.ttf');
  
  // 添加表格内容...
  
  doc.end();
  return doc;
}

7. 实际项目中的经验总结

在金融行业项目中实施这套方案时，我总结了几个关键点：

字体授权问题：商业项目务必确认字体授权，思源黑体可免费商用，但有些字体需要购买授权
移动端适配：iOS Safari对Blob对象有特殊处理，需要添加以下兼容代码：

javascript复制// iOS兼容方案
if (window.navigator.userAgent.includes('iPhone')) {
  const blob = doc.output('blob');
  const url = URL.createObjectURL(blob);
  window.open(url);
} else {
  doc.save('报表.pdf');
}

打印优化：设置合适的PDF尺寸和边距

javascript复制new jsPDF({
  orientation: 'portrait',
  unit: 'mm',
  format: [210, 297]  // A4尺寸
});

内容安全：对用户输入内容做XSS过滤，防止PDF注入攻击

这个方案已经在我们的生产环境稳定运行2年多，支持日均5000+次PDF导出请求。对于更复杂的报表需求，可以结合PDF.js或专业的报表工具实现，但对于大多数前端表格导出场景，这套方案已经足够完善。