欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 汽车 > 新车 > EasyExcel结合多线程+控制sheet页全量导出

EasyExcel结合多线程+控制sheet页全量导出

2025/5/17 20:41:45 来源:https://blog.csdn.net/LUCIAZZZ/article/details/147078552  浏览:    关键词:EasyExcel结合多线程+控制sheet页全量导出

业务分析

内部平台需要一个导出mysql数据到excel的方法,所以使用了EasyExcel

因为EasyExcel的sheet页是放到一个List里面的,如果把百万量级的数据放到sheet页中全量写入会有OOM风险,所以最终选择的方案是分sheet页写入

同时因为该平台是多用户的,所以不仅要控制当前方法的sheet页的总量,还要估算多用户场景下sheet页加起来的量大小,如果规定每个写入的sheet页的量级为50w,那么10个用户并行导出的时候是不是500w的量级?

那就会出现OOM问题,为了严格控制sheet页的和总量,就要细致化到控制每个线程的每次写入的sheet页的量

为了优化多线程,还可以上深分页优化来进一步优化

多优化逻辑:线程+多sheet页+深分页


代码逻辑解析

我会开3个线程,然后sheet页按照10w为一批写入,3个线程就是30w

0-30w就用主线程,30w-60w就用两个线程,60w以后就用3个线程

本次要导出的是90w量级的数据,我们严格控制sheet也就是每次写入的一批数据量batchSize为10w

导出数据总量、每批数据量,算出写入sheet页的总批次

总批次/要开启的线程数,得到每个线程要写入的批次

有3个线程,每个线程的第一次查询要拿到第一批的数据的最后一个数据的id(sql是根据id排序的)

SQL: @Select("select * from excel where id >#{lastMaxId} order by id limit #{batchsize} ")

然后每个线程除了第一次查询,其他查询都可以优化深分页

为什么我要写入多个文件而不是多线程写入一个文件?

首先我尝试并发写同一个文件,然后报错了,因为文件是不能并发写的,多线程写入会导致文件烂掉然后再也打不开

然后我想到了我们多线程写不同的文件,然后通过python脚本去合并多个sheet页和多个xsml文件

有个小问题就是xsml文件本身的问题:一个sheet页最多只能写入,所以文件本身就会有限制,这就是为什么要写入多个文件和多个sheet页最终合并文件和sheet页

一次性写入100w数据到excel

报错:在你的堆栈跟踪中,可以看到与 SXSSFSheet.createRow 方法相关的代码路径。这意味着你的代码在尝试创建第 1048576 行时,超出了 XLSX 格式的限制

这个异常是由 Apache POI 抛出的,表明尝试创建的行号超出了允许的范围。对于 XLSX 文件格式,每个工作表最多支持 1048576 行

在 Excel 中,一个 XLSX 格式文件的单个工作表(Sheet)最多可以包含1048576行数据和16384列数据


EasyExcel依赖

<!-- https://mvnrepository.com/artifact/com.alibaba/easyexcel -->
<dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>4.0.3</version>
</dependency>

测试类代码

package com.example.kiratest.test.Excel;import com.alibaba.excel.EasyExcel;
import com.alibaba.excel.ExcelWriter;
import com.alibaba.excel.write.metadata.WriteSheet;
import com.example.kiratest.EasyExcel.Mapper.ExcelMapper;
import com.example.kiratest.EasyExcel.pojo.Excel;
import com.github.pagehelper.PageHelper;
import jakarta.annotation.Resource;
import lombok.extern.slf4j.Slf4j;
import org.junit.jupiter.api.Test;
import org.springframework.boot.test.context.SpringBootTest;import java.util.List;
import java.util.Map;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.ThreadPoolExecutor;@SpringBootTest
@Slf4j
public class MutiExcelTest {@Resourceprivate ExcelMapper excelMapper;@ResourceMap<String, ThreadPoolExecutor> ThreadPoolMap;//多线程+控制sheet页@Testpublic void getData() throws InterruptedException {long startTime = System.currentTimeMillis();ThreadPoolExecutor easyExcelThreadPool = ThreadPoolMap.get("EasyExcelThreadPool");//拿到线程池int pageSize = 100000;//10w为一批Integer total = excelMapper.countTotal();//统计数据总数log.info("总数:{}",total);//batchSize<3,用一个线程,6就是2个线程,9就是3个线程int batchSize = (int) Math.ceil((double) total / pageSize);//一共要执行的批次log.info("batchSize:{}",batchSize);int everythreadSize = batchSize / 3;//一共开三个线程,每个线程应该负责多少批次int threadCount = 1; // 主线程if (batchSize > 3 && batchSize < 6) threadCount += 1;else if (batchSize > 6) threadCount += 2;CountDownLatch countDownLatch = new CountDownLatch(threadCount);//开始EasyExcel写入String filePath = "C:\\Users\\ziJian.zheng\\IdeaProjects\\Kira-Test\\src\\main\\resources\\templates\\test.xlsx";String filePath1 = "C:\\Users\\ziJian.zheng\\IdeaProjects\\Kira-Test\\src\\main\\resources\\templates\\test1.xlsx";String filePath2 = "C:\\Users\\ziJian.zheng\\IdeaProjects\\Kira-Test\\src\\main\\resources\\templates\\test2.xlsx";//开启异步线程if (batchSize > 3 ) {easyExcelThreadPool.execute(() -> {try {//用来写入的ExcelWriterExcelWriter writer1 = EasyExcel.write(filePath1).build();int first = everythreadSize + 1;//作为sheet页标识,也就是批次标识Integer lastId = null;//多Sheet写入for (int i = 0; i < everythreadSize; i++) {WriteSheet sheet = EasyExcel.writerSheet("批次" + first++).build();if (i == 0) {//也就是我们的第一次写入PageHelper.startPage(everythreadSize+1,pageSize);//第一次普通的分页查询,后面要知道id,使用书签法来优化深度分页问题List<Excel> excels = excelMapper.selectAllOrderById();if (excels.size() > batchSize)lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer1.write(excels, sheet);} else { //我们的书签法优化List<Excel> excels = excelMapper.deepPaginationSelect(lastId, pageSize);lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer1.write(excels, sheet);}}writer1.finish();} finally {countDownLatch.countDown();}});}if (batchSize > 6) {easyExcelThreadPool.execute(() -> {try {//用来写入的ExcelWriterExcelWriter writer2 = EasyExcel.write(filePath2).build();int first = 2*everythreadSize + 1;//作为sheet页标识,也就是批次标识Integer lastId = null;//多Sheet写入for (int i = 0; i < everythreadSize; i++) {WriteSheet sheet = EasyExcel.writerSheet("批次" + first++).build();if (i == 0) {//也就是我们的第一次写入PageHelper.startPage(everythreadSize*2+1,pageSize);//第一次普通的分页查询,后面要知道id,使用书签法来优化深度分页问题List<Excel> excels = excelMapper.selectAllOrderById();if (excels.size() > batchSize)lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer2.write(excels, sheet);} else { //我们的书签法优化List<Excel> excels = excelMapper.deepPaginationSelect(lastId, pageSize);lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer2.write(excels, sheet);}}writer2.finish();} finally {countDownLatch.countDown();}});}//用来写入的ExcelWriterExcelWriter writer = EasyExcel.write(filePath).build();//主线程执行try {int first = 0;//作为sheet页标识,也就是批次标识Integer lastId = null;//多Sheet写入for (int i = 0; i < everythreadSize; i++) {WriteSheet sheet = EasyExcel.writerSheet("批次" + first++).build();if (i == 0) {//也就是我们的第一次写入PageHelper.startPage(1, pageSize);//第一次普通的分页查询,后面要知道id,使用书签法来优化深度分页问题List<Excel> excels = excelMapper.selectAllOrderById();if (excels.size() > batchSize)lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer.write(excels, sheet);} else { //我们的书签法优化List<Excel> excels = excelMapper.deepPaginationSelect(lastId, pageSize);lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer.write(excels, sheet);}}}finally {writer.finish();countDownLatch.countDown();}countDownLatch.await();log.info("导出结束");log.info("时间:{}",System.currentTimeMillis()-startTime);}//一次性写入100w数据到excel//报错:在你的堆栈跟踪中,可以看到与 SXSSFSheet.createRow 方法相关的代码路径。这意味着你的代码在尝试创建第 1048576 行时,超出了 XLSX 格式的限制//这个异常是由 Apache POI 抛出的,表明尝试创建的行号超出了允许的范围。对于 XLSX 文件格式,每个工作表最多支持 1048576 行//在 Excel 中,一个 XLSX 格式文件的单个工作表(Sheet)最多可以包含1048576行数据和16384列数据@Testvoid allData(){List<Excel> excels = excelMapper.selectAllOrderById();String filePath = "C:\\Users\\ziJian.zheng\\IdeaProjects\\Kira-Test\\src\\main\\resources\\templates\\test.xlsx";WriteSheet sheet = EasyExcel.writerSheet("批次" ).build();//用来写入的ExcelWriterExcelWriter writer = EasyExcel.write(filePath).build();writer.write(excels, sheet);}@Testvoid test(){List<Excel> excels = excelMapper.deepPaginationSelect(100, 1000);System.out.println(excels);}}

Mapper

package com.example.kiratest.EasyExcel.Mapper;import com.example.kiratest.EasyExcel.pojo.Excel;
import org.apache.ibatis.annotations.Mapper;
import org.apache.ibatis.annotations.Select;import java.util.List;@Mapper
public interface ExcelMapper {@Select("select * from excel order by id")List<Excel> selectAllOrderById();  //查询数据根据id排序,如果这个要分页的话我们就是用我们的PageHelper@Select("select count(*) from excel")Integer countTotal();@Select("select * from excel where id >#{lastMaxId} order by id limit #{batchsize} ")List<Excel> deepPaginationSelect(Integer lastMaxId,Integer batchsize); //深度分页通过书签法解决}

POJO类

package com.example.kiratest.EasyExcel.pojo;import com.alibaba.excel.annotation.ExcelIgnore;
import com.alibaba.excel.annotation.ExcelProperty;
import com.alibaba.excel.annotation.write.style.ColumnWidth;
import com.fasterxml.jackson.annotation.JsonFormat;
import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;import java.util.Date;@Data
@AllArgsConstructor
@NoArgsConstructor
@ColumnWidth(20)
public class Excel {@ExcelIgnoreprivate Integer id;@ExcelProperty(value = "用户姓名",index = 0)private String name;@ExcelProperty(value = "用户Id",index = 1)private String uesrId;@ExcelProperty(value = "居住地址",index = 2)private String location;@JsonFormat(pattern = "yyyy-MM-dd HH:mm:ss",timezone = "GMT+8")private Date createTime;
}

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词