需求背景
最近产品增加了一个导出word文档的需求,之前有导出过pdf格式、excel格式、csv格式,但还没导出过word文档。
开源框架调研
我们的后端服务主要是用golang,因此首先想到的是golang相关的开源工具,找到2个。
unioffice
这个是工具比较强大,支持微软办公软件的3件套,word、excel 和 ppt,但要使用的话需要商业授权,因此只能暂时放弃。
github.com/nguyenthenguyen/docx
另外找到的就是这个工具,个人开发着实现的,不过功能比较弱,有很多局限性:
- 只能基于word文档模版替换里面的内容;
- 图片的插入数量必须和模版里面的图片数量一致;
- 图片格式必须与模版里面的一致(png格式的图片不能使用jpg替换);
- 替换模版里面的标识符比较容易出错,似乎只要报错一下word文本里面的格式就替换不了(可能是我的问题);
- 不支持列表输出文档。
上面2个不满足需求,继续调研了下java相关的工具。
github.com/Sayi/poi-tl
功能也是支持word模版替换,比上面的golang工具稍微强大点:
1、支持list输出文档;
2、图片替换模版里面的文字,不限制图片格式,但是输出的图片格式有问题,会导致超过文字高度的图片被遮挡。
github.com/apache/poi
上面的poi-tl 的底层库实际上就是apache poi,调研apache poi发现他的功能非常强大,对微软的办公软件支持比较全面,文档也比较全,使用可以参考:https://www.tutorialspoint.com/apache_poi_word/apache_poi_word_quick_guide.htm
demo
了解这个信息之后,我直接让GPT4给我写demo,下面是我们的对话:
最终版本
import org.apache.poi.util.Units;
import org.apache.poi.xwpf.usermodel.*;
import org.springframework.http.MediaType;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;import javax.imageio.ImageIO;
import javax.servlet.http.HttpServletResponse;
import java.awt.image.BufferedImage;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
import java.util.Arrays;
import java.util.List;@RestController
public class WordTemplateController {@GetMapping(value = "/download", produces = MediaType.APPLICATION_OCTET_STREAM_VALUE)public void download(HttpServletResponse response) throws Exception {// 创建一个新的文档XWPFDocument doc = new XWPFDocument();// 添加文本XWPFParagraph p1 = doc.createParagraph();XWPFRun r1 = p1.createRun();r1.setText("这是一段文本。");r1.setFontSize(14); // 设置字体大小r1.setBold(true); // 设置为加粗// 添加换行r1.addBreak();// 添加另一段文本XWPFRun r2 = p1.createRun();r2.setText("这是另一段文本。");r2.setFontSize(12); // 设置字体大小r2.setBold(false); // 设置为非加粗// 图片URL列表List<String> imgUrls = Arrays.asList("http://example.com/image1.jpg", "http://example.com/image2.jpg");for (String imgUrl : imgUrls) {URL url = new URL(imgUrl);URLConnection connection = url.openConnection();InputStream is = connection.getInputStream();// 读取图片并获取其宽度和高度BufferedImage img = ImageIO.read(is);int widthPx = img.getWidth();int heightPx = img.getHeight();// 按照需要的比例调整宽度和高度double scale = 0.5; // 缩小到原来的50%int width = Units.toEMU(widthPx * scale);int height = Units.toEMU(heightPx * scale);// 重新打开输入流,因为之前的已经被读取过了is = url.openStream();XWPFParagraph p = doc.createParagraph();XWPFRun r = p.createRun();int format = XWPFDocument.PICTURE_TYPE_JPEG;r.addPicture(is, format, imgUrl, width, height);}// 设置响应头response.setHeader("Content-Disposition", "attachment; filename=output.docx");response.setContentType("application/vnd.openxmlformats-officedocument.wordprocessingml.document");// 将文档写入到
总结
从对话可以看的出来,GPT4强大的代码能力和理解能力,生成的代码都是可以直接运行的,每一次我需要对程序的修改,都能按照我想要的方式完成,我不需要去看POI的官网文档,不需要理解api,直接告诉GPT4我需要什么就可以了,真的非常逆天,我花了那么多时间调研来调研去,为何不一开始就问GPT4呢,可能我想体现自己的价值吧。