一、为什么要造这个轮子
【C++】使用WebAssembly在浏览器端操作Excel_wasm文件用什么打开_你的薄荷醇的博客-CSDN博客使用WebAssembly在浏览器端操作Excel_wasm文件用什么打开https://blog.csdn.net/weixin_44305576/article/details/125545900?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522168964185516800185863561%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=168964185516800185863561&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~baidu_landing_v2~default-4-125545900-null-null.142%5Ev88%5Econtrol_2,239%5Ev2%5Einsert_chatgpt&utm_term=C%2B%2B%20wasm&spm=1018.2226.3001.4187初学 WASM 时,使用的是 C++,当时看到上面这篇博客,只能使用 Web 端操作 xls 文件,而不支持 xlsx 文件,从该文章出发,确实达到了作者在 Web 简单操作 Excel 的目标。而本文仅从小白入门学习的角度出发,重造一个轮子,以更完善支持 Web 端操作 Excel。
二、Linux 开发环境搭建
Rust Wasm Linux开发环境搭建_centos安装rust_余衫马的博客-CSDN博客Linux 下 Rust + Wasm/Wasi 开发_centos安装rusthttps://blog.csdn.net/weixin_47560078/article/details/130559636参照这里的 Linux 开发环境。
三、OpenXLSX
# 参考官网 https://github.com/troldal/OpenXLSX
1、安装CMake
# https://cmake.org/download/# 解压
tar -zxvf cmake-3.27.0.tar.gz# 进入目录
cd cmake-3.27.0# 安装
./bootstrap && make -j4 && sudo make install
2、下载并编译 OpenXLSX
# clone 代码
git clone https://github.com/troldal/OpenXLSX.git# 进入目录
cd OpenXLSX# 新建 build 文件夹
mkdir build# 进入 build 文件夹
cd build# 编译
cmake ..# 构建
cmake --build . --target OpenXLSX --config Release# root 权限执行安装
cmake --install .# 自定义安装路径
# cmake --install . --prefix=/home/sam/mylib
这里看到红色报错,不影响,实际上 OpenXLSX 库已经安装了,这个报错是说没有其他库。
3、使用 OpenXLSX 静态库
#include <OpenXLSX.hpp>using namespace OpenXLSX;int main() {XLDocument doc;doc.create("Spreadsheet.xlsx");auto wks = doc.workbook().worksheet("Sheet1");wks.cell("A1").value() = "Hello, OpenXLSX!";doc.save();return 0;
}
这里为方便,我把头文件和静态库放到了项目根目录下,
4、编译运行 c++
# 安装 C/C++ 编译器
# C/C++ 编译器
yum -y install gcc
yum -y install gcc-c++[root@localhost demo]# gcc hello.c -o hello1
[root@localhost demo]# ./hello1
Hello,world[root@localhost demo]# g++ hello.cpp -o hello2
[root@localhost demo]# ./hello2
Hello,world!
# 指定 C++ 17 标准,链接静态库 libOpenXLSX.a
g++ -std=c++17 main.cpp libOpenXLSX.a -o test_open_xlsx
./test_open_xlsx
可以看到,生成 Excel 文件,并且正常打开。
若直接引用头文件, 则 #include <OpenXLSX/OpenXLSX.hpp> ,编译时也需指定静态库的位置。
5、附:Windows 下编译使用 OpenXLSX
git clone 完成后,进入 OpenXLSX 根目录,新建 build 文件夹,然后执行编译,
mkdir build
cd build
cmake ..
cmake --build . --target OpenXLSX --config Release
cmake --install .
报错 file INSTALL cannot find,但其实已经安装了 OpenXlsx,因为这个报错很明显还没有编译 benchmark.lib,因为我们根本不需要这个库,
# 可以通过 prefix 指定安装路径,
cmake --install . --prefix=F:\OpenXLSX
VS2019 中使用,需要配置 包含目录、库目录、库名字,
踩坑注意,C++语言标准会影响某些标准库,否则会报错 namespace std 没有成员 string_view,
同样的代码,运行成功。
6、附:封装 OpenXLSX 并导出为 DLL
VS2019 创建 DLL 项目,
定义 hpp 以及对应的 cpp,
注意必须包含 pch.h,
编译配置,
然后生成,
可以看到,已经导出函数,
Rust 中使用该 DLL,
[dependencies]
# 调用外部 dll
libloader = "0.1.4"
main.rs 调用 dll,
use cstr::cstr;
use libloader::*;
use std::{ffi::CStr,os::raw::c_char};fn main() {get_libfn!("dll/mydll.dll", "println", println, (), s: &str);println("你好");get_libfn!("dll/mydll.dll", "add", add, usize, a: usize, b: usize);println!(" 1 + 2 = {}", add(1, 2));get_libfn!("dll/mydll.dll", "print_hello", print_hello, bool);print_hello();get_libfn!("dll/mydll.dll","return_str", return_str,*const c_char, s: *const c_char);let str = unsafe { CStr::from_ptr(return_str(cstr!("你好 ").as_ptr())) };print!("out {}", str.to_str().unwrap());get_libfn!("dll/Dll1.dll", "testExcel", test_excel, usize);test_excel();
}
编译运行,
7、附:Rust 调用 rlib 子库
[workspace]
#以子目录成员方式添加 lib
members = ["mydll"
]
编写 build.rs 指定 rlib 路径,
fn main() {// .rlib 路径println!("cargo:rustc-link-search=./target/debug/");
}
构建 rlib 库,
使用 extern crate ,
use cstr::cstr;
use libloader::*;
use std::{ffi::CStr,os::raw::c_char};
extern crate mydll;fn main() {get_libfn!("dll/mydll.dll", "println", println, (), s: &str);println("你好");get_libfn!("dll/mydll.dll", "add", add, usize, a: usize, b: usize);println!(" 1 + 2 = {}", add(1, 2));get_libfn!("dll/mydll.dll", "print_hello", print_hello, bool);print_hello();get_libfn!("dll/mydll.dll","return_str", return_str,*const c_char, s: *const c_char);let str = unsafe { CStr::from_ptr(return_str(cstr!("你好 ").as_ptr())) };print!("out {}", str.to_str().unwrap());// get_libfn!("dll/Dll1.dll", "testExcel", test_excel, usize);// test_excel();mydll::test_excel_dll();}
编译运行,同样运行成功。
8、附:Rust 调用外部 DLL 的三个库
# 调用外部 dll
# libloader = "0.1.4"
# libloading = "0.7.2"
# dlopen2 = "0.4"
注:rust wasm 不支持 libc,
issue 文档 https://github.com/astonbitecode/j4rs/issues/53
使用 rlib 调用,因为原构建 target 为 x86_64-pc-windows-msvc ,因此不兼容 wasm32-unknown-unknown,
四、Emscripten
参考 https://developer.mozilla.org/zh-CN/docs/WebAssembly/C_to_wasm
1、下载安装
# 指定版本 git clone -b 3.1.0 https://github.com/juj/emsdk.git# 最新版本
git clone https://github.com/juj/emsdk.gitcd emsdk./emsdk install latest./emsdk activate latestsource ./emsdk_env.sh
遇到安装错误如下,
# 安装指令替换为:
# ./emsdk.py install latest
# ./emsdk.py activate latest# 因为 emsdk 最终会调用 emsdk.py
如果权限不够,则需要赋权,
在最后一步遇到错误,这是 python 编译安装时候的问题,缺了一个模块,
ModuleNotFoundError: No module named '_ctypes'
解决方案如下,
yum install libffi-devel # 然后重新编译 python 源码,这里使用版本 Python-3.8.8.tgz./configure --prefix=/usr/local/python3 --with-ssl makemake install
重建软链接,
sudo rm -rf /usr/local/bin/python3
sudo ln -s /usr/local/lib/python3.8/bin/python3.8 /usr/local/bin/python3
emcc -v
2、使用 emcc/em++ 编译 hello C/C++ 代码为 wasm
# 参考官方文档
https://emscripten.org/docs/compiling/Building-Projects.html
https://emscripten.org/docs/compiling/WebAssembly.html
2.1、编译方案1
编译到 wasm 并且生成一个用来运行我们代码的 HTML,将所有 wasm 在 web 环境下运行所需要的“胶水”JavaScript 代码都添加进去。
// hello.cpp
#include <stdio.h>int main(int argc, char ** argv) {printf("Hello World\n");
}// 编译指令
// emcc hello.cpp -s WASM=1 -o hello.html
可以看到已经生成了 hello.html 、hello.js 、hello.wasm,直接点开 html 文件运行是不行的,需要部署为 Web Server,这里使用 python 构建一个 Web Server,
# Python 版本是 3.X
python -m http.server
# Python 版本是 2.X
python -m SimpleHTTPServer
可以看到,已经自动调用了 main 函数中的 hello world 输出。
2.2、编译方案2
编译到 wasm 然后仅仅生成 JavaScript、WASM,
emcc -o hello2.js hello.cpp -O3 -s WASM=1
可以看到,仅生成了 hello2.js、hello2.wasm 文件,没有模板文件,
2.3、补充:使用自定义 HTML 模板
有些时候你可能想要使用一个自定义的 HTML 模板,让我们看看怎么实现,
# 在项目根目录下创建文件夹 html_template
mkdir html_template# 在 emsdk 中搜索一个叫做 shell_minimal.html 的文件,然后复制它到刚刚创建的目录下的
html_template文件夹cp /home/sam/Downloads/emsdk/upstream/emscripten/src/shell_minimal.html html_template
执行编译脚本,
emcc -o hello3.html hello.cpp -O3 -s WASM=1 --shell-file html_template/shell_minimal.html# 我们使用了 -o hello3.html,这意味编译器将仍然输出 js 胶水代码 和 html 文件
# 我们还使用了 --shell-file html_template/shell_minimal.html,这指定了要运行的例子使用 HTML 页面模板
hello3.html 运行效果,
五、JS 调用一个在 C/C++ 中自定义的函数
新建 hellojs.cpp,
#include <stdio.h>
#include <emscripten/emscripten.h>int main(int argc, char ** argv) {printf("Hello World\n");
}#ifdef __cplusplus
extern "C" {
#endifint EMSCRIPTEN_KEEPALIVE myFunction(int argc, char ** argv) {printf("我的函数已被调用\n");
}#ifdef __cplusplus
}
#endif
官方解释如下,
默认情况下,Emscripten 生成的代码只会调用
main()
函数,其他的函数将被视为无用代码。在一个函数名之前添加EMSCRIPTEN_KEEPALIVE
能够防止这样的事情发生。你需要导入emscripten.h
库来使用EMSCRIPTEN_KEEPALIVE
。
备注:为了保证万一你想在 C++ 代码中引用这些代码时代码可以正常工作,我们添加了
#ifdef
代码块。由于 C 与 C++ 中名字修饰规则的差异,添加的代码块有可能产生问题,但目前我们设置了这一额外的代码块以保证你使用 C++ 时,这些代码会被视为外部 C 语言函数。
编译脚本如下,
emcc -o hellojs.html hellojs.cpp -O3 -s WASM=1 -s "EXTRA_EXPORTED_RUNTIME_METHODS=['ccall']" --shell-file html_template/shell_minimal.html
现在我们需要运行新的 myFunction()
JavaScript 函数,在页面上新增一个按钮,并绑定 js 事件,
<button class="mybutton">运行我的函数</button>document.querySelector(".mybutton").addEventListener("click", function () {alert("检查控制台");var result = Module.ccall("myFunction", // name of C functionnull, // return typenull, // argument typesnull,); // arguments
});
然后运行 Web,
六、使用 Emscripten 编译 OpenXLSX
1、补充:emmake / emcmake
2、 重新编译 OpenXLSX
# 编译
emcmake cmake ..
# 生成lib.a 的llvm bitcode
emmake make
在 output 文件夹下会生成静态库,
3、在项目中使用该静态库
把静态库拷贝到项目依赖库下,编译,
// main.cpp
#include <OpenXLSX/OpenXLSX.hpp>
#include <emscripten/emscripten.h>using namespace OpenXLSX;int main(){printf("call main function default\n");return 0;
}#ifdef __cplusplus
extern "C" {
#endifint EMSCRIPTEN_KEEPALIVE test_open_xlsx() {XLDocument doc;doc.create("Spreadsheet.xlsx");auto wks = doc.workbook().worksheet("Sheet1");wks.cell("A1").value() = "Hello, OpenXLSX!";doc.save();printf("函数 test_open_xlsx 已被调用\n");return 0;
}#ifdef __cplusplus
}
#endif
// build_sh.sh
export SOURCE=./wasm_demoecho "Running Emscripten..."em++ -std=c++17 -O3 -flto ${SOURCE}/main.cpp -s WASM=1 \
-s "EXTRA_EXPORTED_RUNTIME_METHODS=['ccall']" -s ASSERTIONS=1 --shell-file ${SOURCE}/html_template/shell_minimal.html \
-o ${SOURCE}/final.html -I${SOURCE}/mylib/include -L${SOURCE}/mylib/lib64 \
-lOpenXLSX echo "Finished Build"
最终生成 final 三个文件,
部署 final.html ,访问效果如下,
js 调用函数,
如果直接使用Cmake,则编译出来的静态库不兼容,最终导致调用函数出错,
七、资源 IO
项目中的 C++ 里使用了很多系统的 API,主要是一些文件 IO,而 emscripten 对文件 IO 有很好的封装,并提供了一套虚拟文件系统,以兼容不同环境下文件 IO 的适配问题。
在最底层,Emscripten提供了三套文件系统
- MEMFS: 系统的数据完全存储在内存中,其非常类似于 webpack 的实现,在内存里模拟了一套文件系统的操作,运行时写入的文件不会持久化到本地
- NODEFS: Node.js 文件系统,该系统可以访问本地文件系统,可以持久化存储文件,但只能用于Node.js环境
- IDBFS: indexDB 文件系统,该系统基于浏览器的 IndexDB 对象,可以持久化存储,但只用于浏览器环境
7.1、src/setting.js 介绍
该文件指示了 -s <flag> 可以配置什么内容,例如 NODERAWFS、EXPORT_ES6、SIDE_MODULE 等,
7.2、使用 IDBFS 示例
官方文档,
https://emscripten.org/docs/api_reference/Filesystem-API.html#filesystem-api-idbfshttps://emscripten.org/docs/porting/files/index.html#packaging-code-indexhttps://emscripten.org/docs/porting/files/file_systems_overview.html#file-system-overview
改造 main.cpp ,注意这里两种导出函数的方法,对应不同的编译参数,以及在 js 调用时有 _ 前缀区别,
#include <OpenXLSX/OpenXLSX.hpp>
#include <emscripten/emscripten.h>
#include <emscripten/val.h>
#include <emscripten/bind.h> using namespace OpenXLSX;int main(){printf("call main function default\n");return 0;
}void setup_idbfs() {EM_ASM(FS.mkdir('/data');FS.mount(IDBFS, {root : '.'},'/data'););
}int test_node_fs(){setup_idbfs();XLDocument doc;doc.create("/data/Spreadsheet.xlsx");auto wks = doc.workbook().worksheet("Sheet1");wks.cell("A1").value() = "EMSCRIPTEN_BINDINGS >>> Hello, OpenXLSX!";doc.save();printf("函数 test_node_fs 已被调用\n");return 0;}EMSCRIPTEN_BINDINGS(Module){emscripten::function("test_node_fs",&test_node_fs);
}#ifdef __cplusplus
extern "C" {
#endifint EMSCRIPTEN_KEEPALIVE test_open_xlsx() {XLDocument doc;doc.create("/data/Spreadsheet.xlsx");auto wks = doc.workbook().worksheet("Sheet1");wks.cell("A1").value() = "EMSCRIPTEN_KEEPALIVE >>> Hello, OpenXLSX!";doc.save();printf("函数 test_open_xlsx 已被调用\n");return 0;
}#ifdef __cplusplus
}
#endif
编译脚本,
# build.sh
export SOURCE=./wasm_demoecho "Running Emscripten..."emcc -std=c++17 -Oz --bind ${SOURCE}/main.cpp -s WASM=1 \
--shell-file ${SOURCE}/html_template/shell_minimal.html \
-s EXTRA_EXPORTED_RUNTIME_METHODS='[FS]' -s ASSERTIONS=1 \
-s INITIAL_MEMORY=268435456 -s ALLOW_MEMORY_GROWTH=1 \
-s STACK_OVERFLOW_CHECK=2 -s PTHREAD_POOL_SIZE_STRICT=2 \
-o ${SOURCE}/final.html -I${SOURCE}/mylib/include -L${SOURCE}/mylib/lib64 \
-lOpenXLSX -lidbfs.jsecho "Finished Build"
编译产物,
同样需要手动新增按钮、以及绑定按钮事件,
<button class="mybutton">运行我的函数</button>
<script>function downloadBlob(blob, filename) {const url = URL.createObjectURL(blob);const link = document.createElement('a');link.href = url;link.download = filename;document.body.appendChild(link);link.click();document.body.removeChild(link);URL.revokeObjectURL(url);}document.querySelector(".mybutton").addEventListener("click", function () {//alert("检查控制台");// Module._test_open_xlsx();Module.test_node_fs();var data = FS.readFile("/data/Spreadsheet.xlsx");var blob;blob = new Blob([data.buffer], { type: "application/vnd.ms-excel" });downloadBlob(blob, "Spreadsheet.xlsx");});</script>
最后发布一个 web 来查看效果,
补充:js 下载 Blob 二进制对象,
# CSDN `C知道`生成代码
# 补充:js 下载 Blob 二进制对象
要在JavaScript中下载一个Blob对象,你可以使用以下步骤:1. 创建一个Blob对象,可以通过使用Blob构造函数或者从其他地方获取。
2. 创建一个URL对象,可以通过调用`URL.createObjectURL(blob)`来实现。这将为Blob对象创建一个临时URL。
3. 创建一个链接元素(`<a>`)并设置其`href`属性为临时URL。
4. 设置链接元素的`download`属性为所需的文件名。
5. 使用JavaScript模拟点击链接元素,以触发文件下载。以下是一个示例代码:```javascript
function downloadBlob(blob, filename) {const url = URL.createObjectURL(blob);const link = document.createElement('a');link.href = url;link.download = filename;document.body.appendChild(link);link.click();document.body.removeChild(link);URL.revokeObjectURL(url);
}
```你可以调用`downloadBlob`函数并传入Blob对象和所需的文件名来下载Blob。例如:```javascript
const data = 'Hello, world!';
const blob = new Blob([data], { type: 'text/plain' });downloadBlob(blob, 'example.txt');
```上述代码将下载一个名为`example.txt`的文本文件,内容为`Hello, world!`。请注意,这段代码在浏览器环境下运行,不适用于Node.js。在Node.js中,你可以使用fs模块来完成文件下载操作。
7.3、使用 NODEFS 示例
// main_nodejs.cc
#include <OpenXLSX/OpenXLSX.hpp>
#include <emscripten/emscripten.h>
#include <emscripten/val.h>
#include <emscripten/bind.h> using namespace OpenXLSX;void setup_nodefs() {EM_ASM(FS.mkdir('/data');FS.mount(NODEFS, {root:'.'}, '/data'););
}int main() {setup_nodefs();printf("call main function default\n");return 0;
}void test_open_xlsx() {XLDocument doc;doc.create("/data/Spreadsheet.xlsx");auto wks = doc.workbook().worksheet("Sheet1");wks.cell("A1").value() = "EMSCRIPTEN_KEEPALIVE >>> Hello, OpenXLSX!";doc.save();printf("函数 test_open_xlsx 已被调用\n");}EMSCRIPTEN_BINDINGS(Module){emscripten::function("test_open_xlsx_v2",&test_open_xlsx);
}
# build_nodejs.sh
export SOURCE=./wasm_demoecho "Running Emscripten..."emcc -std=c++17 --bind ${SOURCE}/main_nodefs.cc \
-o ${SOURCE}/out.js -I${SOURCE}/mylib/include -L${SOURCE}/mylib/lib64 \
-lOpenXLSX -lnodefs.jsecho "Finished Build"cd wasm_demo/node out.js
可以看到,当前目录下生成了 Excel 文件,
注意,这里的 nodejs 运行环境版本要跟 emsdk 的 nodejs 版本一致,否则跨平台运行时因版本不一致而报错,
7.4、补充:Node WASI 【官方说该接口未稳定】
# node 官网 https://nodejs.org/api/wasi.html
# 以下摘自 C知道
要在 Node.js 中使用 WASI,你需要安装 `wasi` 模块。以下是安装和使用的步骤:1. 确保你已经安装了 Node.js,并且版本在 14 或更高。2. 打开终端或命令提示符,并使用以下命令安装 `wasi` 模块:```shellnpm install wasi```3. 在你的 Node.js 项目中,通过以下方式引入 `wasi` 模块:```javascriptconst { WASI } = require('wasi');```4. 创建一个新的 WASI 实例:```javascriptconst wasi = new WASI({args: process.argv,env: process.env,preopens: { '/sandbox': '/path/to/sandbox' }});```在上面的代码中,你可以通过 `args` 传递命令行参数,`env` 传递环境变量,`preopens` 指定预打开的目录。5. 加载 WebAssembly 模块,并将其与 WASI 实例相关联:```javascriptconst importObj = {wasi_snapshot_preview1: wasi.wasiImport};const wasmModule = new WebAssembly.Module(fs.readFileSync('/path/to/module.wasm'));const wasmInstance = new WebAssembly.Instance(wasmModule, importObj);```6. 启动 WASI 实例,并在其中运行 WebAssembly 模块:```javascriptwasi.start(wasmInstance);```这样,你就可以在 Node.js 中使用 WASI 运行 WebAssembly 模块了。请注意,WASI 目前仍然处于实验阶段,可能会有一些限制和不完善的地方。
# Step1、安装 wasi 模块
# npm install
cnpm install wasi
// node v18.x
// test_node_wasi.js
'use strict';
const { readFile } = require('node:fs/promises');
const { WASI } = require('wasi');
const { argv, env } = require('node:process');
const { join } = require('node:path');const wasi = new WASI({args: argv,env,preopens: {'/sandbox': '/some/real/path/that/wasm/can/access',},
});// Some WASI binaries require:
// const importObject = { wasi_unstable: wasi.wasiImport };
const importObject = { wasi_snapshot_preview1: wasi.wasiImport };(async () => {const wasm = await WebAssembly.compile(await readFile(join(__dirname, 'demo.wasm')),);const instance = await WebAssembly.instantiate(wasm, importObject);wasi.start(instance);
})();
node --experimental-wasi-unstable-preview1 test_node_wasi.js
# 如果遇到报错
Cannot find module 'node:fs/promises'# 这是 node 版本太低导致
[sam@localhost wasm_demo]$ node -v
v14.15.5# 解决:升级 node
清理 npm 缓存:npm cache clean -f
安装版本管理工具:npm install -g n
升级到最新的版本:n latest(最新版本)或者 n stable(最新稳定版本)# 切换版本
n 18# node 18 文档
https://nodejs.org/dist/latest-v18.x/docs/api/
八、OpenXLSX 基础操作封装
1、C++ 代码封装与编译
// main_web_excel.cc
#include <OpenXLSX/OpenXLSX.hpp>
#include <emscripten/emscripten.h>
#include <emscripten/val.h>
#include <emscripten/bind.h>
#include <string>
#include <iostream>
#include <json11/json11.hpp>using namespace json11;
using namespace std;
using namespace OpenXLSX;// 手动挂载 IDBFS 文件系统
void setup_nodefs() {EM_ASM(FS.mkdir('/data');FS.mount(IDBFS, {root:'.'}, '/data'););
}// 窄字符转宽字符
// 一开始是返回宽字符,发现Web输出乱码,又将结果以窄字符返回,显示正常
wstring string_to_wstring(string str){wstring wstr(str.length(), L' ');copy(str.begin(), str.end(), wstr.begin());return wstr;
}// 将一个向量数组以分隔符拼接为字符串数组返回
string join(char c, vector<string> src) {string res = "";if (src.size() == 0) return res;vector<string>::iterator it = src.begin();res += "\"" + *it + "\"";for (it++; it != src.end(); it++) {res += c;res += "\"" + *it + "\"";}return res;
}// 向量数组转字符串数组
string vec_to_array_str(vector<string> sheetNames) {string outputstr = "[";string sheetNamesStr = join(',',sheetNames);outputstr += sheetNamesStr;outputstr += "]";return outputstr;
}// Excel 封装
class MyExcel {private:// 文件名string _filename;// 文件路径string _filePath;// 文档对象XLDocument _doc;public:// 构造函数,指定文件名,拼接虚拟路径MyExcel (string filename) {_filename = filename;_filePath = string("/data/") + filename;}// 创建文件void create(){_doc.create(_filePath);}// 打开文件void open(){_doc.open(_filePath);cout << "open file " << _filePath << endl;}// 关闭文件void close(){_doc.close();cout << "close file." << endl;}// 获取 Excel 全部的 sheet vector<string> get_all_sheetname(){XLWorkbook wb = _doc.workbook();return wb.sheetNames();}// 加载某个 sheet 的全部内容string load_sheet_content(string sheetName){cout << "load_sheet_content " << sheetName <<endl;auto wks = _doc.workbook().worksheet(sheetName);cout << "rowCount: " << wks.rows().rowCount() << endl;string rowsJsonStr = "[";for (auto& row : wks.rows()) {vector<string> rowValue = vector<string> {};for (auto& value : list<XLCellValue>(row.values())) {//rowValue.insert(rowValue.end(),(string) value);if (value.typeAsString() == "float" ) {rowValue.insert(rowValue.end(),to_string( value.get<float>() ));} else if(value.typeAsString() == "integer" ) {rowValue.insert(rowValue.end(),to_string( value.get<int>() ));} else {rowValue.insert(rowValue.end(),value.get<string>() );}cout << value.typeAsString() << endl;}//rowsJsonStr += "\"r" + to_string(row.rowNumber()) + "\"" + ":" + vec_to_array_str(rowValue);rowsJsonStr += vec_to_array_str(rowValue);if( row.rowNumber() != wks.rows().rowCount()) {rowsJsonStr += ",";}}rowsJsonStr += "]";string out = "{";out += "\"rowsData\":" + rowsJsonStr + ",";//out += "\"sheetName\":\"" + sheetName + "\",";out += "\"rowCount\":" + to_string(wks.rows().rowCount());out += "}";return out; }// 将 json 字符解析并保存到 excel string save_json_to_excel(string jsonstr) {string err;const auto json = Json::parse(jsonstr,err);cout << "Json::parse Err " << err << endl;const auto data = json["data"];const auto sheetList = json["sheetList"].array_items();for(int i = 0; i < sheetList.size(); i++) {const string sheetname = sheetList[i].string_value();const int rowCount = data[sheetname]["rowCount"].int_value();if (!_doc.workbook().sheetExists(sheetname)) {_doc.workbook().addWorksheet(sheetname);}auto wks = _doc.workbook().worksheet(sheetname);//cout << sheetname << " " << rowCount << endl;for(int j = 0; j < rowCount; j++) {// attention: j must begin from 1 to ... , since rowid > 0vector<string> cellValues = vector<string> {};const auto jsonArray = data[sheetname]["rowsData"][j].array_items();for(int k = 0; k < jsonArray.size(); k++) {cellValues.insert(cellValues.end(), jsonArray[k].string_value());}wks.row(j+1).values() = cellValues;}}cout << "Saving Excel File ..." << endl;_doc.save();return _filename;}
};// 保存到 excel 文件,返回保存文件名
string save_excel(string str) {MyExcel myExcel = MyExcel("save.xlsx");myExcel.create(); string save_filename = myExcel.save_json_to_excel(str);myExcel.close();return save_filename;
}// 加载某个 excel 文档
string load_excel(string filename) {MyExcel myExcel = MyExcel(filename);myExcel.open();vector<string> sheetNames = myExcel.get_all_sheetname();cout << "sheet size: " << sheetNames.size() <<endl;string out = "{";out += "\"sheetList\":" + vec_to_array_str(sheetNames) + ",";out += "\"data\":{";for(int i = 0; i < sheetNames.size(); i++) {out += "\"" + sheetNames[i] + "\":" + myExcel.load_sheet_content(sheetNames[i]);if( i < sheetNames.size() - 1){out += ",";}}out += "}";out += "}";myExcel.close(); return out;
}// 测试
void test_open_xlsx() {XLDocument doc;doc.create("/data/Spreadsheet.xlsx");auto wks = doc.workbook().worksheet("Sheet1");wks.cell("A1").value() = "EMSCRIPTEN_KEEPALIVE >>> Hello, OpenXLSX!";doc.save();printf("函数 test_open_xlsx 已被调用\n");}int main() {setup_nodefs();printf("call main function default\n");return 0;
}EMSCRIPTEN_BINDINGS(Module){emscripten::function("test_open_xlsx_v2",&test_open_xlsx);emscripten::function("load_excel",&load_excel);emscripten::function("save_excel",&save_excel);
}
# build.sh
export SOURCE=./wasm_excelecho "Running Emscripten..."emcc -std=c++17 -Oz --bind ${SOURCE}/main_web_excel.cc ${SOURCE}/json11.cpp -s WASM=1 \
--shell-file ${SOURCE}/html_template/shell_minimal.html \
-s EXTRA_EXPORTED_RUNTIME_METHODS='[FS]' -s ASSERTIONS=1 \
-s INITIAL_MEMORY=268435456 -s ALLOW_MEMORY_GROWTH=1 \
-s STACK_OVERFLOW_CHECK=2 -s PTHREAD_POOL_SIZE_STRICT=2 \
-o ${SOURCE}/final.html -I${SOURCE}/mylib/include -L${SOURCE}/mylib/lib64 \
-lOpenXLSX -lidbfs.jsecho "Finished Build"
2、前端代码封装
<!-- index.html -->
<!doctypehtml><html lang=en-us><head><meta charset=utf-8><meta content="text/html; charset=utf-8" http-equiv=Content-Type><title>WASM + OpenXLSX</title><link rel="stylesheet" href="excel.css" type="text/css"></link></head><body><div class="top"><input type="file" id="file" onchange="loadExcel(event)"><button class="save_btn">SaveChange</button><button class="download_btn">DownloadExcel</button></div><div class="wyb-excel wyb-excel-table"><table width="100%"><tbody><tr style="height: 38px;" id="letter"><td class="drug-ele-td" style="width: 49px; text-align: center;"></td><td class="drug-ele-td" style="text-align: center; width: 91px;">A</td><td class="drug-ele-td" style="text-align: center; width: 91px;">B</td><td class="drug-ele-td" style="text-align: center; width: 91px;">C</td><td class="drug-ele-td" style="text-align: center; width: 91px;">D</td><td class="drug-ele-td" style="text-align: center; width: 91px;">E</td><td class="drug-ele-td" style="text-align: center; width: 91px;">F</td><td class="drug-ele-td" style="text-align: center; width: 92px;">G</td><td class="drug-ele-td" style="text-align: center; width: 92px;">H</td><td class="drug-ele-td" style="text-align: center; width: 93px;">I</td><td class="drug-ele-td" style="text-align: center; width: 93px;">J</td></tr></tbody></table></div><div class="sheetlist"></div><script async src=final.js></script><script src=index.js></script><script type="text/javascript" src=jquery-3.4.1.js></script></body></html>
// index.js
let reader = new FileReader();
let jsonMap = Object.create({});
let globalSheetList = [];
let file;
let currentsheet;// 保存并下载
document.querySelector(".download_btn").addEventListener("click", function () {// Module._test_open_xlsx();// Module.test_node_fs();const saveFilename = Module.save_excel(cast_excel_to_jsonstr());downloadExcel(saveFilename);
});// 保存 sheet 修改
document.querySelector(".save_btn").addEventListener("click", function () {save_current_sheet_change();
});/*** 下载 Excel 到本地* @param {*} filename 保存时的文件名*/
function downloadExcel(filename) {if (filename) {var data = FS.readFile("/data/" + filename);var blob;blob = new Blob([data.buffer], { type: "application/vnd.ms-excel" });downloadBlob(blob, "Spreadsheet.xlsx");}
}/*** 下载 blob 文件* @param {*} blob 二进制流数据* @param {*} filename 保存文件名*/
function downloadBlob(blob, filename) {const url = URL.createObjectURL(blob);const link = document.createElement('a');link.href = url;link.download = filename;document.body.appendChild(link);link.click();document.body.removeChild(link);URL.revokeObjectURL(url);
}/*** 将 excel 各个 sheet 的数据内容保存到本地对应的 json 对象中* @param {*} jsonObj json 对象*/
function save_excel_json_to_local(jsonObj) {const sheetList = Object.keys(jsonObj.data);for (let i = 0; i < sheetList.length; i++) {jsonMap[sheetList[i]] = jsonObj.data[sheetList[i]];}globalSheetList = jsonObj["sheetList"];
}/*** 保存当前 sheet 的修改*/
function save_current_sheet_change() {jsonMap[currentsheet] = cast_current_sheet_to_jsonstr();
}/*** 加载 Excel* @param {*} e 事件参数*/
function loadExcel(e) {// 清空 jsonMap、globalSheetListjsonMap = {};globalSheetList = [];// 获取文件列表let files = document.getElementById('file').files;// 取第一个文件file = files[0];// 绑定加载事件reader.addEventListener('loadend', writeFile);// 读取文件为缓存数组reader.readAsArrayBuffer(file);// 定时读取文件内容输出到控制台setTimeout(() => {// 调用 c++ 函数 loadexcel,返回 json 字符串let jsonstr = Module.load_excel(file.name);// 清空旧数据$(".sheetlist").empty();// 序列化 json 字符let json = JSON.parse(jsonstr);save_excel_json_to_local(json);showTableList();// console.log(Object.keys(json.data)[0]);// 拿到 data 下的全部 sheet key,默认取第一个 sheet key 显示showCellList(Object.keys(json.data)[0]);// console.log('result: ' + jsonstr);}, 1000)
}/*** 复制一份文件到容器路径下* @param {*} e 事件参数*/
function writeFile(e) {let result = reader.result;const uint8_view = new Uint8Array(result);FS.writeFile('/data/' + file.name, uint8_view)console.log(uint8_view.byteLength)
}/*** 渲染表格列表*/
function showTableList() {let sheetElementStr = '';// 渲染 sheet 列表for (var i = 0; i < globalSheetList.length; i++) {if (i == 0) {sheetElementStr += `<div _na="${globalSheetList[i]}" class="currentsheet">${globalSheetList[i]}</div>`;} else {sheetElementStr += `<div _na="${globalSheetList[i]}">${globalSheetList[i]}</div>`;}}// append 元素$(".sheetlist").append(sheetElementStr);// 添加样式与点击事件$(".sheetlist>div").each(function () {$(this).click(function () {$(".sheetlist>div").each(function () {$(this).removeClass('currentsheet')})$(this).addClass('currentsheet');showCellList($(this).text())})})
}/*** 渲染指定 sheet 的单元格数据* @param {*} sheetKey sheet 名*/
function showCellList(sheetKey) {currentsheet = sheetKey;let rowElementStr = '';// 拿到 sheet 的 rows 数据数组const currentSheetJson = jsonMap[sheetKey];const excelRowsData = currentSheetJson['rowsData'];const rowCount = currentSheetJson['rowCount'];// 第一层循环,渲染行数for (var j = 0; j < rowCount; j++) {rowElementStr += `<tr style="height: 38px;" ><td class="drug-ele-td" style="width: 48px; text-align: center;">${j + 1}</td>`;// 第二层循环,渲染列数,这里不确定有多少列,默认了 10 列for (var i = 0; i < 10; i++) {if (excelRowsData[j][i]) {rowElementStr += `<td style="width: 90px;">${excelRowsData[j][i]}</td>`;} else {rowElementStr += `<td style="width: 90px;"></td>`;}}rowElementStr += `</tr>`;}// 移除旧数据元素$("table tbody tr").not("#letter").remove()// 渲染新数据元素$("table tbody").append(rowElementStr);// 新增单元格的点击事件$("td").not('.drug-ele-td').each(function () {$(this).click(function () {// 新增属性,内容可编辑$(this).attr('contenteditable', "true");// 新增可编辑时的样式$(this).addClass('contenteditable', "true")})})
}/*** Excel sheet 内容转 json*/
function cast_current_sheet_to_jsonstr() {const obj = Object.create({});// 获取当前 sheet 全部行let rowTrList = $("table tbody tr").not("#letter");let rowCount = rowTrList.length;let totalRow = [];for (var i = 0; i < rowTrList.length; i++) {// 获取该行元素let colsList = $(rowTrList[i]).children();// 缓存该行每列的数据let rowData = [];for (var j = 1; j < colsList.length; j++) {let td = $(colsList[j]);var textValue = td.text();rowData.push(textValue);}totalRow.push(rowData);}obj.rowCount = rowCount;obj.rowsData = totalRow;return obj;
}/*** 把 Excel 转 json*/
function cast_excel_to_jsonstr() {const obj = Object.create({});obj.data = jsonMap;obj.sheetList = globalSheetList;// console.log(JSON.stringify(obj));return JSON.stringify(obj);
}
3、运行效果
npm start
可以看到,读取Excel、修改Excel后保存、下载Excel功能都正常。
4、踩坑记录
4.1、关于 wstring 与string
一开始是返回了 wstring 用于兼容中文问题,但是发现 Web 输出乱码,最后统一返回 string,才解决了这个乱码问题。
返回 string,
4.2、关于大数与日期类型解析
大数和日期都会被转成整型integer,溢出的大数会变成 1,日期时间则被转成float,
这两个问题都无解,除非全部都使用字符串格式的 Cell 单元格式,
4.3、关于 sheet 命名格式与行数
sheet 的名字与行数有一个奇怪的 bug,当 sheetname 包含下划线 _ 时,读取 1k 行左右的数据正常,而读取 1w 行左右的数据失败,最后将下划线去掉,则可以正常读取 1w 行的数据,
还有一点需要注意,写入数据时,行号必须以 1 开始,否则会报错,
4.4、补充:使用 json11
一开始不知道哪个序列化工具好用,走了很多弯路,最终觉得使用 json11,
使用 json11 库,官网 https://gitcode.net/mirrors/dropbox/json11?utm_source=csdn_github_accelerator,# 克隆代码
git clone https://gitcode.net/mirrors/dropbox/json11.git
使用示例,把 json11 两个文件复制到项目根目录,
添加到项目中,
测试代码,引用头文件、命名空间,
#include <iostream>
#include "json11.hpp"using namespace json11;
using namespace std;void test_json() {Json my_json = Json::object{{ "key1", "value1" },{ "key2", false },{ "key3", Json::array { 1, 2, 3 } },};std::string json_str = my_json.dump();cout << json_str << endl;
}int main() {test_json();return 0;
}
4.5、补充:格式化工具 fmt
# 参考
https://zhuanlan.zhihu.com/p/590654984?utm_id=0
https://github.com/fmtlib/fmt
https://fmt.dev/latest/index.html
https://hackingcpp.com/cpp/libs/fmt.html
# fmt 下载地址
https://github.com/fmtlib/fmt/releases/download/10.0.0/fmt-10.0.0.zip
https://github.com/fmtlib/fmt.git
5、不足与TODO
本人是 C++ 和 web 菜鸟,功能代码都基于简单原则实现,因此存在很多不足和需要改进的地方,
5.1、C++ 封装的各个函数还可以继续优化
5.2、使用 json11 库优化 json 对象返回字符
5.3、编译脚本优化
5.4、C++ 保存文件时,使用 uuid 生成文件名
5.5、Web 功能新增 行添加、行删除、简单函数
6、补充:使用 uuid
# 官网 https://www.boost.org/
# 下载后解压
tar -zxvf boost_1_82_0.tar.gz
使用示例,
// main.cc
#include <iostream>
#include <string>
#include <boost/uuid/uuid.hpp>
#include <boost/uuid/uuid_io.hpp>
#include <boost/uuid/uuid_generators.hpp>using namespace std;string Genuuid()
{boost::uuids::uuid a_uuid = boost::uuids::random_generator()();return boost::uuids::to_string(a_uuid);
}int main(){cout << Genuuid() << endl;
}
# build.sh
g++ -std=c++17 main.cc -I /home/sam/Downloads/boost_1_82_0/ -o gen_uuid
./gen_uuid
整合到 wasm-excel 项目中,
// main_web_excel.ccstring gen_uuid() {boost::uuids::uuid a_uuid = boost::uuids::random_generator()();return boost::uuids::to_string(a_uuid);
}string save_excel(string str) {MyExcel myExcel = MyExcel(gen_uuid() + ".xlsx");myExcel.create(); string save_filename = myExcel.save_json_to_excel(str);myExcel.close();return save_filename;
}
# build.sh
export SOURCE=./wasm_excelecho "Running Emscripten..."emcc -std=c++17 -Oz --bind ${SOURCE}/main_nodefs.cc ${SOURCE}/json11.cpp -s WASM=1 \
--shell-file ${SOURCE}/html_template/shell_minimal.html \
-s EXTRA_EXPORTED_RUNTIME_METHODS='[FS]' -s ASSERTIONS=1 \
-s INITIAL_MEMORY=268435456 -s ALLOW_MEMORY_GROWTH=1 \
-s STACK_OVERFLOW_CHECK=2 -s PTHREAD_POOL_SIZE_STRICT=2 \
-o ${SOURCE}/final.html -I${SOURCE}/mylib/include -L${SOURCE}/mylib/lib64 \
-I /home/sam/Downloads/boost_1_82_0/ \
-lOpenXLSX -lidbfs.jsecho "Finished Build"
测试效果,
可以看到,文件名使用的是 uuid 。
九、参考资料
1、编译 C/C++ 为 WebAssembly - WebAssembly | MDN
2、Main — Emscripten 3.1.44-git (dev) documentation
3、C++动态链接库(DLL)的创建和调用 - 知乎
4、GitHub - troldal/OpenXLSX: A C++ library for reading, writing, creating and modifying Microsoft Excel® (.xlsx) files.
5、Python安装报错:”ModuleNotFoundError:No module named _ctypes“ 的解决方案_六指黑侠i的博客-CSDN博客
6、Linux中gcc创建与使用静态库和动态库_gcc 指定静态库_on the moon的博客-CSDN博客
7、I want to… - WebAssembly
8、WebAssembly System Interface (WASI) | Node.js v20.5.0 Documentation
9、wasi - npm
10、【C++】使用WebAssembly在浏览器端操作Excel_wasm文件用什么打开_你的薄荷醇的博客-CSDN博客
11、webassembly网页无插件播放技术 - 知乎
12、Rust Wasm Linux开发环境搭建_centos安装rust_余衫马的博客-CSDN博客
13、mirrors / dropbox / json11 · GitCode
14、关于Emscripten | Emscripten
15、GitHub - fmtlib/fmt: A modern formatting library
16、Boost C++ Libraries