大家好!我是sum墨,一个一线的底层码农,平时喜欢研究和思考一些技术相关的问题并整理成文,限于本人水平,如果文章和代码有表述不当之处,还请不吝赐教。
以下是正文!
对象存储是什么?
对象存储是一种数据存储方式,它将数据分割成不同的对象,并为每个对象分配一个唯一的标识符,用于访问和操作数据。这些对象被存储在多个服务器上,以确保数据的可靠性和可用性。对象存储适合存储大量数据,具有可扩展性、低成本和高安全性等特点。
这段话太专业了,以至于有点让人看不懂。私以为对象存储就是『分布式文件存储系统』,可能是我们只会用它来存储图片、视频、文档等文件吧😅,然后数据库(比如MySQL)只存储文件的访问链接。目前接触的对象存储有
阿里云对象存储OSS、天翼云对象存储融合版、自建对象存储MinIO。
- 阿里云对象存储OSS
帮助文档链接
- 天翼云对象存储融合版
帮助文档链接
- MinIO对象存储
帮助文档链接
这三款对象存储产品对比如下
产品 | 功能特点 | 是否收费 | 是否开源 | 对接难易度 |
---|---|---|---|---|
阿里云对象存储OSS | 阿里云OSS提供了丰富的存储、数据处理和分发功能,可以满足各种场景的需求 | 收费 | 不开源 | 只需要ak/sk,然后看文档即可 |
天翼云对象存储融合版 | 天翼云对象存储融合版主要面向移动互联网应用,提供了数据管理、在线处理等功能 | 收费 | 不开源 | 只需要ak/sk,然后看文档即可 |
MinIO对象存储 | MinIO专注于提供高性能、高可用的对象存储服务。 | 免费 | 开源 | 只需要ak/sk,然后看文档即可 |
总之有钱的话就买服务,没钱就自己搭,总有合适自己的😉。
对象存储和数据库的区别
各维度对比
存储 | 数据结构 | 数据处理 | 存储方式 | 可伸缩性 |
---|---|---|---|---|
数据库存储 | 数据库是基于表格的存储方式,每个表格有特定的列和行。 | 数据库主要用于存储结构化数据,如文本、数字和日期等。数据库可以进行更复杂的数据处理,如查询、过滤和排序等。 | 数据库通常使用关系型数据库或NoSQL数据库等 | 数据库在扩展性上需要更多的运维和管理 |
对象存储 | 对象存储是基于对象的存储方式,每个对象可以是任何类型的文件 | 对象存储通常用于存储大量非结构化数据,如图片、视频和音频等 | 对象存储通常使用分布式存储技术将数据分散存储在不同的节点上 | 对象存储具有良好的扩展性,因此可以轻松地添加新的节点来处理更多的数据 |
项目对接流程图对比
CRUD之阿里云对象存储
1. 安装Java SDK
一般都是通过maven直接引入
<dependency><groupId>com.aliyun.oss</groupId><artifactId>aliyun-sdk-oss</artifactId><version>3.15.1</version>
</dependency>
2. 获取Client
官方获取Client代码示例
// yourEndpoint填写Bucket所在地域对应的Endpoint。以华东1(杭州)为例,Endpoint填写为https://oss-cn-hangzhou.aliyuncs.com。
String endpoint = "yourEndpoint";
// 阿里云账号AccessKey拥有所有API的访问权限,风险很高。强烈建议您创建并使用RAM用户进行API访问或日常运维,请登录RAM控制台创建RAM用户。
String accessKeyId = "yourAccessKeyId";
String accessKeySecret = "yourAccessKeySecret";// 创建OSSClient实例。
OSS ossClient = new OSSClientBuilder().build(endpoint, accessKeyId, accessKeySecret);// 关闭OSSClient。
ossClient.shutdown();
我一般会将其变成一个Component
@Component
public class AliyunOssClient {@Value("${oss.endpoint}")private String endpoint;@Value("${aliyun.accessKeyId}")private String accessKeyId;@Value("${aliyun.accessKeySecret}")private String accessKeySecret;@Bean(name = "aliyunOssClient")public OSS aliyunOssClient() {// 构建并返回OSSClientreturn new OSSClientBuilder().build(endpoint, accessKeyId, accessKeySecret);}
}
3. 增删改查操作
(1)对象公共读&上传和访问
官方文档
/*** 简单上传-流式上传-公共读** @param bucketName bucket名称* @param key 文件名* @param inputStream 输入流* @return PutObjectResult 上传结果*/
public static PutObjectResult putObjectByInputStreamAndPublicRead(String bucketName, String key,InputStream inputStream) {ObjectMetadata metadata = new ObjectMetadata();//设置StorageClass为Standard即为metadata.setHeader(OSSHeaders.OSS_STORAGE_CLASS, StorageClass.Standard.toString());//设置读写为公共读写metadata.setObjectAcl(CannedAccessControlList.PublicRead);// 准备OSS上传对象请求PutObjectRequest putObjectRequest = new PutObjectRequest(bucketName, key, inputStream);putObjectRequest.setMetadata(metadata);// 上传return ossClient.putObject(putObjectRequest);
}
当设置文件的访问权限为公共读时,直接拼接文件的访问链接就可以了,比如endpoint为oss-cn-hangzhou.aliyuncs.com,bucket为file-bucket,key为/test/file/1.png
那么访问链接就为:https://file-bucket.oss-cn-hangzhou.aliyuncs.com/test/file/1.png
(2)对象私有读&上传和访问
官方文档
/*** 简单上传-流式上传-私有读写** @param bucketName bucket名称* @param key 文件名* @param inputStream 输入流* @return PutObjectResult 上传结果*/public static PutObjectResult putObjectByInputStreamAndPrivate(String bucketName, String key,InputStream inputStream) {ObjectMetadata metadata = new ObjectMetadata();//设置StorageClass为Standard即为metadata.setHeader(OSSHeaders.OSS_STORAGE_CLASS, StorageClass.Standard.toString());//设置读写为公共读写metadata.setObjectAcl(CannedAccessControlList.Private);// 准备OSS上传对象请求PutObjectRequest putObjectRequest = new PutObjectRequest(bucketName, key, inputStream);putObjectRequest.setMetadata(metadata);// 上传return ossClient.putObject(putObjectRequest);}
当设置文件的访问权限为私有读时,直接拼接访问链接是没法访问该文件的,访问会报如下错误:
<Error>
<Code>AccessDenied</Code>
<Message>You do not have read permission on this object.</Message>
<RequestId>6488223453BCC63831BB3EC4</RequestId>
<HostId>file-bucket.oss-cn-hangzhou.aliyuncs.com</HostId>
<EC>0003-00000005</EC>
</Error>
这时就需要对key进行加签操作了,加签代码如下:
/*** 通过bucketName、key、过期时间生成文件访问链接(时效性)** @param bucketName bucket名称* @param key 文件名* @param expiration 过期时间* @return 文件访问链接*/public static String getSignObjectUrl(String bucketName, String key, Date expiration) {return ossClient.generatePresignedUrl(bucketName, key, expiration).toString();}
那么获取的链接格式就是这样了:https://file-bucket.oss-cn-hangzhou.aliyuncs.com/test/file/test.png?Expires=xxx&OSSAccessKeyId=xxxx&Signature=xxxx
(3)对象下载
官方文档
下载到文件
/*** 通过bucketName、key、文件路径 下载OSS文件到本地文件** @param bucketName bucket名称* @param key 文件名* @param pathName 本地文件路径*/public static void getObjectToFile(String bucketName, String key, String pathName) {// 下载OSS文件到本地ossClient.getObject(new GetObjectRequest(bucketName, key), new File(pathName));}
流式下载
/*** 通过bucketName、key 下载OSS变成字节流** @param bucketName bucket名称* @param key 文件名*/public static void getObjectToStream(String bucketName, String key) {OSSObject ossObject = null;BufferedReader reader = null;try {ossObject = ossClient.getObject(bucketName, key);reader = new BufferedReader(new InputStreamReader(ossObject.getObjectContent()));while (true) {String line = null;line = reader.readLine();if (line == null) { break; }System.out.println("\n" + line);}} catch (IOException e) {log.error("下载oss文件异常", e);} finally {try {// 数据读取完成后,获取的流必须关闭,否则会造成连接泄漏,导致请求无连接可用,程序无法正常工作。reader.close();// ossObject对象使用完毕后必须关闭,否则会造成连接泄漏,导致请求无连接可用,程序无法正常工作。ossObject.close();} catch (IOException e) {log.error("关闭流发生异常", e);}}}
(4)对象删除
官方文档
/*** 通过bucketName、key删除文件** @param bucketName bucket名称* @param key 文件名*/public static void delObject(String bucketName, String key) {// 删除文件或目录。如果要删除目录,目录必须为空。ossClient.deleteObject(bucketName, key);}
(5)图片处理
官方文档
这个接口目前只有阿里云有写文档,其他云都是一笔带过没有详细说明,作用是将上传到OSS的原始图片进行缩放、旋转、加水印等操作,非常好用,在此强烈安利一波!!!
- 将图片缩放为固定宽高100 px
// 将图片缩放为固定宽高100 px。
String style = "image/resize,m_fixed,w_100,h_100";
GetObjectRequest request = new GetObjectRequest(bucketName, objectName);
request.setProcess(style);
// 将处理后的图片命名为example-resize.jpg并保存到本地。
// 填写本地文件的完整路径,例如D:\\localpath\\example-resize.jpg。如果指定的本地文件存在会覆盖,不存在则新建。
// 如果未指定本地路径只填写了本地文件名称(例如example-resize.jpg),则文件默认保存到示例程序所属项目对应本地路径中。
ossClient.getObject(request, new File("D:\\localpath\\example-resize.jpg"));
- 从坐标(100,100)开始,将图片裁剪为宽高100 px
// 从坐标(100,100)开始,将图片裁剪为宽高100 px。
style = "image/crop,w_100,h_100,x_100,y_100";
request = new GetObjectRequest(bucketName, objectName);
request.setProcess(style);
// 将处理后的图片命名为example-crop.jpg并保存到本地。
ossClient.getObject(request, new File("D:\\localpath\\example-crop.jpg"));
- 将图片旋转90°
// 将图片旋转90°。
style = "image/rotate,90";
request = new GetObjectRequest(bucketName, objectName);
request.setProcess(style);
// 将处理后的图片命名为example-rotate.jpg并保存到本地。
ossClient.getObject(request, new File("D:\\localpath\\example-rotate.jpg"));
- 在图片中添加文字水印。
// 在图片中添加文字水印。
// 文字水印的文字内容经过Base64编码后,再将编码结果中的加号(+)替换成短划线(-),正斜线(/)替换成下划线(_)并去掉尾部的等号(=),从而得到水印字符串。
// 指定文字水印的文字内容为Hello World,文字内容进行编码处理后得到的水印字符串为SGVsbG8gV29ybGQ。
style = "image/watermark,text_SGVsbG8gV29ybGQ";
request = new GetObjectRequest(bucketName, objectName);
request.setProcess(style);
// 将处理后的图片命名为example-watermarktext.jpg并保存到本地。
ossClient.getObject(request, new File("D:\\localpath\\example-watermarktext.jpg"));
- 在图片中添加图片水印。请确保水印图片已保存在图片所在Bucket中
// 在图片中添加图片水印。请确保水印图片已保存在图片所在Bucket中。
// 水印图片的完整路径经过Base64编码后,再将编码结果中的加号(+)替换成短划线(-),正斜线(/)替换成下划线(_)并去掉尾部的等号(=),从而得到水印字符串。
// 指定水印图片的完整路径为panda.jpg,完整路径进行编码处理后得到的水印字符串为cGFuZGEuanBn。
style = "image/watermark,image_cGFuZGEuanBn";
request = new GetObjectRequest(bucketName, objectName);
request.setProcess(style);
// 将处理后的图片命名为example-watermarkimage.jpg并保存到本地。
ossClient.getObject(request, new File("D:\\localpath\\example-watermarkimage.jpg"));
除了这些之外还有很多其他的功能,大家可以自己看文档~
顺便说一个我们使用的案例
我们之前在开发项目的时候,做了个文章发布的功能,简单来说就是PC后台管理端发布文章,然后在微信小程序、H5小程序点击查看。文章的内容是包括图文的,有些文章图片上传的是原图,一张好几兆大小,用户在手机端查看文章时加载慢不说,那流量更是跑得飞起。我们就是用这个功能对图片进行等比例缩放,控制图片大小来解决的。
当时我们使用富文本框写的文章,这种文章会把图片、文字和dom元素混在一起,而且每张图片大小、分辨率都不同,这种情况下后端是没法对图片进行处理的,能处理图片的只有前端。为了解决这个问题,阿里云OSS提供了一个参数:
x-oss-process
。具体效果,我们直接看对比图:
从上图看,加了参数后,图片直接变小,但也模糊了。也就是说,图片根本不需要后端处理,前端自己拼接参数就可以处理图片了,非常的方便,而且原图链接也在前端,还可以做长按查看原图功能。
CRUD之天翼云对象存储
1. 安装Java SDK
同样都是通过maven直接引入,但是多了好几个依赖,毕竟不是自研的。
<!-- 天翼云 -->
<dependency><groupId>cn.chinatelecom</groupId><artifactId>oss-java-sdk</artifactId>
<version>2.0.3</version>
</dependency>
<dependency><groupId>com.amazonaws</groupId><artifactId>aws-java-sdk-s3</artifactId>
<version>1.11.336</version>
</dependency>
<!-- 使用sts服务需要添加以下依赖 -->
<dependency><groupId>com.amazonaws</groupId><artifactId>aws-java-sdk-sts</artifactId><version>1.11.336</version>
</dependency>
<dependency><groupId>joda-time</groupId><artifactId>joda-time</artifactId><version>2.10.3</version>
</dependency>
2. 获取Client
我还是将其变成一个Component
@Component
public class TianyiyunOssClient {@Value("${oss.endpoint}")private String endpoint;@Value("${tianyiyun.accessKeyId}")private String accessKeyId;@Value("${tianyiyun.accessKeySecret}")private String accessKeySecret;@Beanpublic AmazonS3 getOssClient() {BasicAWSCredentials credentials = new BasicAWSCredentials(accessKeyId, accessKeySecret);ClientConfiguration clientConfiguration = new ClientConfiguration();EndpointConfiguration endpointConfiguration = new EndpointConfiguration(endpoint, Regions.DEFAULT_REGION.getName());return AmazonS3ClientBuilder.standard()//客户端设置.withClientConfiguration(clientConfiguration)//凭证设置.withCredentials(new AWSStaticCredentialsProvider(credentials))//endpoint设置.withEndpointConfiguration(endpointConfiguration).build();}
}
3. 增删改查操作
(1)上传对象
官方文档
/*** 简单上传-流式上传-公共读** @param bucketName bucket名称* @param key 文件名* @param inputStream 输入流* @return PutObjectResult 上传结果*/public static PutObjectResult putObjectByInputStream(String bucketName, String key, InputStream inputStream) {ObjectMetadata metadata = new ObjectMetadata();metadata.setHeader(OSSHeaders.OSS_STORAGE_CLASS, StorageClass.Standard.toString());// 准备OSS上传对象请求PutObjectRequest putObjectRequest = new PutObjectRequest(bucketName, key, inputStream, metadata);putObjectRequest.setMetadata(metadata);//设置上传对象的Acl为公共读,私有写putObjectRequest.setCannedAcl(CannedAccessControlList.PublicRead);// 上传return tianyiyunOssClient.putObject(putObjectRequest);}
基本和阿里云一模一样,这里就不赘述怎么实现公共读和私有读了,核心就是设置setCannedAcl。
(2)获取对象访问链接
官方文档
/*** 生成预签名下载链接** @param bucketName bucket名称* @param key 文件名* @param expiration 过期时间* @return 文件访问链接*/public static String getObjectUrl(String bucketName, String key, Date expiration) {GeneratePresignedUrlRequest request = new GeneratePresignedUrlRequest(bucketName, key).withMethod(HttpMethod.GET).withExpiration(expiration);return tianyiyunOssClient.generatePresignedUrl(request).toString();}
这里稍微和阿里云不太一样,虽然GeneratePresignedUrlRequest也有setExpiration方法,但好像不生效,必须要使用上面这种形式才可以加签,奇怪🤔。
(3)删除对象
官方文档
/*** 通过bucketName、key删除文件** @param bucketName bucket名称* @param key 文件名*/public static void delObject(String bucketName, String key) {// 删除文件或目录。如果要删除目录,目录必须为空。tianyiyunOssClient.deleteObject(bucketName, key);}
(4)图片处理
官方文档
这里天翼云的文档没有详细说明,但我还是找到了天翼云对象存储是怎么处理图片的。同阿里云的x-oss-process
,天翼云的处理参数为x-amz-process
。用法也和阿里云的一样,直接把参数拼接在url后面即可。
try {GeneratePresignedUrlRequest request = new GeneratePresignedUrlRequest(bucketName, objectKey).withMethod(HttpMethod.GET).withExpiration(expiration);// 在URL中添加额外参数request.addRequestParameter("x-amz-limit", String.format("rate=%d", 100));request.addRequestParameter("x-amz-process", "image/watermark,text_12345678");URL url = s3.generatePresignedUrl(request);
} catch (AmazonServiceException e) {System.err.println(e.getErrorMessage());
}
CRUD之MinIO对象存储
1. 安装Java SDK
同上
<dependency><groupId>io.minio</groupId><artifactId>minio</artifactId><version>8.4.5</version></dependency>
2. 获取Client
同上,注册为Component
@Component
public class MinioOssClient {@Value("${minio.endpoint}")private String endpoint;@Value("${minio.accessKey}")private String accessKey;@Value("${minio.secretKey}")private String secretKey;/*** 注入minio 客户端** @return 客户端*/@Beanpublic MinioClient minioClient() {return MinioClient.builder().endpoint(endpoint).credentials(accessKey, secretKey).httpClient(getUnsafeOkHttpClient()).build();}private OkHttpClient getUnsafeOkHttpClient() {try {final TrustManager[] trustAllCerts = new TrustManager[] {new X509TrustManager() {@Overridepublic void checkClientTrusted(X509Certificate[] x509Certificates, String s) throwsCertificateException {}@Overridepublic void checkServerTrusted(X509Certificate[] x509Certificates, String s)throws CertificateException {}@Overridepublic X509Certificate[] getAcceptedIssuers() {return new X509Certificate[] {};}}};X509TrustManager x509TrustManager = (X509TrustManager)trustAllCerts[0];final SSLContext sslContext = SSLContext.getInstance("SSL");sslContext.init(null, trustAllCerts, new SecureRandom());final SSLSocketFactory sslSocketFactory = sslContext.getSocketFactory();OkHttpClient.Builder builder = new OkHttpClient.Builder();builder.sslSocketFactory(sslSocketFactory, x509TrustManager);builder.hostnameVerifier(new HostnameVerifier() {@Overridepublic boolean verify(String s, SSLSession sslSession) {return true;}});return builder.build();} catch (NoSuchAlgorithmException | KeyManagementException e) {throw new RuntimeException(e);}}}
这里多了一个方法getUnsafeOkHttpClient
方法,原因是MinIO是我们自建的,使用的https://ip:port的方式去调用,而不是域名方式。对接过这种地址的小伙伴都知道,如果不处理一下https的安全证书,调用的时候就会报错。该方法是为了解决SSL证书验证异常,即当请求的URL使用的是HTTPS协议时,如果证书无效或不被信任,会抛出SSLHandshakeException异常,通过自定义TrustManager和SSLSocketFactory来实现忽略证书的验证,从而避免SSL异常。
3. 增删改查操作
(1)上传对象
/*** 简单上传-流式上传** @param bucketName bucket名称* @param key 文件名* @param inputStream 输入流* @return ObjectWriteResponse 上传结果*/public static ObjectWriteResponse uploadInputStream(String bucketName, String key, InputStream inputStream)throws Exception {//设置权限Map<String, String> userMetadata = new HashMap<>();//设置为公有读userMetadata.put("access-control", "public-read");//设置为私有读// userMetadata.put("access-control", "private");// 准备OSS上传对象请求PutObjectArgs putObjectArgs = PutObjectArgs.builder()// bucketName.bucket(bucketName)// 文件名称.object(key)//设置文件权限.userMetadata(userMetadata).stream(inputStream, inputStream.available(), -1).build();// 上传文件return minioClient.putObject(putObjectArgs);}
(2)获取对象访问链接
/*** 获取文件地址** @param bucketName bucketName* @param key 文件名称* @param duration 过期时长* @param unit 过期时长单位* @return 文件地址*/public static String getObjectUrl(String bucketName, String fileName, int duration, TimeUnit unit)throws Exception {// 查看文件地址return minioClient.getPresignedObjectUrl(GetPresignedObjectUrlArgs.builder()// bucketName.bucket(bucketName)// 文件名称.object(fileName)// 过期参数.expiry(duration, unit)// 请求方式.method(Method.GET)// 构建参数.build());}
(3)删除对象
/*** 通过bucketName、key删除文件** @param bucketName bucket名称* @param key 文件名*/public static void delObject(String bucketName, String key) throws Exception {minioClient.removeObject(RemoveObjectArgs.builder().bucket(bucketName).object(key).build());}
(4)图片处理
很可惜,MinIO没有图片处理的功能。
总结一下
这三种对象存储工具都是我在真实项目中使用过的,它们的使用流程相似,接口名称也差不多,但是在一些细节上还是有些不同的地方。为了让大家更好地了解它们,我在文章中都有标明区别。阿里云和天翼云使用起来比较方便,只需要购买服务就可以了。而MinIO就比较麻烦,需要自己搭建一个服务器环境,并在生产环境中满足主备、证书等方面的要求,这也让我在使用过程中踩了不少坑。不过,我会在新的文章中详细介绍如何搭建MinIO服务器以及如何解决它的问题。