首頁 > 軟體

Java 字串壓縮與解壓的開發記錄

2022-06-09 14:01:50

1、場景:

由於資料庫欄位長度有限,並且不能隨意的修改資料庫欄位的設定,資料庫的某個欄位設定的長度可能在設定初期是滿足需求的,後期由於業務變更或業務量增大導致該欄位儲存的資料增長,落庫時可能因為該欄位資料長度過長導致落庫失敗,基於這種場景我們就有必要進行字串的壓縮,然後再進行落庫,而落庫後取出資料使用時再進行解壓即可。

2、CompressUtil類:

使用Java8中的gzip來進行實現

import lombok.extern.slf4j.Slf4j;
import org.apache.commons.codec.binary.Base64;
import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.util.zip.GZIPInputStream;
import java.util.zip.GZIPOutputStream;
/**
 * 壓縮String的工具類
 */
@Slf4j
public class CompressUtil {
    /**
     * 使用gzip壓縮字串
     * @param str 要壓縮的字串
     * @return 壓縮後的字串
     */
    public static String compress(String str) {
        if (str == null || str.length() <= 0) {
            return str;
        }
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        try (GZIPOutputStream gzip = new GZIPOutputStream(out)) {
            gzip.write(str.getBytes(StandardCharsets.UTF_8));
        } catch (IOException e) {
            log.error("字串壓縮失敗str:{},錯誤資訊:{}", str, e.getMessage());
            throw new RuntimeException("字串壓縮失敗");
        }
        return Base64.encodeBase64String(out.toByteArray());
    }
    /**
     * 使用gzip解壓縮
     * @param compressedStr 壓縮字串
     * @return 解壓後的字串
     */
    public static String uncompress(String compressedStr) {
        if (compressedStr == null || compressedStr.length() <= 0) {
            return compressedStr;
        }
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        ByteArrayInputStream in;
        GZIPInputStream gzip = null;
        byte[] compressed;
        String decompressed;
        try {
            compressed = Base64.decodeBase64(compressedStr);
            in = new ByteArrayInputStream(compressed);
            gzip = new GZIPInputStream(in);
            byte[] buffer = new byte[1024];
            int offset;
            while ((offset = gzip.read(buffer)) != -1) {
                out.write(buffer, 0, offset);
            }
            decompressed = out.toString(StandardCharsets.UTF_8.name());
        } catch (IOException e) {
            log.error("字串解壓失敗compressedStr:{},錯誤資訊:{}", compressedStr, e.getMessage());
            throw new RuntimeException("字串解壓失敗");
        } finally {
            if (gzip != null) {
                try {
                    gzip.close();
                } catch (IOException ignored) {
                }
            }
            try {
                out.close();
            } catch (IOException ignored) {
            }
        }
        return decompressed;
    }
}

3、注意點:

1)CompressUtil在壓縮過程和解壓過程使用統一字元集,防止壓縮和解壓過程因為字元集不同導致結果與實際預期不符;

2)在web專案中,伺服器端將加密後的字串返回給前端,前端再通過ajax請求將加密字串傳送給伺服器端處理的時候,在http傳輸過程中會改變加密字串的內容,導致伺服器解壓壓縮字串發生異常;

而CompressUtil壓縮和解壓過程中使用Base64.encodeBase64String和Base64.decodeBase64進行編碼和解碼,可以完全解決上述問題。

3)壓縮/解壓失敗怎麼處理?
通過CompressUtil工具類可以看出,如果壓縮或解壓失敗,過程發生異常,則會丟擲一個執行時異常給呼叫方,方便呼叫方及時感知並處理;

具體如何處理要看具體的業務場景,我這邊是在MQ消費者中呼叫,在MQ中統一捕獲異常,所以如果壓縮失敗會進行重試,如果重試多次依然失敗,我這邊會進行報警列印紀錄檔,內部人會去處理。

4、單元測試:

import org.junit.Test;
public class CompressUtilTest {
    @Test
    public void test1() {
        StringBuilder stringBuilder = new StringBuilder();
        for(int i = 0;i < 100000;i++) {
            stringBuilder.append("1");
        }
        System.out.println(stringBuilder.toString().length());
        String compress = CompressUtil.compress(stringBuilder.toString());
        System.out.println("compress="+compress);
        System.out.println(compress.length());
        String uncompress = CompressUtil.uncompress(compress);
        System.out.println(uncompress.length());
        System.out.println("uncompress=" + uncompress);
    }
}

測試1:100000壓縮以後為180,解壓後也可以正常返回原字串

測試2:把壓縮字串長度改為1000再試一次,壓縮後長度為40

壓縮比例還是很高的,親測可用!!!

到此這篇關於Java 字串壓縮與解壓的開發記錄的文章就介紹到這了,更多相關Java 字串壓縮 解壓內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com