首頁 > 軟體

SpringBoot 如何使用sharding jdbc進行分庫分表

2022-02-25 10:00:07

基於4.0版本,Springboot2.1

之前寫過一篇使用sharding-jdbc進行分庫分表的文章,不過當時的版本還比較早,現在已經不能用了。這一篇是基於最新版來寫的。

新版已經變成了shardingsphere了,https://shardingsphere.apache.org/

有點不同的是,這一篇,我們是採用多資料來源,僅對一個資料來源進行分表。也就是說在網上那些jpa多資料來源的設定,用sharding jdbc一樣能完成。

也就是說我們有兩個庫,一個庫是正常使用,另一個庫其中的一個表進行分表。

老套路,我們還是使用Springboot進行整合,

在pom裡確保有如下參照

<sharding-sphere.version>4.0.0-RC1</sharding-sphere.version>
<!-- 分庫分表-->
        <dependency>
            <groupId>org.apache.shardingsphere</groupId>
            <artifactId>sharding-jdbc-spring-boot-starter</artifactId>
            <version>${sharding-sphere.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.shardingsphere</groupId>
            <artifactId>sharding-core-common</artifactId>
            <version>${sharding-sphere.version}</version>
        </dependency>
        <!-- 分庫分表 end-->
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-data-jpa</artifactId>
        </dependency>
spring:
  application:
    name: t3cc
  profiles:
    active: sharding-databases-tables
#  datasource:
#    primary:
#        jdbc-url: jdbc:mysql://${MYSQL_HOST:localhost}:${MYSQL_PORT:3306}/${DB_NAME:dmp_t3cc}?useUnicode=true&characterEncoding=UTF8&serverTimezone=Hongkong
#        username: ${MYSQL_USER:root}
#        password: ${MYSQL_PASS:root}
#    secondary:
#        jdbc-url: jdbc:mysql://xxxxxxxxxxxxx/xxxxxx?useUnicode=true&characterEncoding=UTF8&serverTimezone=Hongkong
#        username: xxxxx
#        password: xxxxxxx
  jpa:
    database: mysql
    database-platform: org.hibernate.dialect.MySQL5InnoDBDialect  #不加這句則預設為myisam引擎
    hibernate:
      ddl-auto: none
      naming:
        physical-strategy: org.springframework.boot.orm.jpa.hibernate.SpringPhysicalNamingStrategy
    open-in-view: true
    properties:
        enable_lazy_load_no_trans: true
    show-sql: true

yml裡還是老套路,大家注意,我把之前的多資料來源的設定給註釋掉了,改成使用sharding來完成多資料來源。

裡面我profiles.active了另一個

sharding-databases-tables.yml

db:
  one: primary
  two: secondary
spring:
  shardingsphere:
    datasource:
      names: ${db.one},${db.two}
      primary:
        type: com.zaxxer.hikari.HikariDataSource
        jdbc-url: jdbc:mysql://${MYSQL_HOST:localhost}:${MYSQL_PORT:3306}/${DB_NAME:dmp_t3cc}?useUnicode=true&characterEncoding=UTF8&serverTimezone=Hongkong
        username: ${MYSQL_USER:root}
        password: ${MYSQL_USER:root}
        max-active: 16
      secondary:
        type: com.zaxxer.hikari.HikariDataSource
        jdbc-url: jdbc:mysql://xxxxxxx:3306/t3cc?useUnicode=true&characterEncoding=UTF8&serverTimezone=Hongkong
        username: xxx
        password: xxxxxx
        max-active: 16
    sharding:
      tables:
        pt_call_info:
           actual-data-nodes: ${db.one}.pt_call_info_$->{1..14}
           table-strategy:
              inline:
                sharding-column: today
                algorithm-expression: pt_call_info_$->{today}
           key-generator:
              column: id
              type: SNOWFLAKE
        pre_cc_project:
           actual-data-nodes: ${db.two}.pre_cc_project
        pre_cc_biztrack:
           actual-data-nodes: ${db.two}.pre_cc_biztrack

可以看到datasource裡,定義了2個資料來源,names=primary,secondary,這個名字隨便起。之後分別對每個資料來源設定了type、url等基本資訊。

在sharding裡,我針對要被分表的pt_call_info表做了設定,分為14個表pt_call_info_1到pt_call_info_14,分表的原則是根據today這個欄位,today為1就分到pt_call_info_1這個表。這也是我這個資料來源,唯一要做設定的表。

另外,secondary這個資料來源裡,也有兩個表,但我不想分表,只是當成普通的資料來源進行操作。所以,我只是單獨列出來他們的表名,並指定actual-data-nodes為第二個資料來源的表名。這裡是必須要列出來所有表的,無論是否需要分表,不然對錶操作時,會報錯找不到表。所以需要手工指定。

配完這個yml就ok了,別的什麼都不用配了。也不需要像之前的多資料來源時,像如下的設定都不用了。不需要指定model和repository的包位置什麼的。

當yml設定好後,就可以把兩個資料來源的model和Repository放在任意的包下,不影響。

無論是對哪個表進行分表,都還是正常定義這個entity就行了。譬如下面就是我用來分表的model,就是個普通的entity。

之後手工把表都建好

然後就可以像平時一樣操作這個model類了。

@RunWith(SpringRunner.class)
@SpringBootTest
public class T3ccApplicationTests {
    @Resource
    private ProjectManager projectManager;
    @Resource
    private PtCallInfoManager ptCallInfoManager;
 
    @Test
    public void contextLoads() {
        List<PreCcProject> preCcProjectList = projectManager.findAll();
        System.out.println(preCcProjectList.size());
        for (int i = 1; i <= 14; i++) {
            PtCallInfo ptCallInfo = new PtCallInfo();
            ptCallInfo.setId((Long) new SnowflakeShardingKeyGenerator().generateKey());
            ptCallInfo.setToday(i);
            ptCallInfoManager.add(ptCallInfo);
        } 
    } 
}

寫個測試程式碼

分別從第二個資料來源取值,從第一個資料來源插入值,檢視分表情況。

注意,id是使用特定的演演算法生成的,避免分表後的主鍵衝突。

執行後,可以看到分表成功。

需要注意一個坑

不要使用jpa的saveAll功能,在sharding-jdbc中,用單條去新增,如果你用了saveAll,則會失敗,插入錯誤的資料。

以上為個人經驗,希望能給大家一個參考,也希望大家多多支援it145.com。


IT145.com E-mail:sddin#qq.com