<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
最近大部分時間都在擼Python
,其中也會涉及到將資料庫錶轉換為Python
中ORM
框架的Model
,但我們並沒有找到一個合適的工具來做這個意義不大的”體力活“,所以每次新建表後大家都是根據自己的表結構手寫一遍Model
。
一兩張表還好,一旦 10 幾張表都要寫一遍時那痛苦只有自己知道;這時程式設計師的 slogan 再次印證:一切毫無意義的體力勞動終將被計算機取代。
既然沒有現成的工具那就自己寫一個吧,演示效果如下:
考慮到我們主要是用PyCharm
開發,正好jetbrains
也提供了SDK
用於開發外掛,所以UI
層面可以不用額外考慮了。
使用流程很簡單,只需要匯入DDL
語句就可以生成Python
所需要的Model
程式碼。
例如匯入以下 DDL:
CREATE TABLE `user` ( `id` int(11) NOT NULL AUTO_INCREMENT, `userName` varchar(20) DEFAULT NULL COMMENT '使用者名稱', `password` varchar(100) DEFAULT NULL COMMENT '密碼', `roleId` int(11) DEFAULT NULL COMMENT '角色ID', PRIMARY KEY (`id`), ) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8
便會生成對應的 Python 程式碼:
class User(db.Model): __tablename__ = 'user' id = db.Column(db.Integer, primary_key=True, autoincrement=True) userName = db.Column(db.String) # 使用者名稱 password = db.Column(db.String) # 密碼 roleId = db.Column(db.Integer) # 角色ID
仔細對比原始檔及目的碼會很容易找出規律,無非就是解析出表名、欄位、及欄位的屬性(是否為主鍵、型別、長度),最後再轉換為Python
所需要的模板即可。
在我動手之前我認為是非常簡單的,無非就是解析字串,但實際上手後發現不是那麼回事;主要是有以下幾個問題:
總結一句話,如何通過一系列規則識別出一段字串中的關鍵資訊,這同樣也是 MySQL Server 所做的事情。
在開始真正解析 DDL 之前,先來看下一段簡單的指令碼如何解析:
x = 20
按照我們平時開發的經驗,這條語句分為以下幾部分:
x
表示變數=
表示賦值符號20
表示賦值結果所以我們對這段指令碼的解析結果應當為:
VAR x
GE =
VAL 100
這個解析過程在編譯原理中稱為”詞法解析“,可能大家聽到編譯原理這幾個字就頭大(我也是);對於剛才那段指令碼我們可以編寫一個非常簡單的詞法解析器生成這樣的結果。
再開始之前先捋一下思路,可以看到上文的結果中通過VAR
表示變數、GE
表示賦值符號 ”=“、VAL
表示賦值結果,現在需要重點記住這三個狀態。
在依次讀取字元解析時,程式就是在這幾個狀態中來回切換,如下圖:
VAR
狀態。GE
狀態。同理,當不滿足這幾個狀態時候又會回到初始從而再次確認新的狀態。
光看圖有點抽象,直接來看核心程式碼:
public class Result{ public TokenType tokenType ; public StringBuilder text = new StringBuilder(); }
首先定義了一個結果類,收集最終的解析結果;其中的TokenType
就對應了圖中的三種狀態,簡單的用列舉值來表示。
public enum TokenType { INIT, VAR, GE, VAL }
首先對應到第一張圖:初始化狀態。
需要對當前解析的字元定義一個TokenType
:
和圖中描述的流程一致,判斷當前字元給定一個狀態即可。
接著對應到第二張圖:狀態之間的轉換。
會根據不同的狀態進入不同的case
,在不同的case
中判斷是否應當跳轉到其他狀態(進入INIT
狀態後會重新生成狀態)。
舉個例子:x = 20
:
首選會進入VAR
狀態,接著下一個字元為空格,自然在 38 行中重新進入初始狀態,導致再次確定下一個字元=
進入GE
狀態。
當指令碼為ab = 30
:
第一個字元為 a 也是進入VAR
狀態,第二個字元為 b,依然為字母,所以進入 36 行,狀態不會改變,同時將 b 這個字元追加進來;後續步驟就和上一個例子一致了。
多說無益,建議大家自己跑一下單測就會明白:
簡單的解析完成後來看看DDL
這樣的指令碼應當如何解析:
CREATE TABLE `user` ( `id` int(11) NOT NULL AUTO_INCREMENT, `userName` varchar(20) DEFAULT NULL COMMENT '使用者名稱', `password` varchar(100) DEFAULT NULL COMMENT '密碼', `roleId` int(11) DEFAULT NULL COMMENT '角色ID', PRIMARY KEY (`id`), ) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8
原理類似,首先還是要看出規律(也就是語法):
CREATE TABLE
開頭。)
結尾。根據我們需要解析的資料種類,我這裡定義了這個列舉:
然後在初始化型別時進行判斷賦值:
由於需要解析的資料不少,所以這裡的判斷條件自然也就多了。
針對於DDL
的語法規則,我們這裡還有需要有特殊處理的地方;比如解析具體欄位資訊時如何關聯起來?
舉個例子:
`userName` varchar(20) DEFAULT NULL COMMENT '使用者名稱', `password` varchar(100) DEFAULT NULL COMMENT '密碼',
這裡我們解析出來的資料得有一個對映關係:
所以我們只能一個欄位的全部資訊解析完成並且關聯好之後才能解析下一個欄位。
於是這裡我採用了遞迴的方式進行解析(不一定是最好的,歡迎大家提出更優的方案)。
} else if (value == '`' && pStatus == Status.BASE_INIT) { result.tokenType = DDLTokenType.FI; result.text.append(value); }
噹噹前字元為 ”`“ 符號時,將狀態置為 “FI”(FieldInfo),同時當解析到為 “,” 符號時便進入遞迴處理。
可以理解為將這一段字串單獨提取出來處理:
`userName` varchar(20) DEFAULT NULL COMMENT '使用者名稱',
接著再將這段字元遞迴呼叫當前方法再次進行解析,這時便按照欄位名稱、型別、長度、註釋的規則解析即可。
同時既然存在遞迴,還需要將子遞迴的資料關聯起來,所以我在返回結果中新增了一個pid
的欄位,這個也容易理解。
預設值為 0,一旦遞迴後便自增 +1,保證每次遞迴的資料都是唯一的。
用同樣的方法在解析主鍵時也是先將整個字串提取出來:
PRIMARY KEY (`id`)
只不過是 “P” 打頭 “)” 結尾。
} else if (value == 'P' && pStatus == Status.BASE_INIT) { result.tokenType = DDLTokenType.P_K; result.text.append(value); }
也是將整段字串遞迴解析,再遞迴的過程中進行狀態切換P_K ---> P_K_V
最終獲取到主鍵。
所以通過對剛才那段DDL
解析得到的結果如下:
這樣每個欄位也通過了pid
進行了區分關聯。
所以現在只需要對這個詞法解析器進行封裝,便可以提供一個簡單的API
來獲取表中的資料了。
到此整個詞法解析器的全部內容都已經完成了,雖然實現的是一個小功能,但我自己花的時間可不少,其中光復習編譯原理就讓人頭疼。
但這還只是整個編譯語言知識點的冰山一角,後續還有語法、語意、中間、目的碼等一系列內容,都是一個比一個難啃。
本文所有原始碼及外掛地址:
https://github.com/crossoverJie/sqlalchemy-transfer
以上就是java詞法分析器DDL遞迴應用詳解的詳細內容,更多關於java DDL遞迴詞法分析器的資料請關注it145.com其它相關文章!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45