<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
背景:由於業務或是其他不描述的原因的問題導致原有儲存的資料發生變動,與現有資料有差別,但還是能勉強看明白資料內容。
要求:實現A表的名稱欄位和B表的名稱欄位要模糊匹配。
上圖:
假如A表長這樣:
B表長這樣:
然後我要想變成這樣:
簡單說就是在我關聯查詢兩表時,條件欄位的取值看起來不一樣,但是意思是一樣的,應該要把這種資料關聯起來。但是SQL裡面“=”兩邊又必須嚴格相同,所以現在怎麼辦呢?
可以採用類似於LIKE模糊查詢的辦法。
MySQL:
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE INSTR(a.`name`,b.newname)>0 OR INSTR(b.newname,a.`name`)>0
或者
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE a.`name` LIKE CONCAT('%',b.newname,'%') OR b.newname LIKE CONCAT('%',a.`name`,'%')
Oracle:
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE a.`name` LIKE '%'||b.newname||'%'
SQL Server:
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE a.`name` LIKE '%'+b.newname+'%' OR b.newname LIKE '%'+a.`name`+'%'
順便說一下這裡用到的字串拼接功能在三類資料庫中的寫法:
SQL Server:
SELECT '123'+'456'
Oracle:
SELECT '123'||'456' FROM dual 或 SELECT CONCAT('123','456') FROM dual
MySQL:
SELECT CONCAT('123','456')
Oracle和MySQL中雖然都有CONCAT,但是Oracle中只能拼接2個字串,所以建議用||的方式,MySQL中的CONCAT則可以拼接多個字串。
此外,MySQL中的INSTR(STR,SUBSTR)函數,在一個字串(STR)中搜尋指定的字元(SUBSTR),返回發現指定的字元的位置(INDEX)。
結論:在字串STR裡面,字串SUBSTR出現的第一個位置(INDEX),INDEX是從1開始計算,如果沒有找到就直接返回0,沒有返回負數的情況。
到這兒,有同學就會發現,你這應用場景也太單一了吧,要是這種:A表被關聯欄位值為“城鄉規劃”,B表被關聯欄位值為“城市規劃”;或者A表被關聯欄位值為“漂亮”,B表被關聯欄位值為“美麗”。這樣的兩個欄位值也是一個意思,但是用上面的方法就行不通了。
沒辦法了嘛?
有的。
你還可以使用NLP的演演算法來做上面最後提到的那種情況,關於這點,在我之前發表的文章《Word2Vec視覺化展示》中已有詳細說明,感興趣的同學可以研究研究。
另外就是,不管哪種辦法,總有漏網之魚,也就是總有你匹配不到的情況,或是匹配錯誤的情況。所以還需要根據自己的需求、業務以及資料情況,具體問題具體分析,結合各種方法開發程式碼實現自己想要的功能,做到因地制宜。
那有同學又問了,就沒有那種一招打天下的辦法了嗎?
有的。
你可以用你的最強大腦去手動處理~~~~~~~~~~
咳咳,我的意思是:就算要手動處理,我們也要減少手動處理的工作量嘛。要不“會急死人的”,真的“會急死人的”!
以上為個人經驗,希望能給大家一個參考,也希望大家多多支援it145.com。
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45