<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
故事要從我們公司的新官網說起,新官網是叫外包做的,前後端沒有分離,對,你沒聽錯,都到了 2023 年的今天,新專案依然是前後端混在一起,堆成一座屎山,然後通過模板渲染展示網頁。
當然,對於非研發的,技術棧咋樣都不重要,又不是不能用~
各位看官,聽到上面的情況,是不是隱隱約約感覺到會有啥驚喜(驚嚇)
哈,你來翻譯翻譯,什麼叫驚喜?好,那我來翻譯翻譯,驚喜(bushi)就是自從新官網上線後,PV(頁面存取量)下降了 50%。是的,你沒看錯,原因就是開啟官網巨卡,一般需要 7~8s。
就單單請求個 html,就需要耗費 7s+的時間。
運營那邊被老闆親切問候後,就跑過來找我們研發幫忙看問題,把情況說的特嚴重,唉,最終還不是得我們幫忙處理爛攤子
那沒辦法,我們就開始分析一通,啪的一下,很快呀,就找到了載入賊慢的原因:
那第二點自然是需要前端去搞了,圖片太多,導致 http 請求太多,那好辦,把小圖片轉 base64 不就好。 嗯,思路很簡單,如果是前後端分離的專案,我們一般無腦設定 webpack url-loader 的體積限制就好,或者設定 webpack5 的 asset,即在匯出一個 data URI 和傳送一個單獨的檔案之間自動選擇:
rules: [ { test: /.(png|jpe?g|svg|gif)$/, //webpack4 start use: [ { loader: 'url-loader', options: { limit: 10 * 1024 }, }, ], //webpack4 end // webapack5 start type:'asset/inline', parser: { dataUrlCondition: { maxSize: 10 * 1024, // 小於10k則轉為base64 }, }, // webapack5 end }, ],
很簡單對吧,但當你想快速 cv 以上設定的時候,發現,前端程式碼都是混在後端程式碼裡面,一堆 html 檔案,html 裡面又混雜著一堆的 Thymeleaf 語法(Thymeleaf 是一個跟 Velocity、FreeMarker 類似的模板引擎,它可以完全替代 JSP,JSP??都啥年代了)
越看越不對勁,正所謂理想很豐滿,現實很骨感,唉,只能長嘆一聲。
但沒辦法,領導可不管用啥方式,只要有個方法把 html 裡面圖片小於某個指定值,如 10k,那就轉 base64,讓這些小圖片不走 http 請求。
那麼,正常的路走不通(當然也有可能有其他更快捷的方式,只是比較趕,暫時想不到更好、更簡單的方式實現),那就另闢蹊徑。
全體流程如下:
1. mvn clean // marven 清空輸出目錄
2. mvn compile // marven編譯
3. 將所有 html 的的小圖片都轉 base64
4. mvn package // marven 打包
以上主要重點關注第3點,既然要將所有 html 的的小圖片都轉 base64,那麼自然而然可以通過寫個 node 指令碼來實現,大概可以分為以下幾個步驟:
上面的步驟應該比較清晰的,不過,等一下,最近 chatgpt 不是很火嗎,讓它來寫不就好~
首先判斷入口目錄的下的內容,是檔案的話就判斷是否以.html 結尾,是的話則放入 htmlFilePaths,是目錄的話則遞迴遍歷,那我們來問神奇的 chatgpt:
嗯,很不錯,第一次幾乎完美,順利拿到所有的 html 路徑
自然而然想到用正則匹配來做,所以我馬上問:
一看結果就不是我想要的,當然也是我描述的不清晰,導致 chatgpt 以為要獲取 html 檔案的圖片 src
應該問要獲取 html 字串的,所以我接著問:
// 定義匹配圖片標籤的正規表示式 var imgRegex = /<imgs+[^>]*src=["']([^"']*)["'][^>]*>/gi; // 要解析的HTML字串 var htmlString = '<img src="image1.jpg"> <img src="image2.jpg">'; // 遍歷所有匹配到的圖片標籤並獲取其src屬性 var matches; while ((matches = imgRegex.exec(htmlString)) !== null) { var src = matches[1]; console.log(src); }
執行後,得到的結果:
不錯不錯,再接再厲。
但 html 程式碼可能 img 被註釋了,如 <!-- <img src='xxx.jpg'> -->
,那麼我們實際上沒必要去轉換,故我們讓個讓其忽略註釋的:
那我們來試試,將其中註釋程式碼中插入 img,看看是否會解析:
// 定義匹配圖片標籤的正規表示式 var imgRegex = /<imgs+[^>]*src=["']([^"']*)["'][^>]*>/gi; // 定義匹配註釋的正規表示式 var commentRegex = /<!--[sS]*?-->/g; // 要解析的HTML字串 var htmlString = '<!-- <img src="image3.jpg"> --> <img src="image1.jpg"> <img src="image2.jpg">'; // 刪除所有註釋 htmlString = htmlString.replace(commentRegex, ''); // 遍歷所有匹配到的圖片標籤並獲取其src屬性 var matches; while ((matches = imgRegex.exec(htmlString)) !== null) { var src = matches[1]; console.log(src); }
可以看到被註釋掉的 image3 不會被匹配到
繼續繼續,但圖片 src 可能一開始就是 base64 了,就沒必要轉了,而 base64 是 data:image 開頭的,所以我們再讓它加下條件:
// 定義匹配圖片標籤的正規表示式 var imgRegex = /<imgs+[^>]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi; // 要解析的HTML字串 var htmlString = '<img src="image1.jpg"> <img src="data:image/png;base64,iVBORw0KG..."> <img src="image2.jpg"><!-- <img src="image3.jpg"> -->'; // 遍歷所有匹配到的不以 data:image 開頭的圖片標籤並獲取其src屬性 var matches; while ((matches = imgRegex.exec(htmlString)) !== null) { var src = matches[1]; console.log(src); }
我們執行看下結果
成功跳過了 base64 的,但是,好像沒有了忽略註釋程式碼的條件,啊這。。
所以我就讓他忽略註釋和 base64 的,但好像一直丟三落四,按下葫蘆浮起瓢,大家可以看看
上面的註釋的被匹配到了
註釋又又又被匹配到了,算了,我直接問如果忽略 base64,然後再組合忽略註釋的就好,組合後的程式碼如下:
const imgRegex = /<imgs+[^>]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi; // 定義匹配註釋的正規表示式 const commentRegex = /<!--[sS]*?-->/g // 刪除所有註釋 var htmlString = '<img src="image1.jpg"> <img src="data:image/png;base64,iVBORw0KG..."> <img src="image2.jpg"><!-- <img src="image3.jpg"> -->'; htmlString = htmlString.replace(commentRegex, '') // 遍歷所有匹配到的圖片標籤並獲取其src屬性 const imgSrcs = [] let matches; while ((matches = imgRegex.exec(htmlString)) !== null) { const src = matches[1]; imgSrcs.push(src) } console.log(imgSrcs)
還有個問題,img 的 src 可能是通過伺服器端渲染匯入的,那麼我們要忽略掉,大致語法為 <img th:src="${t.imgUrl1}" />
,也就是以 th:開頭的
// 定義匹配圖片標籤的正規表示式 var imgRegex = /<imgs+[^>]*src=["']((?!data:image|@{)(?!s*th:src)[^"']*)["'][^>]*>/gi; // 要解析的HTML字串 var htmlString = '<img src="image1.jpg"> <img src="@{some/url}"> <img src="data:image/png;base64,iVBORw0KG..."> <img src="image2.jpg" th:src="@{some/other/url}">'; // 遍歷所有匹配到的不以 data:image、@{ 和包含 th:src 的圖片標籤並獲取其src屬性 var matches; while ((matches = imgRegex.exec(htmlString)) !== null) { var src = matches[1]; console.log(src); }
上面的@{
可以忽略,實際上也是屬於 Thymeleaf 語法,遮蔽 th:src 即可
function getImgSrcInHtml(htmlString) { /** 定義匹配圖片標籤的正規表示式 * 1.src中不以data:image開頭,即不以base64開頭,沒必要再轉化了 * 2.不是th:src * 3.忽略註釋的程式碼 * */ const imgRegex = /<imgs+[^>th:]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi; // 定義匹配註釋的正規表示式 const commentRegex = /<!--[sS]*?-->/g // 刪除所有註釋 htmlString = htmlString.replace(commentRegex, '') // 遍歷所有匹配到的圖片標籤並獲取其src屬性 const imgSrcs = [] let matches; while ((matches = imgRegex.exec(htmlString)) !== null) { const src = matches[1]; imgSrcs.push(src) } return imgSrcs.filter(Boolean) }
執行下,看下結果:
自此,我們拿到所有 html 裡面的 src 了,那麼判斷下是否小於指定 size,是的話轉 base64
獲取檔案大小可通過 fs 的 statSync 來拿到對應檔案的 size,如下
/** 獲取檔案大小 */ function getFileSize(filePath) { const stat = fs.statSync(filePath) return stat.size }
如果滿足條件則將圖片轉 base64,而圖片本身是 Buffer,所以要轉一下:
/** 圖片轉成base64 */ function imageToBase64(filePath) { // 讀取圖片檔案 const imageBuffer = fs.readFileSync(filePath) const extname = getExtname(filePath) // 將圖片檔案轉換為 base64 編碼字串 const base64String = Buffer.from(imageBuffer).toString('base64') return `data:image/${extname.slice(1)};base64,${base64String}` }
通過加上字首data:image/${extname.slice(1)};base64,
,其中 extname 是檔案字尾名,通過path.extname
拿到:
/** 獲取字尾名 */ function getExtname(filePath) { return path.extname(filePath) }
每得到一個 base64,則替換原先的 src:
htmlString = htmlString.replace(src, imgBase64)
html 下滿足條件的 src 全部替換好後,就可以將新的 html 替換老的了,實際上也就是重寫回去:
writeFile(htmlPath, htmlString)
但我們發現整個過程中有兩處可以優化程式碼:
針對第一點,我們可以通過宣告一個 Set,存放大於指定尺寸的 src:
for (const src of imgSrcs) { /** 之前已經大於了,這次遇到就直接跳過即可 */ if (imgOverSizeSet.has(src)) continue let absoluteSrc = src // 如果不是相對路徑,那麼轉換為絕對路徑 if (!src.startsWith('.')) absoluteSrc = path.join(STATIC_PATH, src) // 不存在或者超出限制,則不替換 if (getFileSize(absoluteSrc) >= FILE_LIMIE_SIZE) { imgNotExistOrOverSizeSet.add(src) continue } }
針對第二點,我們可以通過宣告一個 Map,key 為 src,value 為 base64:
/** 存imgSrc -> 圖片base64 */ const imgSrc2Base64Map = new Map()
每次判斷到對應的 src 有值,則直接拿之前的 base64,不再轉化:
let imgBase64 = imgSrc2Base64Map.get(src) if (!imgBase64) { imgBase64 = imageToBase64(absoluteSrc) imgSrc2Base64Map.set(src, imgBase64) }
const fs = require('fs') const path = require('path') function resolve(relativePath) { return path.resolve(__dirname, relativePath) } /** 靜態資源路徑 */ const STATIC_PATH = resolve('xxx') /** html模板路徑 */ const TEMPLATE_PATH = resolve('yyy') /** 檔案大小限制 10K */ const FILE_LIMIE_SIZE = 1024 * 10 /** 圖片轉成base64 */ function imageToBase64(filePath) { // 讀取圖片檔案 const imageBuffer = fs.readFileSync(filePath) const extname = getExtname(filePath) // 將圖片檔案轉換為 base64 編碼字串 const base64String = Buffer.from(imageBuffer).toString('base64') return `data:image/${extname.slice(1)};base64,${base64String}` } /** 獲取檔案大小 */ function getFileSize(filePath) { const stat = fs.statSync(filePath) return stat.size } /** 獲取字尾名 */ function getExtname(filePath) { return path.extname(filePath) } /** 獲取所有html路徑 */ function getHtmlPaths(dir, filePaths = []) { const files = fs.readdirSync(dir); for (const file of files) { const filePath = path.join(dir, file); const fileStat = fs.statSync(filePath); if (fileStat.isDirectory()) { getHtmlPaths(filePath, filePaths); } else if (fileStat.isFile() && getExtname(filePath) === '.html') { filePaths.push(filePath); } } return filePaths; } function readFile(filePath) { return fs.readFileSync(filePath, 'utf-8') } function writeFile(filePath, source) { return fs.writeFileSync(filePath, source) } /** 獲取html中滿足規則的img src */ function getImgSrcInHtml(htmlString) { /** 定義匹配圖片標籤的正規表示式 * 1.src中不以data:image開頭,即不以base64開頭,沒必要再轉化了 * 2.不是th:src * 3.忽略註釋的程式碼 * */ const imgRegex = /<imgs+[^>th:]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi; // 定義匹配註釋的正規表示式 const commentRegex = /<!--[sS]*?-->/g // 刪除所有註釋 htmlString = htmlString.replace(commentRegex, '') // 遍歷所有匹配到的圖片標籤並獲取其src屬性 const imgSrcs = [] let matches; while ((matches = imgRegex.exec(htmlString)) !== null) { const src = matches[1]; imgSrcs.push(src) } return imgSrcs.filter(Boolean) } /** 主程式 */ function main() { const htmlPaths = getHtmlPaths(TEMPLATE_PATH) /** 存imgSrc -> 圖片base64 */ const imgSrc2Base64Map = new Map() /** 存不存在,或者超過指定大小的img */ const imgNotExistOrOverSizeSet = new Set() htmlPaths.forEach(htmlPath => { let htmlString = readFile(htmlPath) const imgSrcs = getImgSrcInHtml(htmlString) if (!imgSrcs.length) return for (const src of imgSrcs) { if (imgNotExistOrOverSizeSet.has(src)) continue let absoluteSrc = src // console.log(imgSrcs) // 如果不是相對路徑,那麼轉換為絕對路徑 if (!src.startsWith('.')) absoluteSrc = path.join(STATIC_PATH, src) const isExist = fs.existsSync(absoluteSrc) if (!isExist) console.log('not isExist', src) // 不存在或者超出限制,則不替換 if (!isExist || getFileSize(absoluteSrc) >= FILE_LIMIE_SIZE) { imgNotExistOrOverSizeSet.add(src) continue } let imgBase64 = imgSrc2Base64Map.get(src) if (!imgBase64) { imgBase64 = imageToBase64(absoluteSrc) imgSrc2Base64Map.set(src, imgBase64) } htmlString = htmlString.replace(src, imgBase64) } // 替換好後,寫回 writeFile(htmlPath, htmlString) }) } main()
因為太多的小圖片導致 http 請求阻塞,所以要把滿足條件的小圖片轉為 base64, 而前端的 html 混在在後端程式碼裡面,且裡面混雜著 Thymeleaf 模板語法,想通過 webpack 打包的方式看起來好像不行(至少目前不知道咋辦),所以退而求其之自己寫個指令碼來處理。
大致思路就是:
以上就是讓chatgpt將html中的圖片轉為base64方法範例的詳細內容,更多關於chatgpt html圖片轉base64的資料請關注it145.com其它相關文章!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45