<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
最近在做個表情包的小程式,涉及到表情包搜尋功能。我們上傳表情包的時候,只有一張圖,怎麼搜尋?這個時候我們想到就是將表情包的文字提取出來,作為搜尋的內容。那麼這就需要用到 ocr 技術了。
經過幾個 ocr 的庫的使用,小編強烈推薦使用 PaddleOCR,一款文字識別效果不輸於商用的Python庫!
對於 PaddleOCR 本文不會過多介紹,可自行搜尋。重點是如何使用 PaddleOCR 解決我的問題。
pip install paddlepaddle pip install paddleocr
我這邊安裝後的版本:
paddleocr==2.5.0.3 paddlepaddle==2.3.1
在 macOS 安裝後,專案執行報錯報錯,忘了截圖,應該是與 setuptools 版本有關,解決方式:
pip install --upgrade setuptools==59.8.0
完成這些設定後,我們就可以愉快的玩耍了。
import hashlib import io from PIL import Image from paddleocr import PaddleOCR def get_gif_pic_path(url): '''下載圖片,返回圖片第一幀路徑''' response = requests.get(url) filename = hashlib.md5(url.encode(encoding='utf-8')).hexdigest() img = Image.open(io.BytesIO(response.content)) current = img.tell() img_path = f'bqb/{filename}_{current}.png' img.save(img_path) return img_path def ocr_get_gif_text_sec(url) -> str: '''識別gif第一幀圖片的文字''' img_path = get_gif_pic_path(url) ocr = PaddleOCR(use_angle_cls=True, lang='ch') result = ocr.ocr(img_path, cls=True) data = [] for item in result: data.append(item[1][0]) return ",".join(data) ocr_get_gif_text_sec('https://xxxxxx')
由於 gif 是個動圖,所以我們需要取出圖片的第一幀進行識別,get_gif_pic_path
實現了這個功能。ocr_get_gif_text_sec
從 gif 第一幀的圖進行文字提取,返回的 result
是個陣列,我們通過遍歷進行提取出來。
提取 gif 圖片的內容我們就完成了,兩個函數的功能也比較簡單。本文沒做 gif 全部文字的提取,有興趣可以挑戰下。
當我們想在上傳圖片的時候,進行對圖片文字的處理怎麼辦?難道要將上傳的圖儲存到路徑再去識別麼?這也是我在開發中遇到的一個問題,經過拆坑,答案是:不,你不需要。
思路:我們可以從表單中獲取上傳的圖片的二進位制,然後將這個二進位制傳給ocr.ocr()
,那麼ocr.ocr()
支援這個型別麼?經過檢視此函數原始碼,我們可以讓它支援。
將圖片二進位制轉化為 nparray 型別即可。下面是這個過程的具體程式碼
from paddleocr import PaddleOCR import numpy as np import cv2 @app.route('/v1/upload_img', methods=['POST']) def api_v1_upload_img(): if 'file' not in request.files: return "no file part" file = request.files['file'] if file.filename == '': return "no selected file" if file: file_name = file.filename # 獲取圖片的二進位制 res = upload_image(bytes=file.read(), filename=file_name) return res else: return "no file" def upload_image(bytes, filename = None, mime_type = None): ocr = PaddleOCR(use_angle_cls=True, lang="ch") ## 核心步驟 np_arr = np.frombuffer(bytes, dtype=np.uint8) img = cv2.imdecode(np_arr, cv2.IMREAD_COLOR) # 進行識別 result = ocr.ocr(img=img, cls=True) ocr_result = [] for line in result: ocr_result.append(line[1][0].strip()) img_content = ' '.join(ocr_result) return img_content
在api_v1_upload_img
我們獲取到圖片二進位制以及圖片名,將這些作為引數傳到upload_image
,在upload_image
中:
np_arr = np.frombuffer(bytes, dtype=np.uint8) img = cv2.imdecode(np_arr, cv2.IMREAD_COLOR)
上面兩行程式碼是這個需求的核心突破點。
還有一點就是建議不要將此識別功能部署到效能差的機器上,並行一下,完全扛不住,默默的留下兩行眼淚。
以上就是PaddleOCR 識別表情包文字範例詳解的詳細內容,更多關於PaddleOCR識別表情包文字的資料請關注it145.com其它相關文章!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45