首頁 > 軟體

Mac使用者的福音:OCR新神器,一鍵轉換螢幕上的任意文字

2021-05-24 20:33:08

機器之心報道

編輯:杜偉

Mac 平臺上的 OCR 文字識別方法有很多,比如 iText、OCRKit 等。本文介紹的 macOCR 命令列應用程式使 Mac 使用者有了一個新選擇。

在機器學習和計算機視覺領域,光學字元識別(optical character recognition, OCR)長期以來都是人們研究的重要主題之一。OCR 很簡單,就是將文件照片或場景照片轉換為機器編碼的文字。

關於 OCR 的工具,機器之心此前也介紹過不少,如 2020 年頻頻登上 Github Trending 日榜月榜的開源項目 PaddleOCR,目前該項目已經獲得 12.6k star 量。此外還有曠視研究院與華中科大聯合研發的基於分割的場景文字識別方法 TextScanner,不僅可以正確讀取字元資料,還在一系列相關文字基準資料集上取得了當前最佳效能。

近日,GitHub 上又出現了一個非常火的 OCR 工具 macOCR,短短一天時間,就收穫了近800贊。macOCR 是一個開源命令列應用程式,使用者可以使用它將螢幕上的任何文字轉換為剪貼簿上的文字。

項目地址:https://github.com/schappim/macOCR

當你呼叫 ocr 命令時,一個類似於游標的「螢幕捕獲」(screen capture)就會出現。如此一來,邊框內的任何文字都將轉換為純文字。

項目作者提供瞭如下動圖展示,將圖片文字轉換為了文字。

對於 macOCR 命令列應用程式,網友給予了高度評價。網友 @mromanuk 表示:「我很沮喪的是,一直以來沒有簡單的方法來提取 Mac 圖片中的文字。現在 macOCR 彌補了這一空白!這一功能應該在 MacOS 中整合或隨時可用。」

安裝使用

使用者使用的作業系統需要是 macOS Catalina 及以上版本。

使用者可以選擇編譯以下 repo 中的程式碼,或者下載預先構建的二進位制(分為蘋果 Silicon 處理器和英特爾處理器)並放在自己的路徑中。

蘋果 Silicon 處理器安裝程式碼:

curl -O https://files.littlebird.com.au/ocr.zip;unzip ocr.zip;sudo cp ocr /usr/local/bin;

英特爾處理器安裝程式碼:

curl -O https://files.littlebird.com.au/ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;unzip ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;sudo cp ocr /usr/local/bin;當首次運行 macOCR app 時,使用者可能需要「允許該 app 訪問你的螢幕」,示意圖如下:

項目作者

macOCR 的創建者是 Marcus Schappi,現為 Chick Global 的 CEO 和聯合創始人。他還曾是 Little Bird Electronics 和 Geek Ammo 等其他其他幾家公司的聯合創始人。

Schappi 曾在澳大利亞巴克學院、悉尼科技大學以及悉尼大學就讀。其中,在攻讀悉尼科技大學工程創新、機電一體化及創業學士學位期間,他沒有獲得該學位。但由於其創建的海嘯預警軟體吸引了媒體的廣泛關注,他最終被悉尼大學研究生項目錄取,攻讀設計科學碩士(設計計算及計算)。

Schappi 在軟體開發、移動應用以及 IOS 開發等方面具有嫻熟的技能。

目前,他的 GitHub 主頁上有多個項目,比如 macOCR、kod-website、dropcam 等。


IT145.com E-mail:sddin#qq.com