關(guān)鍵詞:OCR;OCR-SDK;OCR-SDK開發(fā)包;OCR技術(shù)開發(fā)包;藏文識別;
OCR-SDK開發(fā)包這個詞一般只有行業(yè)內(nèi)的專業(yè)人士才知道、我在簡單介紹一下
開源的OCR SDK開發(fā)包識別率怎么樣?
有些公司在需要圖像OCR識別的技術(shù)時,希望能自有一套OCR識別技術(shù),首先想到的是尋找免費開源的OCR SDK開發(fā)包源碼來進(jìn)行集成引用,OCR技術(shù)開發(fā)小白們大多可以找到湊合能用的tesseract源碼,簡單的集成開發(fā)應(yīng)用之后,就沾沾自喜的認(rèn)為自己懂得ocr技術(shù)了,還會去忽悠公司領(lǐng)導(dǎo)說識別率非常高,非常好用;其實負(fù)責(zé)人如果認(rèn)真測試一下,會很快發(fā)現(xiàn)大量的識別錯誤不準(zhǔn)確的問題!
我們來了解一下tesseract究竟是怎么來的,過去惠普開發(fā)了tesseract的ocr識別引擎,但ocr這種高級算法需要的人才很少也很頂級,而HP并沒有可能把這個放在主業(yè)上來,開發(fā)技術(shù)能力有限,無法給客戶很好的提供服務(wù),反正也賣不出經(jīng)濟(jì)價值就當(dāng)贈送產(chǎn)品給客戶市場提供免費服務(wù),后來被google收購把tesseract開源了。google公司就是好啊,竟花錢買東西給大家開源使用!
其他商用的OCR技術(shù),是要靠OCR開發(fā)包盈利的,不會開源,比如文通OCR、漢王ocr,并且一直在持續(xù)優(yōu)化維護(hù)提高性能和識別率。這個開源的OCR開發(fā)包現(xiàn)如今已經(jīng)落后很多了,主要是因為沒有人對他去做專門的優(yōu)化和提升。沒有商業(yè)化的模式和利益,技術(shù)怎么可能向前不斷發(fā)展,技術(shù)發(fā)展是要靠人才的,而人才是非常昂貴的。
研問二:OCR-SDK開發(fā)包識別算法究難么?
接觸過一些ocr技術(shù)開發(fā)小白,說 : OCR開發(fā)包很早就開源了,現(xiàn)在誰還花錢買啊,當(dāng)然也有一些研究生學(xué)生畢業(yè)不久,比較謙虛的跟我聊天,說上大學(xué)的時候做過ocr方面的論文和開發(fā)項目,大概了解用過,開源的OCR SDK確實識別率無法達(dá)到應(yīng)用層級,這些學(xué)生反而很誠懇;
以文通科技的OCR SDK開發(fā)包技術(shù)為例,他們的技術(shù)來源于清華大學(xué)電子圖文工程系人工智能實驗室;為了實現(xiàn)產(chǎn)業(yè)轉(zhuǎn)化并能提供持續(xù)升級、優(yōu)化、完善、開發(fā)、維護(hù)的經(jīng)濟(jì)成本,已經(jīng)是國內(nèi)最頂尖的OCR算法開發(fā)的技術(shù)人員還是在不斷的學(xué)習(xí)、研究、討論各種場合下的、各種類型的、各種顏色的圖片文字OCR識別提取技術(shù)!包括場景文字OCR識別、長微博圖片OCR文字識別、視頻文字OCR識別等,都是國內(nèi)外獨一無二的新技術(shù);百度號稱要進(jìn)軍深度學(xué)習(xí)領(lǐng)域,還招聘了大量的高學(xué)歷人才來研究ocr技術(shù),來補(bǔ)缺深度學(xué)習(xí)技術(shù)的短處,現(xiàn)在還遠(yuǎn)遠(yuǎn)沒有趕上文通ocr的SDK開發(fā)包的技術(shù)。
研問三:OCR-SDK開發(fā)包可識別哪些語種?
大陸還是用中文簡體的OCR SDK開發(fā)包比較多,很多人不知道文通科公司開發(fā)維護(hù)的ocr-sdk開發(fā)包技術(shù),是支持簡繁體互換識別、中英混排識別、日文、韓文、英德法俄意大利文、藏文、維文識別的;漢王只有中文和英文識別,中英混排我沒用過,大家可以抽空下載試試看!
畢竟術(shù)業(yè)有專攻,社會及技術(shù)的不斷發(fā)展也是靠細(xì)致化的社會分工來不斷推進(jìn)的。你需要字符識別技術(shù),就還是根據(jù)自身情況坐下權(quán)衡取舍,免費開源or商業(yè)版本?