国产aV无码片毛片一级韩国,午夜草草视频在线播放,中国人妻少妇精品一区二区,在线视频播放一区二区三区,一区二区三区久久av,日韩人妻系列中文字幕,国产av综合av亚洲av,欧美多人啊啊啊啊污污视频,国产大鸡巴插女生b视频

教育裝備采購網(wǎng)
第八屆圖書館論壇 校體購2

檔案數(shù)字化過程中OCR技術(shù)發(fā)展歷程

教育裝備采購網(wǎng) 2016-12-23 13:44 圍觀897次

  OCR,即使用書刊掃描儀掃描文字.結(jié)果以圖片格式(.bmp)存入電腦.然后使用OCR識別系統(tǒng)進行轉(zhuǎn)換.最終用WORD進行修改編輯.

  下面教你如何使用ORC: OCR是英文Optical Character Recognition的縮寫.翻譯成中文就是通過光學(xué)技術(shù)對文字進行識別的意思. 是自動識別技術(shù)研究和應(yīng)用領(lǐng)域中的一個重要方面.它是一種能夠?qū)⑽淖肿詣幼R別錄入到電腦中的軟件技術(shù).是與書刊掃描儀配套的主要軟件.屬于非鍵盤輸入范疇.需要圖像輸入設(shè)備主要是書刊掃描儀相配合.現(xiàn)在OCR主要是指文字識別軟件.在1996年清華紫光開始搭配中文識別軟件之前.市場上的掃描儀和OCR軟件一直是分開銷售的。書刊掃描儀廠商現(xiàn)在已把專業(yè)的OCR軟件搭配自己生產(chǎn)的掃描儀出售.OCR技術(shù)的迅速發(fā)展與掃描儀的廣泛使用是密不可分的.近兩年隨著書刊掃描儀逐漸普及和OCR技術(shù)的日臻完善.OCR己成為絕大多數(shù)掃描儀用戶的得力助手.

  OCR技術(shù)的發(fā)展歷程

  自20世紀(jì)60年代初期出現(xiàn)第一代OCR產(chǎn)品開始.經(jīng)過30多年的不斷發(fā) 展改進.包括手寫體的各種OCR技術(shù)的研究取得了令人矚目的成果.人們對OCR產(chǎn)品的功能要求也從原來的單純注重識別率.發(fā)展到對整個OCR系統(tǒng)的識別速度.用戶界面的友好性.操作的簡便性.產(chǎn)品的穩(wěn)定性.適應(yīng)性.可靠性和易升級性.售前售后服務(wù)質(zhì)量等各方面提出更高的要求.

  IBM公司最早開發(fā)了OCR產(chǎn)品.1965年在紐約世界博覽會上展出了IBM公司的OCR產(chǎn)品--IBMl287.當(dāng)時的這款產(chǎn)品只能識別印刷體的數(shù)字.英文字母及部分符號.并且必須是指定的字體.20世紀(jì)60年代末.日立公司和富士通公司也分別研制出各自的OCR產(chǎn)品.全世界第一個實現(xiàn)手寫體郵政編碼識別的信函自動分揀系統(tǒng)是由日本東芝公司研制的.兩年后NEC公司也推出了同樣的系統(tǒng).到了1974年.信函的自動分揀率達到92%左右.并且廣泛地應(yīng)用在郵政系統(tǒng)中.發(fā)揮著較好的作用.1983年日本東芝公司發(fā)布了其識別印刷體日文漢字的OCR系統(tǒng)OCRV595.其識別速度為每秒70-100個漢字.識別率為99.5%.其后東芝公司又開始了手寫體日文漢字識別的研究工作.

  中國在OCR技術(shù)方面的研究工作相對起步較晚.在20世紀(jì)70年代才開始對數(shù)字.英文字母及符號的識別技術(shù)進行研究.20世紀(jì)70年代末開始進行漢字識別的研究.1986年.國家863計劃信息領(lǐng)域課題組織了清華大學(xué).北京信息工程學(xué)院.沈陽自動化所三家單位聯(lián)合進行中文OCR軟件的開發(fā)工作.清華大學(xué)率先推出了國內(nèi)第一套中文OCR軟件--清華文通TH-OCR1.0版.至此中文OCR正式從實驗室走向了市場.清華OCR印刷體漢字識別軟件其后又推出了TH-OCR 92高性能實用簡/繁體.多字體.多功能印刷漢字識別系統(tǒng).使印刷體漢字識別技術(shù)又取得重大進展.到1994年推出的TH-OCR 94高性能漢英混排印刷文本識別系統(tǒng).則被專家鑒定為[是國內(nèi)外首次推出的漢英混排印刷文本識別系統(tǒng).總體上居國際領(lǐng)先水平".上個世紀(jì)90年代中后期.清華大學(xué)電子工程系提出并進行了漢字識別綜合研究.使?jié)h字識別技術(shù)在印刷體文本.聯(lián)機手寫漢字識別.脫機手寫漢字識別和脫機手寫數(shù)字符號識別等領(lǐng)域全面地取得了重要成果.具有代表性的成果是TH-OCR 97綜合集成漢字識別系統(tǒng).它可以完成多文種(漢.英.日)印刷文本.聯(lián)機手寫漢字.脫機手寫漢字和手寫數(shù)字的識別輸入.幾年來.除清華文通TH-OCR外.其它如尚書SH-OCR等各具風(fēng)格的OCR軟件也相繼問世.中文OCR市場穩(wěn)步擴大.用戶遍布世界各地.

  可以說目前印刷體OCR的識別技術(shù)已經(jīng)達到較高水平.OCR產(chǎn)品已由早期的只能識別指定的印刷體數(shù)字.英文字母和部分符號.發(fā)展成為可以自動進行版面分析.表格識別.實現(xiàn)混合文字.多字體.多字號.橫豎混排識別的強大的計算機信息快速錄入工具.對印刷體漢字的識別率達到98%以上.即使對印刷質(zhì)量較差的文字其識別率也達到95%以上.可識別宋體.黑體.楷體.仿宋體等多種字體的簡.繁體.并且可以對多種字體.不同字號混合排版進行識別.對手寫體漢字的識別率達到70%以上.特別是我國的漢字OCR技術(shù)經(jīng)過十幾年的努力.克服了起步晚.漢字字符集異常龐大等困難.單字的識別速度(指在單位時間內(nèi)所完成的從特征提取到識別結(jié)果輸出的字數(shù))可以達到70字/秒以上.由于印刷體OCR漢字識別技術(shù)已經(jīng)比較成熟.所以O(shè)CR產(chǎn)品被廣泛地應(yīng)用在新聞.印刷.出版.圖書館.辦公自動化等各個行業(yè).

  專業(yè)型OCR產(chǎn)品多是面向特定的行業(yè).即適用于每天需處理大量表格信息錄入的部門.如郵政.稅務(wù).海關(guān).統(tǒng)計等等.這種面向特定行業(yè)的專業(yè)型OCR系統(tǒng).格式較為固定.識別的字符集相對較小.經(jīng)常與專用的輸入設(shè)備結(jié)合使用.因此具有速度快.效率高等特點.比如郵件自動分揀系統(tǒng)等.

  手寫文稿的識別直到1996.1997年才開始有產(chǎn)品問世.而且是作為印刷文稿識別產(chǎn)品的一項附加功能提供的.由于人寫字的習(xí)慣千差萬別.實現(xiàn)自由手寫體識別相當(dāng)困難.所以手寫體OCR技術(shù)的使用領(lǐng)域是聯(lián)機手寫體識別.即人一邊寫.計算機一邊識別.是一種實時識別方式.

  

  賽數(shù)A2高精度案卷掃描儀OS12002

  如果您需要將大幅面文獻、珍貴書籍、字畫、案卷和檔案數(shù)字化,OS12002產(chǎn)品家族能為您的需求提供最前瞻的解決方案。適用于高校、圖書館、檔案館、博物館、國土、測繪、機械、美術(shù)行業(yè)、印刷出版等等。

點擊進入北京市漢龍實業(yè)有限公司展臺查看更多 來源:教育裝備采購網(wǎng) 作者:北京市漢龍實業(yè)有限公司 責(zé)任編輯:黃磊 我要投稿
校體購終極頁

相關(guān)閱讀

  • 賽數(shù)掃描儀榮獲2021年現(xiàn)代圖書館白金獎

    賽數(shù)掃描儀榮獲2021年現(xiàn)代圖書館白金獎
    教育裝備采購網(wǎng)03-04
    2021年1月,美國圖書館領(lǐng)域選出了榮獲本年度現(xiàn)代圖書館大獎的產(chǎn)品和服務(wù)。賽數(shù)OSQ高精度大幅面掃描儀和賽數(shù)DSC全能影像采集系統(tǒng)榮獲本年度現(xiàn)代圖書館白...
  • 檔案行業(yè)光盤硬盤智能備份管理解決方案

    檔案行業(yè)光盤硬盤智能備份管理解決方案
    教育裝備采購網(wǎng)05-18
    近年來,隨著電子文件單套歸檔、單軌運行試點工作在上海自貿(mào)區(qū)、浙江省檔案局、國家開發(fā)銀行、青島啤酒股份有限公司等單位的不斷推廣實施,電子檔案的...
  • 利用數(shù)字化技術(shù)對珍貴檔案的復(fù)制與保護

    利用數(shù)字化技術(shù)對珍貴檔案的復(fù)制與保護
    教育裝備采購網(wǎng)04-24
    關(guān)于檔案的保護,特別是涉及具有重要社會價值與歷史價值的珍貴檔案,除了檔案原件修復(fù)之外,往往會提到數(shù)字化這種技術(shù)保護措施。社會信息化的深入發(fā)展...
  • 教育信息化浪潮方興未艾,學(xué)校圖書館功能不斷完善

    教育信息化浪潮方興未艾,學(xué)校圖書館功能不斷完善
    教育裝備采購網(wǎng)04-15
    圖書館作為學(xué)校的第二課堂,是獲取跨領(lǐng)域知識和信息的場所。讀者在圖書館翻閱圖書的同時,可以通過與歷史的對話,進一步了解當(dāng)下,面向未來。當(dāng)前,教...
  • 賽數(shù)zeta書刊掃描儀升級服務(wù):讓您的設(shè)備

    賽數(shù)zeta書刊掃描儀升級服務(wù):讓您的設(shè)備"變舊為新"
    教育裝備采購網(wǎng)04-07
    賽數(shù)公司已開始為zeta書刊掃描儀用戶提供極具性價比的升級服務(wù),包括全新的操作面板,觸摸屏大小差不多是原來的兩倍,并集成了Windows10操作系統(tǒng)。升級...
  • 賽數(shù)書刊掃描儀為圖書館數(shù)字化量身打造

    賽數(shù)書刊掃描儀為圖書館數(shù)字化量身打造
    教育裝備采購網(wǎng)09-04
    為什么說賽數(shù)b書刊掃描儀是高校圖書館書籍?dāng)?shù)字化必備神器?為圖書館書籍?dāng)?shù)字化量身打造?我覺得有以下五個理由,雖然說遠遠不止這5個理由.........第一...
  • 公共圖書館數(shù)字化必備神器了解一下
    教育裝備采購網(wǎng)05-16
    春日陽光明媚的午后,坐在寬敞明亮的圖書館里,在知識的海洋里肆意揮灑時光,這是多么美妙的一件事。現(xiàn)在網(wǎng)上讀書很普遍,但是我們國家電子書版權(quán)等法律糾紛比較多。公共圖書館加強數(shù)字資源建設(shè)...
  • "新生來襲"!! 賽數(shù)OS12002活力全開
    教育裝備采購網(wǎng)05-08
    當(dāng)談到書刊掃描儀,OS12002AdvancedPlus無疑像是一個全能性人才。它具備強大的功能,適合大規(guī)模數(shù)字化和scan-on-demand應(yīng)用,同樣也適合很多領(lǐng)域的數(shù)字化,是圖書館、檔案館和掃描服務(wù)機構(gòu)的最佳...

版權(quán)與免責(zé)聲明:

① 凡本網(wǎng)注明"來源:教育裝備采購網(wǎng)"的所有作品,版權(quán)均屬于教育裝備采購網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。已獲本網(wǎng)授權(quán)的作品,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:教育裝備采購網(wǎng)"。違者本網(wǎng)將追究相關(guān)法律責(zé)任。

② 本網(wǎng)凡注明"來源:XXX(非本網(wǎng))"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé),且不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、網(wǎng)站或個人從本網(wǎng)下載使用,必須保留本網(wǎng)注明的"稿件來源",并自負版權(quán)等法律責(zé)任。

③ 如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起兩周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

校體購產(chǎn)品