国产aV无码片毛片一级韩国,午夜草草视频在线播放,中国人妻少妇精品一区二区,在线视频播放一区二区三区,一区二区三区久久av,日韩人妻系列中文字幕,国产av综合av亚洲av,欧美多人啊啊啊啊污污视频,国产大鸡巴插女生b视频

教育裝備采購網(wǎng)
第八屆圖書館論壇 校體購2

信息技術在古籍數(shù)字化實踐中的應用

教育裝備采購網(wǎng) 2015-01-22 13:12 圍觀1152次

  古籍作為中華文化遺產(chǎn)的重要組成部分,具有廣泛的學術價值和研究價值。在網(wǎng)絡技術迅猛發(fā)展的今天,如何更好地利用古籍,更廣泛地發(fā)揮古籍的價值,是擺在古籍工作者面前的重要課題。信息技術的發(fā)展與完善,為這一課題的解決創(chuàng)造了條件,古籍數(shù)字化無疑是古籍開發(fā)利用的發(fā)展趨勢。古籍數(shù)字化問題實際上就是信息技術在古籍數(shù)字化實踐中的應用問題。

  一、掃描技術在古籍數(shù)字化實踐中的應用如何將紙質古籍轉換為數(shù)字古籍,是古籍數(shù)字化首要解決的問題。掃描技術的應用能夠使得傳統(tǒng)紙質古籍快速準確地轉換為數(shù)字資源。經(jīng)過多年的古籍數(shù)字化實踐,掃描技術是古籍大規(guī)模數(shù)字化應用的首要信息技術。

  1.掃描方式的選擇。掃描儀作為古籍掃描的重要設備,其種類繁多方式各異。根據(jù)其掃描方式的不同,主要有平板掃描儀、高速掃描儀以及面向上掃描儀等。那么哪種方式的掃描儀更加適合古籍資源的掃描呢?我們在實踐中發(fā)現(xiàn),由于古籍存儲時間較長,多數(shù)已經(jīng)出現(xiàn)了破損現(xiàn)象,屬于易脆、易碎、有皺褶、有裂痕資源。而且古籍的裝訂比較復雜,一旦拆裝難以復原。所以我們認為古籍的數(shù)字化不適合采用高速掃描儀進行拆裝掃描,只能采用面向上掃描儀或平板掃描儀。而面向上掃描儀和平板掃描儀二者對周圍環(huán)境的依賴不同,就使得使用這兩種掃描儀得到的圖像存在一定的差異。我們分析認為,主要是由于頁面向上掃描儀屬于非接觸式掃描,受周圍環(huán)境的影響較大,因此掃描得到的圖像文件占用空間較大,其顯示效果也較差。而平板掃描儀是接觸式掃描,對周圍環(huán)境要求不高,操作時書頁與掃描儀玻璃板緊密接觸,從而保證了掃描圖像的質量,同時也減少了文件的占用空間。

  那么如何選擇使用這兩類掃描儀呢?我們在古籍數(shù)字化實踐中,首先將古籍進行分類,對于那些中縫較小或不宜按壓的古籍文獻,采用頁面向上掃描儀,同時為避免由書頁弧度產(chǎn)生的掃描圖像變形現(xiàn)象,結合使用相應的圖像處理軟件。對于其他古籍,我們盡可能使用平板掃描儀,以便得到較高質量的圖像。隨著掃描技術的提高,近年來出現(xiàn)了零邊距平板掃描儀。由于零邊距掃描儀可以應對中縫更小的古籍資源,同時掃描時只需將古籍側貼掃描儀即可,對古籍起到了一定的保護作用,極大地擴大了平板掃描儀的掃描范圍,從而成為古籍掃描最佳的選擇。

  二、OCR技術在古籍數(shù)字化實踐中的應用

  OCR是一種計算機自動輸入技術。通過掃描得到的僅僅是古籍的圖像文件,無法實現(xiàn)檢索、編輯等功能。要實現(xiàn)這些功能以及古籍的大規(guī)模文本輸入,我們就必須將OCR技術應用到古籍數(shù)字化實踐中,也只有將古籍進行OCR識別,才可以進行深層次開發(fā)利用。

  1.如何有效提高古籍識別率。如何才能有效提高古籍的識別率呢?首先,利用圖像處理軟件對圖像文件進行亮度、對比度的調整。由于OCR的識別率很大程度上取決于圖像文件的亮度與對比度,而我們在掃描時,由于古籍的特殊性,往往要對其亮度與對比度進行調整,這些參數(shù)的調整可能對OCR識別造成一定的影響,為此在OCR識別之前,利用圖像處理軟件對這些參數(shù)進行適當?shù)恼{整,便可提高其識別率。其次,利用圖像處理軟件,根據(jù)字符大小對圖像文件的分辨率進行調整。由于掃描古籍時,為得到高質量的圖像文件,其DPI選擇往往較高,而在OCR識別時,其識別率主要是與字符大小有關,字符越大分辨率應越小,反之越大。第三,利用圖像處理軟件對圖像文件進行去污、糾偏處理。由于古籍往往存在污漬、印記等,掃描得到的圖像文件有較多噪點,極大地影響了OCR的識別。而且掃描古籍時不可避免地會造成圖像的傾斜,為此在OCR之前將圖像文件進行去污、糾偏處理,便可以大幅提高其OCR識別率。

  三、存儲技術在古籍數(shù)字化實踐中的應用

  從傳統(tǒng)的紙質古籍轉變?yōu)閿?shù)字古籍的那一刻起,數(shù)字資源的存儲與備份就開始了,并且伴隨數(shù)字資源的整個生存周期。與一般數(shù)字資源相比,古籍數(shù)字資源占用空間大,較大文件的傳輸,容易形成古籍數(shù)字化實踐中的瓶頸。因此,組建合理的存儲與備份系統(tǒng)十分重要,有效的存儲與備份系統(tǒng),不僅可以大幅提高數(shù)字化效率,也可提高數(shù)字資源的安全性。隨著RAID技術的應用,存儲設備在容量和傳輸速度上都有大幅提升,目前比較常用的有DAS、NAS和SAN系統(tǒng)。其中DAS系統(tǒng)比較適合古籍數(shù)字資源的存儲,NAS和SAN系統(tǒng)在古籍數(shù)字資源備份方面有一定的優(yōu)勢。近年來隨著USB傳輸速度的提高以及單盤容量的提升,使得USB方式成為備份古籍的新選擇。近年來,隨著存儲與傳輸技術的發(fā)展,存儲設備在性能提高的同時成本不斷降低。由于基于CIFS/NFS協(xié)議的NAS架構和基于ISCSI協(xié)議的IPSAN架構均可以減低存儲成本,但由于在傳輸性能方面,ISCSI協(xié)議明顯要優(yōu)于CIFS/NFS協(xié)議。所以我們在古籍數(shù)字化存儲中,逐漸用IPSAN取代NAS作為近線存儲服務器。

  總之,信息技術的發(fā)展與完善為古籍的數(shù)字化提供了重要的技術基礎,古籍的數(shù)字化是大幅度提高古籍利用率和使用范圍的有效方案,也是有效提升圖書館信息服務水平的物質基礎。隨著人們對數(shù)字化資源特別是數(shù)字化古籍需求的進一步擴大,古籍數(shù)字化必將成為保存、整理和利用古籍資源的趨勢[5]。當然,古籍數(shù)字化實踐中還存在諸多不足,但不能否認古籍數(shù)字化的數(shù)量和質量已經(jīng)有了大幅度的提高,古籍“藏”與“用”的矛盾也已逐步緩解。相信在不久的將來,隨著信息技術的進一步發(fā)展與完善,越來越多的信息技術將被應用到古籍數(shù)字化實踐中,古籍數(shù)字化也必將迎來欣欣向榮的時代。

來源:教育裝備采購網(wǎng) 我要投稿
校體購終極頁

版權與免責聲明:

① 凡本網(wǎng)注明"來源:教育裝備采購網(wǎng)"的所有作品,版權均屬于教育裝備采購網(wǎng),未經(jīng)本網(wǎng)授權不得轉載、摘編或利用其它方式使用。已獲本網(wǎng)授權的作品,應在授權范圍內使用,并注明"來源:教育裝備采購網(wǎng)"。違者本網(wǎng)將追究相關法律責任。

② 本網(wǎng)凡注明"來源:XXX(非本網(wǎng))"的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,且不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、網(wǎng)站或個人從本網(wǎng)下載使用,必須保留本網(wǎng)注明的"稿件來源",并自負版權等法律責任。

③ 如涉及作品內容、版權等問題,請在作品發(fā)表之日起兩周內與本網(wǎng)聯(lián)系,否則視為放棄相關權利。

校體購產(chǎn)品