網(wǎng)站建設(shè)定制采取適當(dāng)?shù)木W(wǎng)頁歸檔技術(shù)
- 編輯:admin -推送模式由政府或者第三方機(jī)構(gòu)主動將網(wǎng)站信息主動呈繳或捐贈到保存機(jī)構(gòu),這種主動的方式有助于深層網(wǎng)頁和數(shù)據(jù)庫資源等采集難度較大的資源也能夠安全、便捷地轉(zhuǎn)移到保存機(jī)構(gòu)。
采取適當(dāng)?shù)木W(wǎng)頁歸檔技術(shù)。目前主流的網(wǎng)頁歸檔技術(shù)包括推送和拉取兩種模式,兩種模式的采集主體不同,適用不同的網(wǎng)頁收集情況和要求。推送模式由政府或者第三方機(jī)構(gòu)主動將網(wǎng)站信息主動呈繳或捐贈到保存機(jī)構(gòu),這種主動的方式有助于深層網(wǎng)頁和數(shù)據(jù)庫資源等采集難度較大的資源也能夠安全、便捷地轉(zhuǎn)移到保存機(jī)構(gòu)。拉取模式則是由保存機(jī)構(gòu)使用特定軟件工具,將網(wǎng)站信息資源采集、下載并保存在本地服務(wù)器中。
采集方法又可進(jìn)一步劃分為四類:一是廣泛式采集,即采用收割軟件自動采集國家域名范圍內(nèi)或整個(gè)因特網(wǎng)的網(wǎng)頁及其他在線資源,能夠?qū)崿F(xiàn)大范圍、全面、快速采集,但采集質(zhì)量和時(shí)間難以把控;二是選擇性采集,即根據(jù)資源主題、內(nèi)容、價(jià)值等要素有選擇地采集部分網(wǎng)絡(luò)空間或特定資源,經(jīng)過選擇收集的資源內(nèi)容質(zhì)量相對較高,但目前以人工甄選為主,工作量較大且判斷會受個(gè)人主觀因素影響;三是專題性采集,一般針對具體的專題或事件進(jìn)行采集;四是復(fù)合式采集,即綜合利用以上多種采集方法,實(shí)現(xiàn)優(yōu)勢互補(bǔ),能夠在一定程度上同時(shí)滿足廣度與深度的要求。

因此,上述采集方式適用于不同的主體及其各異的資源收集需求,對資源廣度要求較高的采集活動可以選擇廣泛式采集;有特定工作開展或研究需求的主體通常需要在某一領(lǐng)域深度挖掘信息,因此可以在實(shí)施選擇性采集或?qū)n}采集;復(fù)合式采集則適用于掌握一定經(jīng)濟(jì)實(shí)力、技術(shù)基礎(chǔ)較好的大型組織機(jī)構(gòu),實(shí)施廣度采集的同時(shí),選擇重點(diǎn)領(lǐng)域或重要事件進(jìn)行深度采集,實(shí)現(xiàn)資源采集全面性與深入性相結(jié)合。
