网站的完整性采集和选择性采集

网站的完整性采集和选择性采集是目前比较常用的网络资源采集方式,它们各有优缺点,为了弥补其各自的不足,可以实现两种采集方式的优势互补,采用融合二者优点的混合型采集方式。

网站的完整性采集和选择性采集
网站的完整性采集和选择性采集

在对选定的政府网站中所有网页进行完整性采集的同时,通过人工干预的方式对网页内容进行甄别。

对其中有证据价值、历史价值、研究价值的重要网页,有选择性地进行深层次的频繁采集,这样既考虑到了政府网页采集面的广度,同时又照顾到了重要网页采集的深度。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注