Analys av crawl-innehåll

En analys av nerladdat material från sex stycken crawlingar har gjorts. Detta för att se hur stor skillnaden är i megabyte (MB) och i procent på warcfiler respektive logg och crawl-rapporter i det totala paketet som Heritrix 2.02 skapar vid en crawling av en webbsida.

Ladda ner rapport

[http://www.ltu.se /cms_fs/1.85344!/file/Analys_av_warckatalog.pdf]

Sidansvarig: Lena Lindbäck

Publicerad: 14 november 2011

Redigerad: 14 november 2011

Luleå tekniska universitet