ID.nl logo
WinHTTrack: lokaal websites bewaren!
© PXimport
Huis

WinHTTrack: lokaal websites bewaren!

Soms kom je unieke websites tegen met al even unieke informatie. Misschien al jarenlang niet meer onderhouden, zodat ze mogelijk op het punt van definitief verdwijnen staan. Jammer, want zo ben je de info ook kwijt. WinHTTrack biedt uitkomst: zo kun je lokaal websites bewaren!

Als je je bijvoorbeeld een beetje interesseert in historische documentatie van elektronica en (computer)hardware, loop je soms tegen een probleem aan. Tijdens je surftochten over het web kom je soms verdraaid interessante websites tegen. Alleen: soms zijn ze al vele jaren niet meer van updates voorzien. Verweesd dus. Blijkbaar betaalt iemand nog voor hosting van de site, of – nog onzekerder – is het een gebruikerssite van een of andere provider waar dan ook ter wereld. Feitelijk min of meer achterhaalde fenomenen die op het punt van verdwijnen staan. Daardoor kunnen schatten aan informatie verloren gaan. 

Denk aan bijvoorbeeld het debacle rondom Geocities. Toen het bedrijf daarachter de handdoek in de ring gooide, verdween daarmee een enorm deel aan vroege internetgeschiedenis. Het is zomaar een reden om een site te ‘redden’ en offline lokaal beschikbaar te maken direct vanaf je eigen pc (of NAS). Een andere reden kan zijn dat je in het vliegtuig of trein met beroerd internet gewoon een website vooraf wilt downloaden om offline eens rustig door te pluizen. 

Kan allemaal met HTTrack en de Windows-versie WinHTTRack. Je kunt de software downloaden vanaf https://www.httrack.com/page/2/en/index.html. Er zijn versies beschikbaar voor Windows, Linux en macOS. In dit artikel kijken we naar de Windows-versie. Vrees echter niet: het ziet er op alle besturingssystemen precies ’t zelfde uit. Waarbij geldt dat de app onder Linux & co draait via een lokale webserver – die alleen wordt gestart bij gebruik van de software – in je browser. De Windows-versie is een wat eenvoudig opgemaakt ‘echt’ programma.

Hou het netjes

Voordat we aan de slag gaan, is het wel zaak om even naar de fatsoensregels te kijken. Het is eigenlijk niet de bedoeling dat je in het wilde weg complete sites gaat downloaden. Degene die de website (wellicht nog) onderhoudt, betaalt namelijk hoogstwaarschijnlijk een maandelijks bedrag voor gemiddeld dataverkeer. Een site ‘leegtrekken’ kan daarop een aanslag vormen. Kortom: gebruik deze tool met beleid. Ook is het opletten wat de instellingen betreft, doe je dat niet helemaal oké dan loop je ’t risico zo ongeveer het complete internet te downloaden omdat er veel te veel externe links gevolgd gaan worden.

Project opzetten

Aan de slag. Als voorbeeld pakken we een van de alleroudste nog altijd in nagenoeg ongewijzigde vorm aanwezige website op het www: http://acme.com/. Ga nou niet ook precies die site downloaden, dat gaat de eigenaar niet leuk vinden. Is gewoon even een voorbeeldje! Start WinHTTrack, inmiddels te vinden in het menu Start. We gebruiken ACME even als voorbeeld omdat de uit 1991 stammende site grotendeels uit tekst bestaat en daarmee in z’n geheel lekker compact is, enkele Megabytes om precies te zijn (kom daar vandaag eens om…)

 Klik in het hoofdvenster van WinHTTRack op Volgende. Tik achter New project name (WinHTTrack is een beetje een mix van Nederlands en Engels) een naam voor het downloadproject in, in dit voorbeeld dus ACME. Standaard worden alle gedownloade sites bewaard in de map c:\My Web Sites; achter Base Path kun je hier een andere map opgeven. Bijvoorbeeld een share op je NAS.

©PXimport

Adres en op naar naar de opties

Klik weer op Volgende. Tik het webadres (URL) van de site in het grote witte vlak. Makkelijkst is uiteraard via Control-C de URL uit de adresbalk van je browser kopiëren en middels Control-V plakken. Ook kun je gebruik maken van de knop Add URL, maar dan zijn geen https-sites (alleen http) toe te voegen. Nu komen we bij het kloppend hart van (Win)HTTrack: klik op de knop Set options. De instellingen op de tabbladen Proxy, Scan Rules, Flow Control, Links, MIME types, Browser ID, Log, Index, Cache en Experts Only kun je in negen van de tien gevallen op de standaardinstellingen laten staan.

©PXimport

Limieten

Goed opletten wordt het op de tab Limits. Ten eerste kun je achter Maximum mirroring depth aangeven tot hoeveel niveau naar beneden links gevolgd mogen worden. Daarmee bedoelen we een link van homepage naar een achterliggende pagina (1), vanaf die pagina naar een daaronder liggende pagina (2), een link naar een daar weer onder liggende pagina (3) enzovoorts. Hoe dieper je gaat, hoe meer pagina’s er binnengehaald worden. Dat kan op complexe sites tientallen tot honderden Gigabytes aan data opleveren. Niet heel erg netjes en mogelijk lokaal uiteindelijk ook niet meer te behapstukken. 

Begin dus conservatief. Als later blijkt dat er essentiële pagina’s missen, kun je een project altijd opnieuw openen, de spiegeldiepte verhogen en de download opnieuw uitvoeren. In dat geval worden alléén de missende pagina’s binnengehaald. In dit voorbeeld – we weten dat het om een ultralichte site gaat – gaan we voor 5, en da’s best diep.

Extern op nul!

Zet vooral de Maximum external depth op 0. Doe je dat niet, dan worden ook off-site links gevolgd en voordat je ’t weet ben je dan ineens het halve internet aan ’t downloaden. Hou het bij alles wat bij de site hoort en laat externe pagina’s weg. De Max transfer rate (B/s) kun je anno 2021 met breedbandinternet van enkele honderden Mbps of meer downloadsnelheid wat ons betreft net zo goed op iets als 999999999 zetten, tenzij je de site niet wilt overbelasten met jouw downloadactie. Ook het veld leeg laten lijkt te werken, de maximale downloadsnelheid moet dan gehaald worden. Blijkt dat je daarmee voor urenlang je internetverbinding nagenoeg onbruikbaar maakt, dan moet je hier toch een remmende factor invoeren.

©PXimport

Build

Op de tab Build kun je eventueel de lokale opslagstructuur naar wens aanpassen. Standaard wordt de oorspronkelijke site-structuur aangehouden qua mappen en bestanden. Da’s meestal het meest praktisch, maar als je wat anders wilt dan is dit de plek om dat te regelen.

Robot-instructies volgen of niet?

Op de tab Spider moet je even kijken naar het selectiemenu achter Spider:. Laat je daar de standaardselectie follow robot.txt rules staan, dan is de kans groot dat de site of grote delen daarvan niet binnengehaald worden. Minder netjes (maar wel gegarandeerd werkend) is de optie no robots.txt rules. Maar goed: als je een site maar één keertje download… Je hebt het niet van ons!

Historische laatste instellingen

Klik op OK en Volgende. Nu zie je een historisch stukje software in de Windows-versie (niet terug te vinden in de Linux-variant: het selectiemenu onder Remote connect dat overduidelijk nog uit het tijdperk van telefoonmodems stamt. Kies hier simpelweg de optie Do not connect to a provider (already connected) en schakel de optie Disconnect when finished uit, eventueel ook de optie Shutdown PC when finished. Klik op Voltooien en de download begint. Bij grote sites kan dit een proces van uren of zelfs dagen zijn, zeker als de betreffende site de downloadsnelheid beperkt (wat bij modernere sites vaak het geval zal zijn). 

Na afloop kun je het logboek nog even doorlopen om te kijken of er belangrijke zaken gemist zijn. Klik je op de knop Browse Mirrored website, dan opent de site in je browser. Dat deze nu lokaal geladen wordt is overduidelijk te zien aan de opbouw van de URL in de adresbalk en de linkinfo (te zien als je je muis even boven een link houdt).

©PXimport

Klaar en offline browsen maar!

Wil je de site later openen, start dan de Verkenner en blader naar de genoemde map c:\My Web Sites (of een zelfgekozen alternatief). Dubbelklik op het bestand index.html en je ziet dat WinHTTrack een mooi menu heeft opgebouwd. Voor één gedownloade site niet zo heel interessant. Maar je raadt het al: als je meerder sites gaat binnenhalen en je gebruikt steeds dezelfde basismap, dan ontstaat vanzelf een handig ‘startmenu’.

▼ Volgende artikel
Waar voor je geld: 5 alles-in-één laserprinters voor een mooie prijs
© Tim Allen
Huis

Waar voor je geld: 5 alles-in-één laserprinters voor een mooie prijs

Bij ID.nl zijn we gek op producten waar je niet de hoofdprijs voor betaalt. Een paar keer per week speuren we daarom binnen een bepaald thema naar zulke deals. Een all-in-one-printer is een handig apparaat voor het scannen, kopiëren en printen van documenten en foto's. De allerbeste afdrukkwaliteit krijg je met een laserprinter. Wij vonden vijf betaalbare modellen voor je.

Een laserprinter maakt gebruik van toner in plaats van inkt om afdrukken te produceren. Toner is een fijn poeder dat met hoge temperaturen op het papier wordt gesmolten. Dit proces zorgt ervoor dat je met grote toners kunt printen, wat betekent dat je langere tijd kunt blijven afdrukken zonder de toner te hoeven vervangen. Laserprinters zijn vaak snel en efficiënt, waardoor ze uitstekend zijn voor gebruik op kantoor. Maar ook als je thuis veel print, bijvoorbeeld als zzp'er, kan een laserprinter uitkomst bieden.

HP Color Laser 179fnw

De HP Color Laser MFP 179fnw is een van de kleinste kleurenlaserprinters in zijn klasse en is daardoor ideaal voor thuisgebruik en plekken waar niet veel plek voor een printer is. Met functies zoals printen, scannen, kopiëren en zelfs nog faxen biedt deze 4-in-1 printer een hoop veelzijdigheid. De afdruksnelheid bedraagt tot 18 pagina's per minuut in zwart-wit en 4 ppm in kleur, met een resolutie van 600 x 600 dpi.

Dankzij de automatische documentinvoer (ADF) voor 40 pagina's en wifi-verbinding is deze printer gebruiksvriendelijk en multi-inzetbaar. Hoewel de afdruksnelheid lager ligt dan bij sommige concurrenten, is zijn compacte formaat juist een pluspunt.

Brother DCP 1610W

De Brother DCP-1610W is een compacte zwart-wit laserprinter die printen, kopiëren en scannen combineert. Met een afdruksnelheid van 20 pagina's per minuut en een resolutie van 2400 x 600 dpi levert hij haarscherpe resultaten. Dankzij wifi-connectiviteit kunnen meerdere gebruikers eenvoudig draadloos printen.

De papierlade biedt plaats aan 150 vellen en het apparaat is voorzien van anti-jam-technologie om papierstoringen tot een minimum te beperken. In vergelijking met de HP Color Laser MFP 179fnw biedt deze printer geen kleurafdrukken, maar hij is wel een stuk sneller met zijn afdrukken.

HP Laserjet Pro 2Z622

De HP LaserJet Pro 2Z622 is geschikt voor onder meer kantooromgevingen. Met afdruksnelheden tot 42 pagina's per minuut en functies zoals dubbelzijdig printen, scannen, kopiëren en faxen is dit een lekker veelzijdige 4-in-1-laserprinter. Het apparaat ondersteunt zowel bekabelde als draadloze netwerken en biedt geavanceerde beveiligingsfuncties.

Canon i-SENSYS MF272wd

De Canon i-SENSYS MF272dw is een monochrome laserprinter en drukt af met en snelheid van 29 pagina's per minuut. Met een resolutie van 2400 x 600 dpi levert hij snelle en scherpe resultaten. Dankzij automatische dubbelzijdige afdrukken, wifi- en ethernetverbinding is hij veelzijdig inzetbaar.

In vergelijking met de Brother DCP-1610W levert deze Canon i-SENSYS MF272dw snellere prestaties en meer connectiviteitsopties, hoewel hij geen kleurendruk ondersteunt; dan moet je toch echt bij de HP Color Laser MFP 179fnw zijn.

Xerox B225 A4

De Xerox B225 is een zwart-wit all-in-one-laserprinter die printen, kopiëren en scannen combineert. Met een afdruksnelheid van maar liefst 34 pagina's per minuut en een eerste afdruktijd van slechts 6,4 seconden is hij goed in te zetten als je veel en vaak print. De printer beschikt over automatische dubbelzijdige afdrukken, een papierlade voor 250 vellen en kan via wifi of een vaste netwerkverbinding met je thuisnetwerk worden verbonden.

▼ Volgende artikel
Garmin kondigt Instinct 3 - Tactical Edition aan
Gezond leven

Garmin kondigt Instinct 3 - Tactical Edition aan

Garmin heeft de Instinct 3 - Tactical Edition aangekondigd, een nieuwe serie tactische smartwatches die verkrijgbaar zijn met een AMOLED-scherm of een display op zonne-energie.

De smartwatches zijn volgens Garmin ontworpen voor gebruik in uitdagende omgevingen en voorzien van een met metaal versterkte rand voor extra duurzaamheid, een rucking-activiteit voor training en ingebouwde LED-verlichting op zowel de 45mm als 50mm modellen. De batterijduur van het AMOLED-model kan oplopen tot 24 dagen in smartwatchmodus, terwijl de modellen op zonne-energie onder ideale omstandigheden onbeperkt kunnen functioneren.

Robuust ontwerp

De Instinct 3 - Tactical Edition is voorzien van een stevige constructie met een metalen versterkte rand, een behuizing van met vezels versterkt polymeer en een krasbestendig scherm. De smartwatches zijn gebouwd volgens de MIL-STD 810 norm voor thermische en schokbestendigheid en zijn waterdicht tot 100 meter. De ingebouwde zaklamp biedt variabele lichtsterktes, een groene modus om het natuurlijke nachtzicht te behouden en een stroboscoopmodus voor locatiebepaling in moeilijk terrein. Voor nachtelijk gebruik is er een NVG-modus (Night Vision Goggle) die het scherm dimt tot een niveau dat functioneel blijft voor de gebruiker maar vrijwel onzichtbaar is voor anderen.

Uitgebreide functionaliteit

De Instinct 3 - Tactical Edition beschikt over diverse speciale functies, waaronder rucking-activiteit waarmee gebruikers het gewicht van hun bepakking kunnen invoeren voor beter inzicht in hun fysieke inspanning. Deze functie kan ook worden gebruikt bij activiteiten zoals trailrunning, wandelen en hiken. Alle modellen bevatten de Applied Ballistics solver en zijn compatibel met de Applied Ballistics Quantum app.

De smartwatches zijn verkrijgbaar in twee formaten: 45mm of 50mm met display op zonne-energie, en een 50mm-variant met AMOLED-scherm. De zonne-efficiëntie is verbeterd met een grotere, efficiëntere zonnelens. Vergeleken met het vorige model heeft het nieuwe 50mm model op zonne-energie een vijf keer langere batterijduur in GPS-modus bij opladen via zonlicht.

De smartwatch biedt multi-band GPS met SatIQ technologie voor nauwkeurige positiebepaling met geoptimaliseerde batterijduur. Voor gezondheidsmonitoring houdt de Instinct 3 stappen, hartslag, slaap, zuurstofsaturatie via de pols, hartslagvariabiliteit en meer bij.

Gebruikers ontvangen e-mails, sms'jes en meldingen direct op het horloge wanneer dit is gekoppeld met een compatibele Apple of Android smartphone.

Navigatie en veiligheid

Gebruikers kunnen navigeren met een 3-assig kompas, barometrische hoogtemeter en multi-band GPS. De Instinct 3 kan worden gekoppeld met de Garmin Explore App voor gedetailleerde kaarten, waypoints en routes.

Voor gebruik op gevoelige locaties biedt de Stealth Mode de mogelijkheid om draadloze communicatie uit te schakelen terwijl het horloge nog steeds activiteitsgegevens verzamelt zonder locatiegegevens op te slaan. De Kill Switch kan alle gebruikersgeheugen wissen als de veiligheid in het geding komt. Andere functies zijn weergave van twee posities tegelijkertijd op één scherm, Jumpmaster en geprojecteerde waypoints.

Trainingsfuncties

De Instinct 3 - Tactical Edition bevat sportapps voor rucken, wandelen, hardlopen, klimmen, jagen, skiën en meer. De TracBack-functie helpt bij het uitstippelen van een route terug naar het beginpunt. Naast buitensportapps bevat de smartwatch ook apps voor HIIT, cardio, hardlopen op binnen- en buitenbanen, basketbal en andere activiteiten.

Gebruikers kunnen trainingsplannen volgen met Garmin Coach voor hardlopen en fietsen, of workouts maken uit meer dan 1.600 oefeningen in de Garmin Connect app. De smartwatch volgt ook intensiteitsminuten, VO2 max en hersteltijd.

Veiligheidsfuncties zoals incidentdetectie en Assistance kunnen een bericht met de GPS-locatie van de gebruiker naar contactpersonen sturen in noodsituaties, wanneer het horloge gekoppeld is met een smartphone.

Beschikbaarheid en prijzen

Het Instinct 3 - Tactical Edition AMOLED-model is vanaf 30 april te bestellen op Garmin.com voor een adviesprijs van 599,99 euro. De modellen op zonne-energie beginnen bij een adviesprijs van 499,99 euro.

Bekijk andere Garmin-producten op Kieskeurig.nl: