Duplicate content is niet goed voor je website. Het ontstaat wanneer meerdere en verschillende pagina’s van je website dezelfde content bevatten. Het is een van de meest voorkomende problemen van websites. Het houdt kortweg in dat er meerdere verschillende URL’s (grotendeels) dezelfde inhoud bevat.
Zoekmachines willen niet meerdere keren hetzelfde tonen in de zoekresultaten . Er wordt daarom simpelweg één URL gekozen en de andere URL’s verdwijnen. Het geeft namelijk voor zoekmachines alswel voor de gebruiker geen meerwaarde om pagina’s met dezelfde inhoud te indexeren. Dat betekent dat er linkwaarde verloren gaat. De niet getoonde URL’s verliezen hun waarde, terwijl deze gebruikt hadden kunnen worden om de URL die wel getoond wordt nog verder te stimuleren.
Het is een veelvoorkomend probleem. Denk bijvoorbeeld aan een boek wat je kunt vinden in de categorie Thrillers, maar ook in de categorie Nederlandstalig, op een dergelijk pagina zal dezelfde omschrijving van het boek staan. Of een printversie van een bepaalde pagina. Je zult de URL van deze printversie moeten voorzien van het attribuut no follow. Het attribuut no follow vertelt een zoekmachine dat hij de link niet hoeft te indexeren. Deze is eenvoudig in de html toe te passen door achter de desbetreffende link rel=”nofollow” te zetten (en even een handigheidje tussendoor, let er bij linkbuilding op dat je linkpartner dit attribuut niet meegeeft aan jouw link die op zijn website geplaatst wordt).Hieronder een voorbeeld van hoe een nofollow tag eruit komt te zien.
Ook zul je de URL van de printversie moeten opnemen in de robots.txt. Dit is een tekstbestand waarmee je zoekmachines laat weten welke pagina’s geindexeerd mogen worden en welke niet. Dit bestand moet je altijd in de rootmap van je website plaatsen, zodat deze altijd bereikbaar is. Hieronder zie je een voorbeeld van een robots.txt.
Als je niets zegt over een bepaalde directory, dan geef je standaard toegang aan deze directory. Als je besluit bepaalde delen van de website via de robots.txt uit te sluiten van indexatie, dan zul je alsnog aan alle links op desbetreffende pagina’s het attribuut no follow mee moeten geven. Doe je dit niet, dan ‘lekt’ er linkwaarde weg naar een pagina die niet geindexeerd zal worden. Zonde dus.
Een andere manier om duplicate content tegen te gaan is de canonical tag. Google introduceerde deze begin 2009. Een tag die je kunt toevoegen aan de html om de zoekmachine een indicatie te geven van hoe het zou moeten zijn. Je laat hiermee aan een zoekmachine weten wat de URL is van de pagina met de originele inhoud. Een canonical tag ziet er als volgt uit:
![]()
Zorg er altijd voor dat je deze code in het <head> gedeelte van de duplicate content pagina’s. In de canonical tag geef je aan wat de originele pagina is.
Kortom:
Probeer duplicate content altijd te vermijden. Lukt dit niet?
- Geef een attribuut no follow mee, en;
- neem de directories op in de robots.txt, en;
- zet je robots.txt altijd in de rootmap van je website, of;
- neem de canonical tag op in de <head> van de duplicate pagina’s
Door: Daniel de Gruijter

Meeste reacties