Tutorial

Guide complet pour la gestion du contenu en double dans Magento

Même si aucune page identique n'est créée dans Magento, le site de commerce électronique contiendra des pages avec un contenu en double.

Google ne comprend pas que toutes les URL Magento de produits en double, ou le contenu en double, ciblent la même page. Les utilisateurs verront la version la plus pertinente (selon Google) de l'URL de votre site Web, mais pas celle que vous préférez afficher.
Pour cette raison, vous risquez de perdre des visites de robot. Lorsque les robots Google découvrent un contenu en double, ils n'analysent pas votre nouveau contenu.
Pour mieux comprendre, essayez d'accéder à la console Webmaster Google pour afficher des alertes pour le contenu en double. Passez en revue les statistiques du robot d'exploration (balayage -> Statistiques d'analyse) pour voir combien de pages ont déjà été numérisées et indexées. Ensuite, comparez les statistiques avec le nombre de pages réel.

Si le nombre de pages numérisées et indexées est plusieurs fois supérieur au nombre réel, lisez la suite parce que vous avez probablement des problèmes avec le contenu en double.

Le contenu dupliqué le plus courant de Magento

Dans Magento, deux types de doublons, les pages partielles et les pages totales peuvent être vérifiés. Des duplications partielles se produisent lorsqu'une partie minimale du contenu ou de sa mise en page est unique, telle que des variantes du même produit. Le nombre total de doublons est atteint lorsque le contenu de deux pages ou plus est identique. L'exemple le plus courant de doublons complets dans Magento est le même produit dans différentes catégories.

Analysons plus en détail les doublons partiels:

1. Commande de produits

Une fonction très pratique, présente dans toutes les boutiques en ligne, est celle du tri. Les utilisateurs peuvent commander les produits du magasin en fonction du volume des ventes, du plus récent au prix, etc. En outre, les résultats d’une recherche peuvent être consultés dans les pages 10?, 20?, 50? Produits. Bien, mais ces options de tri créent des URL avec des caractères différents (?, =, |):

http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|desc
http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|asc
http://miosito.it/categoria/prodotto.htm?sortby=relevance|desc

Le problème se pose lorsque le classement des pages est indexé et même mis en cache par Google. Imaginez combien de pages peuvent exister! Des milliers! Et les crawlers de Google passent du temps à les indexer, tandis qu'ils peuvent concentrer leurs ressources sur l'indexation des pages les plus importantes de votre site: catégories, produits, etc.

1.2. Comment trouver les pages de commande de produits

Ouvrir une page de catégorieou dans un résultat de recherche, vous aurez une série de produits sur la grille ou la liste. À ce stade, vous pouvez les trier et voir les paramètres ajoutés à l'URL après le tri (par exemple, dir, sortby). Allez sur Google et recherchez le site: miodominio.com inurl: dir

Très probablement, vous verrez ceci:

Afin d'afficher les résultats les plus pertinents, certaines entrées très similaires au 9 déjà affiché ont été omises.
Si tu veux, tu peux répéter la recherche en incluant les résultats omis.

Cliquez simplement sur le lien pour inclure les résultats omis et vous verrez les pages de votre magasin contenant "dir" dans les URL. Ce n'est pas très agréable de voir ces pages indexées.

1.3. Comment supprimer le produit qui crée des doublons
1.3.1. Grâce aux outils Google pour les webmasters

Entrez dans Google Webmaster Tools, choisissez votre site de commerce électronique et dans le menu de gauche, sélectionnez Crawl -> URL Parameters. Ici, vous verrez les paramètres que Google a trouvés dans les URL de votre boutique et comment il les explore. "Laisser Googlebot décider" est la pré-optiondefinita.

Bulletin d'innovation
Ne manquez pas les nouvelles les plus importantes sur l'innovation. Inscrivez-vous pour les recevoir par email.

Mais lorsqu'il s'agit d'explorer votre boutique Magento, c'est vous, mais pas Google, qui décide quelles pages doivent être indexées, n'est-ce pas? Donc, si vous n'avez pas décidé avant, il est temps de le faire! Cliquez sur "Modifier", sélectionnez "Oui" dans le menu déroulant, puis "Aucune URL".

Vous pouvez également ajouter des paramètres qui ne figurent pas dans GWT et définir des options d'analyse pour Google. Mais soyez prudent et vérifiez deux fois (voire trois fois) avant de bloquer les URL contenant ces paramètres.

Vous devez être patient, car Google met longtemps à réindexer les URL avec les paramètres, une fois qu'ils ont été indexés. Si vous le souhaitez, vous pouvez également les supprimer manuellement de l'index via Index Google -> Suppression de l'URL.

1.3.2. REL = CANONICAL

Vous pouvez également choisir d'utiliser le paramètre CANONICAL pour trier les pages de votre magasin Magento. Cela les rendra accessibles aux utilisateurs, mais redirigera les robots d'exploration vers des pages sans paramètres.

Vous devez ajouter ce code aux pages de tri:

où URL Category est l'adresse de la même page de catégorie sans paramètres. Par exemple, les pages suivantes:

  • http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|desc
  • http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|asc
  • http://miosito.it/categoria/prodotto.htm?sortby=relevance|desc

devrait canoniser cette page

  • http://miosito.it/categoria/prodotto.htm

Guido Pratt

Spécialiste Magento

Bulletin d'innovation
Ne manquez pas les nouvelles les plus importantes sur l'innovation. Inscrivez-vous pour les recevoir par email.

Articles récents

Les avantages des pages à colorier pour les enfants - un monde de magie pour tous les âges

Développer la motricité fine grâce au coloriage prépare les enfants à des compétences plus complexes comme l’écriture. Colorier…

2 mai 2024

L’avenir est là : comment le secteur du transport maritime révolutionne l’économie mondiale

Le secteur naval est une véritable puissance économique mondiale, qui a navigué vers un marché de 150 milliards...

1 mai 2024

Les éditeurs et OpenAI signent des accords pour réguler les flux d'informations traitées par l'intelligence artificielle

Lundi dernier, le Financial Times a annoncé un accord avec OpenAI. FT autorise son journalisme de classe mondiale…

30 avril 2024

Paiements en ligne : voici comment les services de streaming vous font payer pour toujours

Des millions de personnes paient pour des services de streaming en payant des frais d’abonnement mensuels. Il est communément admis que vous…

29 avril 2024