Transformations de tableau

Comment extraire le domaine d’une URL de site

2026-06-20
Objectif

Un tableau contient des URLs complètes. L’export doit avoir une colonne domain avec seulement le domaine, sans protocole, www., chemin, paramètres ni ancre.

Réponse courte

Vous pouvez le faire sans expressions régulières, avec la recherche et la suppression de sous-chaînes. Pour des URLs de formats variés, l’option regex est plus courte.

Comment le faire dans Eofferix avec recherche et suppression de sous-chaîne

  1. Créez la colonne finale domain depuis url.
  2. Dans Transformations, ajoutez les règles : Contient la sous-chaîne https://Supprimer la sous-chaîne https:// ; puis la même règle pour http://.
  3. Ajoutez une règle : Commence par www.Supprimer la sous-chaîne www..
  4. Pour enlever le chemin, les paramètres et l’ancre, utilisez des paires de règles pour /, ? et # : d’abord Supprimer après, puis Supprimer la sous-chaîne avec le même caractère.
    Règles pour obtenir le domaine en supprimant des sous-chaînes
    Sans regex : le protocole et www sont supprimés comme sous-chaînes ; le chemin et les paramètres sont coupés par séparateurs.
  5. Enregistrez les paramètres de la colonne.

Comment le faire dans Eofferix avec des expressions régulières

  1. Créez la colonne finale domain depuis url.
  2. Ajoutez ^https?://Supprimer la sous-chaîne. ^ signifie début de chaîne, https? signifie http ou https, et :// est la partie littérale du protocole.
  3. Ajoutez ^www\.Supprimer la sous-chaîne. Le point est échappé avec \., car un point simple en regex signifie n’importe quel caractère.
  4. Ajoutez [/?#].*$Supprimer la sous-chaîne. [/?#] trouve le premier séparateur de chemin, paramètres ou ancre ; .* prend tout ce qui suit ; $ signifie fin de chaîne.
    Règles regex pour extraire un domaine depuis une URL
    La version regex est plus courte : trois règles suppriment le protocole, www et tout ce qui suit le domaine.
  5. Enregistrez les paramètres de la colonne.

Avant / Après

Avant

données source
row_idurl
1https://www.shop.example.com/catalog/jackets?utm_source=feed

Après

résultat
row_iddomain
1shop.example.com

Traitez vos données plus vite avec Eofferix

Créez un compte gratuit pour automatiser catalogues et listes de prix selon vos règles.

S’inscrire