Objectif
La colonne url contient un lien avec utm_source, utm_medium et utm_campaign. L’export doit avoir une colonne pour chaque balise.
Réponse courte
Vous pouvez extraire la valeur en supprimant des parties de la chaîne étape par étape. Pour beaucoup de liens, l’option regex est plus courte.
Comment le faire dans Eofferix avec recherche et suppression de sous-chaîne
- Créez la colonne finale
utm_sourcedepuisurl. - Ajoutez une règle : Contient la sous-chaîne
utm_source=— Supprimer avant. Ensuite, la chaîne commence par le paramètre voulu. - Ajoutez une règle : Contient la sous-chaîne
utm_source=— Supprimer la sous-chaîneutm_source=. - Pour enlever les paramètres suivants, ajoutez des paires de règles pour
&et#: Supprimer après, puis Supprimer la sous-chaîne.
Sans regex, les règles coupent tout avant utm_source, suppriment le nom du paramètre et coupent la fin après la valeur. - Répétez le même modèle pour
utm_mediumetutm_campaign, en remplaçant le nom du paramètre.
Comment le faire dans Eofferix avec des expressions régulières
- Pour
utm_source, ajoutez : Expression régulière(?<=utm_source=)[^&#]+, action Tout supprimer sauf. (?<=utm_source=)signifie “commencer juste aprèsutm_source=”.[^&#]+signifie “prendre un ou plusieurs caractères jusqu’à&ou#”.
La regex conserve seulement la valeur du paramètre utm_source. - Utilisez
(?<=utm_medium=)[^&#]+pourutm_mediumet(?<=utm_campaign=)[^&#]+pourutm_campaign.
Avant / Après
Avant
données source| row_id | url |
|---|---|
| 1 | https://shop.example.com/product?utm_source=google&utm_medium=cpc&utm_campaign=spring_sale |
Après
résultat| row_id | utm_source | utm_medium | utm_campaign |
|---|---|---|---|
| 1 | cpc | spring_sale |