Tarea
La columna url contiene un enlace con utm_source, utm_medium y utm_campaign. La exportación necesita una columna para cada etiqueta.
Respuesta corta
Puedes extraer el valor eliminando partes de la cadena paso a paso. Para muchos enlaces, el método regex es más corto.
Cómo hacerlo en Eofferix con búsqueda y eliminación de subcadenas
- Crea la columna final
utm_sourcedesdeurl. - Añade una regla: Contiene subcadena
utm_source=— Eliminar antes. Después, la cadena empieza por el parámetro necesario. - Añade una regla: Contiene subcadena
utm_source=— Eliminar subcadenautm_source=. - Para quitar los parámetros siguientes, añade pares de reglas para
&y#: Eliminar después y luego Eliminar subcadena.
Sin regex, las reglas cortan todo antes de utm_source, eliminan el nombre del parámetro y cortan el final después del valor. - Repite el mismo patrón para
utm_mediumyutm_campaign, cambiando el nombre del parámetro.
Cómo hacerlo en Eofferix con expresiones regulares
- Para
utm_source, añade: Expresión regular(?<=utm_source=)[^&#]+, acción Eliminar todo excepto. (?<=utm_source=)significa “empezar justo después deutm_source=”.[^&#]+significa “tomar uno o más caracteres hasta encontrar&o#”.
La regex conserva solo el valor del parámetro utm_source. - Usa
(?<=utm_medium=)[^&#]+parautm_mediumy(?<=utm_campaign=)[^&#]+parautm_campaign.
Antes / Después
Antes
datos de origen| row_id | url |
|---|---|
| 1 | https://shop.example.com/product?utm_source=google&utm_medium=cpc&utm_campaign=spring_sale |
Después
resultado| row_id | utm_source | utm_medium | utm_campaign |
|---|---|---|---|
| 1 | cpc | spring_sale |