Как извлечь артикул и очистить его от лишних символов с помощью регулярного выражения

Как извлечь артикул из строки поставщика, сохранить буквы и разделители, привести код к верхнему регистру и не сломать SKU.

Артикул нельзя чистить так же, как телефон или штрихкод: в SKU часто важны буквы, дефисы, подчеркивания, точки и слэши. Регулярное выражение помогает оставить код товара и убрать подписи вроде Артикул:, SKU или комментарии поставщика.

Выражение можно выбрать из справочника по кнопке со звездочкой или написать вручную. Для артикулов ручной шаблон часто точнее, потому что у каждого поставщика может быть свой формат кода.

Пример: извлечь SKU и привести к верхнему регистру

В первом правиле используется условие регулярное выражение и действие удалить все, кроме. Второе правило приводит результат к верхнему регистру.

Настройки очистки артикула регулярным выражением и переводом в верхний регистр
Шаблон оставляет составной артикул с дефисом, подчеркиванием, точкой или слэшем.
БылоПравилаСтало
Артикул: ab-100/7[A-Za-z0-9]+(?:[-_./][A-Za-z0-9]+)+верхний регистрAB-100/7
код поставщика sku-55_blue[A-Za-z0-9]+(?:[-_./][A-Za-z0-9]+)+верхний регистрSKU-55_BLUE

Какие шаблоны использовать

СценарийШаблонЧто получится
Составной артикул с разделителями[A-Za-z0-9]+(?:[-_./][A-Za-z0-9]+)+Оставит AB-100/7 из строки с подписью.
Артикул только из букв, цифр, дефиса и подчеркивания^[A-Za-z0-9_-]+$Подходит для проверки уже очищенного значения.
Если артикул может быть без разделителей[A-Za-z0-9]{3,}Оставит простой код вроде ABC100.

Что важно помнить

  • Не используйте шаблон “только цифры” для артикула, если буквы являются частью кода.
  • Если в SKU важен нижний регистр, не добавляйте правило верхний регистр.
  • Для разных поставщиков лучше настроить отдельные правила, если форматы артикулов отличаются.