Expressões regulares

Expressões regulares podem ser usadas ao definir objetivos como Visualização de página, Objetivo multietapas, Evento JavaScript, assim como em segmentação baseada em condições envolvendo URLs (por exemplo, origens de tráfego).

Observação

Ao configurar um objetivo "evento JavaScript", a expressão regular deve conter apenas o valor do identificador (sem qualquer domínio ou protocolo do site).

Exemplo

Caso queira rastrear o clique em algum botão específico com a ID que contém button ou buy, você pode especificar a seguinte condição: button|buy.

A expressão é processada de acordo com a sintaxe RE2 e as seguintes regras:

  • A expressão regular se aplica à URL completa da página, incluindo protocolo e domínio. Por exemplo, você pode usar a expressão regular: ^http://.

  • A expressão regular se aplica duas vezes: primeiro à URL original e depois à URL com e sem o prefixo www. Isso significa que os resultados não dependem de o prefixo www estar incluído no domínio.

  • A expressão regular se aplica à URL decodificada, em que os códigos de escape da URL (sequências com %) são substituídas por caracteres decodificados (exceção: códigos de caractere relativos a /, &, =, ?, # não são substituídos; por exemplo, %2F não será substituído por /). Vale lembrar que o sinal de mais (+) é substituído por um espaço durante a decodificação. Por exemplo, a expressão regular text=elephant será processada, mas text=%D1%81%D0%BB%D0%BE%D0%BD e text=%\w\w não serão.

  • Não se aplica Punycode a URLs em cirílico. Por exemplo, a expressão regular ^http://ввв\.сайт\.рф/ será processada, mas ^http://xn--b1aaa\.xn--80aswg\.xn--p1ai/ não será.

  • Antes de checar expressões regulares, símbolos como ?, #, &, e pontos (.) são removidos do final da URL. Por exemplo, as URLs http://exemplo.com.br/?, http://exemplo.com.br/# e http://exemplo.com.br/?var=1&, serão comparadas com http://exemplo.com.br/, http://exemplo.com.br/ e http://exemplo.com.br/?var=1, respectivamente. Se o usuário inserir a URL http://exemplo.com.br./, a expressão regular \./$ não será processada.

  • Os quantificadores corresponderão à string mais longa possível na verificação de expressões regulares.

  • Os caracteres nas URLs são sensíveis a maiúsculas e minúsculas.

Instruções sobre expressões regulares

Na tabela abaixo, a, b, c, d e e são caracteres quaisquer, e n e m são números inteiros positivos.

Variantes alternativas

abc|de

Corresponde a uma das variantes: abc ou de.

Classes de caracteres

[abc] ou [a-c]

Corresponde a qualquer caractere entre os listados (ou dentro do intervalo especificado).

[^abc] ou [^a-c]

Corresponde a qualquer caractere, exceto os listados (ou fora do intervalo especificado).

\d

Corresponde a um dígito. Equivalente a [0-9].

\D

Corresponde a um não-dígito. Equivalente a [^0-9].

\s

Corresponde a um espaço. Equivalente a [\t\n\f\r ].

\S

Corresponde a qualquer caractere que não seja um espaço. Equivalente a [^\t\n\f\r ].

\pL

Corresponde a qualquer caractere Unicode

\w

Corresponde a uma letra latina maiúscula ou minúscula, número ou sublinhado.

Ao trabalhar com caracteres Unicode, use a classe \pL em vez de \w.

\W

Corresponde a qualquer caractere que não seja uma letra latina maiúscula ou minúscula, número ou sublinhado.

Ao trabalhar com caracteres Unicode, use a classe \pL em vez de \w.

Número de ocorrências (quantificadores)

a*

Corresponde ao caractere a repetido 0 ou mais vezes (a mais longa das sequências possíveis será selecionada).

a+

Corresponde ao caractere a repetido 1 ou mais vezes (a mais longa das sequências possíveis será selecionada).

a?

Corresponde ao caractere a repetido 0 vezes ou 1 vez (será dado prioridade à ocorrência do caractere).

a

Corresponde ao caractere a repetido no mínimo n vezes e no máximo m vezes (a mais longa sequência possível será selecionada).

a

Corresponde ao caractere a repetido não menos que n vezes (a sequência mais longa possível será selecionada).

a

Corresponde ao caractere a repetido exatamente n vezes.

a*?

Corresponde ao caractere a repetido 0 ou mais vezes (a sequência mais curta possível será selecionada).

a+?

Corresponde ao caractere a repetido 1 ou mais vezes (a sequência mais curta possível será selecionada).

a??

Corresponde ao caractere a repetido 0 vezes ou 1 vez (será dado prioridade à ausência do caractere).

a{n,m}?

Corresponde ao caractere a repetido não menos que n e não mais que m vezes (a sequência mais curta possível será selecionada).

a{n,}?

Corresponde ao caractere a repetido não menos que n vezes (a sequência mais curta possível será selecionada).

Posição dentro da string

^

Corresponde ao início da string.

$

Corresponde ao final da string.

\b

Corresponde a uma fronteira de palavra — a posição entre um caractere alfanumérico (\w) e um caractere não alfanumérico (\W).

\B

Corresponde a uma ausência de fronteira de palavra. Definido através das classes \w e \W.

Sequências de escape

\

Uma barra invertida antes de um dos caracteres especiais `[ ] \ ^ $ .

? * + ( ) { }` significa que esse caractere deve ser interpretado literalmente, e não como um metacaractere.

Exemplo: \$ corresponde ao símbolo do dólar.

\Q...\E

Todos os caracteres especiais do intervalo entre \Q e \E serão interpretados como caracteres regulares.

Fale conosco

Escrever um e-mail

Observe, por gentileza, que nossa equipe de suporte jamais iniciará uma chamada com você. Se alguém ligar para você e se apresentar como a equipe de suporte do Yandex Metrica, não siga as instruções dessa pessoa.