正则表达式

正则表达式

备注

设定“JavaScript event”目标时,正则表达式必须仅包含标识符值(没有任何域或网站协议)。

示例

如果您想要跟踪 ID 包含 buttonbuy 的特定按钮的点击,则可以指定以下条件:button|buy

表达式的处理依据 RE2 语法和以下规则:

  • 正则表达式应用于页面的完整 URL,包括协议和域。 例如,您可以使用正则表达式:^http://

  • 正则表达式应用两次:首先应用于原始 URL,然后应用于带和不带 www 前缀的 URL。 这意味着结果并不取决于域中是否包含 www 前缀。

  • 正则表达式应用于解码后的 URL,其中 URL 转义代码(% 序列)替换为解码后的字符(例外情况:不替换 /&=?# 的字符代码,例如,%2F 不会替换为 /)。 重要的是要记住在解码时将加号 (+) 替换为空格。 例如,正则表达式 text=elephant 将会被处理,而 text=%D1%81%D0%BB%D0%BE%D0%BDtext=%\w\w 不会被处理。

  • Punycode 不应用于西里尔语的 URL。 例如,正则表达式 ^http://ввв\.сайт\.рф/ 将会被处理,但 ^http://xn--b1aaa\.xn--80aswg\.xn--p1ai/ 不会被处理。

  • 在检查正则表达式之前,会从 URL 末尾处删除 ?、#、& 和点 (.) 等符号。 例如,URL http://example.com/?http://example.com/#http://example.com/?var=1& 将分别与 http://example.com/http://example.com/http://example.com/?var=1 比较。 如果用户输入 URL http://example.com./,正则表达式 \./$ 将不会被处理。

  • 检查正则表达式时,量词将匹配尽可能长的字符串。

  • URL 中的字符区分大小写。

正则表达式说明

在下表中,abcde 是任意字符,nm 是全体正整数。

可替代变体

abc|de

匹配其中一种变体:abcde

字符类

[abc] 或 [a-c]

匹配列出的字符(或指定范围)中的任何一个字符。

[^abc] 或 [^a-c]

匹配除所列字符(或指定范围之外)的任意单个字符。

\d

匹配数字。 相当于 [0-9]

\D

匹配非数字。 相当于 [^0-9]

\s

匹配空格。 相当于 [\t\n\f\r ]

\S

匹配任何不是空格的字符。 相当于 [^\t\n\f\r ]

\pL

匹配任何 Unicode 字符。

\w

匹配大写或小写拉丁字母、数字或下划线。

使用 Unicode 字符时,请使用 \pL 类,而非 \w。

\W

匹配任意不是大写或小写拉丁字母、数字或下划线的字符。

使用 Unicode 字符时,请使用 \pL 类,而非 \w。

出现次数(量词)

a*

匹配重复 0 次或多次的字符 a(选择最长的可能序列)。

a+

匹配重复 1 次或多次的字符 a(选择最长的可能序列)。

a?

匹配重复 0 次或 1 次的字符 a(优先考虑字符的出现)。

a

匹配重复次数不少于 n 且不超过 m 的字符 a(选择最长的可能序列)。

a

匹配重复次数不少于 n 的字符 a(选择最长的可能序列)。

a

匹配重复次数恰好为 n 的字符 a

a*?

匹配重复 0 次或多次的字符 a(选择最短的可能序列)。

a+?

匹配重复 1 次或多次的字符 a(选择最短的可能序列)。

a??

匹配重复 0 次或 1 次的字符 a(优先考虑字符的缺少)。

a{n,m}?

匹配重复次数不少于 n 且不超过 m 的字符 a(选择最短的可能序列)。

a{n,}?

匹配重复次数不少于 n 的字符 a(选择最短的可能序列)。

字符串中的位置

^

匹配字符串的开头。

$

匹配字符串的结尾。

\b

匹配字边界:字母数字字符 (\w) 和非字母数字字符 (\W) 之间的位置。

\B

匹配字边界的缺少。 通过类 \w\W 定义。

转义序列

\

在这些特殊字符 [ ] \ ^ $ . 前加上反斜杠。

? * + ( ) { }` 表示该字符应按字面解释,而不是解释为元字符。

示例:\$ 对应于美元符号。

\Q...\E

\Q\E 之间的间隔中的所有特殊字符均解释为正规字符。

与我们聊天

发送电子邮件

请注意:我们的支持团队永远不会主动给您打电话。 请勿按照自称为 Yandex Metrica 支持团队来电者的指示操作。