Обратные ссылки: \n и $n

Скобочные группы можно не только получать в результате.

Движок регулярных выражений запоминает их содержимое, и затем его можно использовать как в самом паттерне, так и в строке замены.

Группа в строке замены

Ссылки в строке замены имеют вид $n, где n – это номер скобочной группы.

Вместо $n подставляется содержимое соответствующей скобки:

var name = "Александр Пушкин";

name = name.replace(/([а-яё]+) ([а-яё]+)/i, "$2, $1");
alert( name ); // Пушкин, Александр

В примере выше вместо $2 подставляется второе найденное слово, а вместо $1 – первое.

Группа в шаблоне

Выше был пример использования содержимого групп в строке замены. Это удобно, когда нужно реорганизовать содержимое или создать новое с использованием старого.

Но к скобочной группе можно также обратиться в самом поисковом шаблоне, ссылкой вида \номер.

Чтобы было яснее, рассмотрим это на реальной задаче – необходимо найти в тексте строку в кавычках. Причём кавычки могут быть одинарными '...' или двойными "..." – и то и другое должно искаться корректно.

Как такие строки искать?

Можно в регэкспе предусмотреть произвольные кавычки: ['"](.*?)['"]. Такой регэксп найдёт строки вида "...", '...', но он даст неверный ответ в случае, если одна кавычка ненароком оказалась внутри другой, как например в строке "She's the one!":

var str = "He said: \"She's the one!\".";

var reg = /['"](.*?)['"]/g;

// Результат не соответствует замыслу
alert( str.match(reg) ); // "She'

Как видно, регэксп нашёл открывающую кавычку ", затем текст, вплоть до новой кавычки ', которая закрывает соответствие.

Для того, чтобы попросить регэксп искать закрывающую кавычку – такую же, как открывающую, мы обернём её в скобочную группу и используем обратную ссылку на неё:

var str = "He said: \"She's the one!\".";

var reg = /(['"])(.*?)\1/g;

alert( str.match(reg) ); // "She's the one!"

Теперь работает верно! Движок регулярных выражений, найдя первое скобочное выражение – кавычку (['"]), запоминает его и далее \1 означает «найти то же самое, что в первой скобочной группе».

Обратим внимание на два нюанса:

  • Чтобы использовать скобочную группу в строке замены – нужно использовать ссылку вида $1, а в шаблоне – обратный слэш: \1.
  • Чтобы в принципе иметь возможность обратиться к скобочной группе – не важно откуда, она не должна быть исключена из запоминаемых при помощи ?:. Скобочные группы вида (?:...) не участвуют в нумерации.

Задачи

ББ-тег имеет вид [имя]...[/имя], где имя – слово, одно из: b, url, quote.

Например:

[b]текст[/b]
[url]http://ya.ru[/url]

ББ-теги могут быть вложенными, но сам в себя тег быть вложен не может, например:

Допустимо:
[url] [b]http://ya.ru[/b] [/url]
[quote] [b]текст[/b] [/quote]

Нельзя:
[b][b]текст[/b][/b]

Создайте регулярное выражение для поиска ББ-тегов и их содержимого.

Например:

var re = /* регулярка */

var str = "..[url]http://ya.ru[/url]..";
alert( str.match(re) ); // [url]http://ya.ru[/url]

Если теги вложены, то нужно искать самый внешний тег (при желании можно будет продолжить поиск в его содержимом):

var re = /* регулярка */

var str = "..[url][b]http://ya.ru[/b][/url]..";
alert( str.match(re) ); // [url][b]http://ya.ru[/b][/url]

Открывающий тег – это \[(b|url|quote)\].

Для того, чтобы найти всё до закрывающего – используем ленивый поиск [\s\S]*? и обратную ссылку на открывающий тег.

Итого, получится: \[(b|url|quote)\][\s\S]*?\[/\1\].

В действии:

var re = /\[(b|url|quote)\][\s\S]*?\[\/\1\]/g;

var str1 = "..[url]http://ya.ru[/url]..";
var str2 = "..[url][b]http://ya.ru[/b][/url]..";

alert( str1.match(re) ); // [url]http://ya.ru[/url]
alert( str2.match(re) ); // [url][b]http://ya.ru[/b][/url]

Для закрывающего тега [/1] понадобилось дополнительно экранировать слеш: \[\/1\].

Карта учебника

Комментарии

перед тем как писать…
  • Приветствуются комментарии, содержащие дополнения и вопросы по статье, и ответы на них.
  • Для одной строки кода используйте тег <code>, для нескольких строк кода — тег <pre>, если больше 10 строк — ссылку на песочницу (plnkr, JSBin, codepen…)
  • Если что-то непонятно в статье — пишите, что именно и с какого места.