Вернуться к уроку

Найдите строки в кавычках

Найдите в тексте при помощи регэкспа строки в двойных кавычках "...".

В строке поддерживается экранирование при помощи слеша – примерно в таком же виде, как в обычных строках JavaScript. То есть, строка может содержать любые символы, экранированные слэшем, в частности: \", \n, и даже сам слэш в экранированном виде: \\.

Здесь особо важно, что двойная кавычка после слэша не оканчивает строку, а считается её частью. В этом и состоит основная сложность задачи, которая без этого условия была бы элементарной.

Пример совпадающих строк:

.. "test me" ..  (обычная строка)
.. "Скажи \"Привет\"!" ... (строка с кавычками внутри)
.. "\r\n\\" ..  (строка со спец. символами и слэшем внутри)

Заметим, что в JavaScript такие строки удобнее всего задавать в одинарных кавычках, и слеши придётся удвоить (в одинарных кавычках они являются экранирующими символами):

Пример задания тестовой строки в JavaScript:

var str = ' .. "test me" .. "Скажи \\"Привет\\"!" .. "\\r\\n\\\\" .. ';

// эта строка будет такой:
alert(str); //  .. "test me" .. "Скажи \"Привет\"!" .. "\r\n\\" ..

Решение задачи: /"(\\.|[^"\\])*"/g.

То есть:

  • Сначала ищем кавычку "
  • Затем, если далее слэш \\ (удвоение слэша – техническое, для вставки в регэксп, на самом деле там один слэш), то после него также подойдёт любой символ (точка).
  • Если не слэш, то берём любой символ, кроме кавычек (которые будут означать конец строки) и слэша (чтобы предотвратить одинокие слэши, сам по себе единственный слэш не нужен, он должен экранировать какой-то символ) [^"\\]
  • …И так жадно, до закрывающей кавычки.

В действии:

var re = /"(\\.|[^"\\])*"/g;
var str = '.. "test me" .. "Скажи \\"Привет\\"!" .. "\\r\\n\\\\" ..';

alert( str.match(re) ); // "test me","Скажи \"Привет\"!","\r\n\\"