5.8. Odnajdywanie powtarzających się wyrazów

Problem

Edytujemy dokument i chcemy sprawdzić, czy nie występują w nim nieprawidłowo powtórzone wyrazy. Chcemy odnaleźć wszystkie podwójne wystąpienia słów niezależnie od ewentualnych różnic w wielkości liter, jak w przypadku sekwencji The the. Chcemy też, aby pomiędzy powtarzającymi się wyrazami mogła występować dowolna liczba znaków białych, nawet jeśli powtórzenie będzie występowało w wielu wierszach.

Rozwiązanie

Odwołanie wstecz pasuje do czegoś, co zostało już wcześniej dopasowane, zatem stanowi podstawowy element składowy tej receptury:

  • \b([A-Z]+)\s+\1\b

    • Opcje wyrażenia regularnego: Ignorowanie wielkości liter

    • Odmiany wyrażeń regularnych: .NET, Java, JavaScript, PCRE, Perl, Python, Ruby

Chcemy użyć tego ...

Get Wyrażenia regularne. Receptury now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.