7.2. Odnajdywanie adresów URL w dłuższym tekście

Problem

Chcemy odnajdywać adresy URL w dłuższym tekście. Dopasowywane adresy URL mogą, ale nie muszą być otoczone dodatkowymi znakami interpunkcyjnymi, na przykład nawiasami, które nie wchodzą w skład samych adresów.

Rozwiązanie

Adresy URL bez spacji:

  • \b(https?|ftp|file)://\S+

    • Opcje wyrażenia regularnego: Ignorowanie wielkości liter

    • Odmiany wyrażeń regularnych: .NET, Java, JavaScript, PCRE, Perl, Python, Ruby

Adresy URL bez spacji i końcowych znaków interpunkcyjnych:

  • \b(https?|ftp|file)://[-A-Z0-9+&@#/%?=~_|$!:,.;]*[A-Z0-9+&@#/%=~_|$]

    • Opcje wyrażenia regularnego: Ignorowanie wielkości liter

    • Odmiany wyrażeń regularnych: .NET, Java, JavaScript, PCRE, Perl, Python, Ruby

Adresy URL bez spacji i końcowych znaków ...

Get Wyrażenia regularne. Receptury now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.