Домашнее задание. Регулярные выражения: разбор файла
8 октября 2018
Прочитать файл и найти в нём информацию с помощью регулярных выражений.
Задание
Дан текстовый файл python_wiki.txt (https://anhel.in/files/python_wiki.txt). Это текстовый файл, содержащий вики-размеку (о вики-размеке можно прочитать на Википедии).
Необходимо в этом файле найти все ссылки. Ссылки оформляются следующим образом:
[[ссылка]]
или
[[ссылка|описание ссылки]]
То есть они состоят из двойных квадратных скобок, внутри которых находится ссылка. После ссылки, но до закрывающих скобок может находиться отделённое символом вертикальной черты «|» описание. Например,
[[Python|Язык Питон]]
Здесь ссылка — это слово Python
.
Найденные ссылки нужно собрать в список, отсортировать по алфавиту и убрать из этого списка дубликаты. Список-результат нужно сохранить в текстовый файл links.txt.
Замечания
- Описание ссылки нас не интересует — пусть скрипт его игнорирует. Только сами ссылки.
- Двойные квадратные скобки к ссылке не относятся — только текст внутри них.