Язык программирования Python

Курс IT-Академии Сухорукова

Январь-март 2019

Следующее занятие

19 февраля в 19:00 NOVT

Задание. Регулярные выражения: разбор файла

Прочитать файл и найти в нём информацию с помощью регулярных выражений.

Задание

Дан текстовый файл python_wiki.txt (https://anhel.in/files/python_wiki.txt). Это текстовый файл, содержащий вики-размеку (о вики-размеке можно прочитать на Википедии).

Необходимо в этом файле найти все ссылки. Ссылки оформляются следующим образом:

[[ссылка]]

или

[[ссылка|описание ссылки]]

То есть они состоят из двойных квадратных скобок, внутри которых находится ссылка. После ссылки, но до закрывающих скобок может находиться отделённое символом вертикальной черты «|» описание. Например,

[[Python|Язык Питон]]

Здесь ссылка — это слово Python.

Найденные ссылки нужно собрать в список, отсортировать по алфавиту и убрать из этого списка дубликаты. Список-результат нужно сохранить в текстовый файл links.txt.

Замечания

  1. Описание ссылки нас не интересует — пусть скрипт его игнорирует. Только сами ссылки.
  2. Двойные квадратные скобки к ссылке не относятся — только текст внутри них.