Python: Функции
Теория: Comprehensions
Обработка коллекций в основном состоит из сочетаний операций map и filter. Отсеять данные по условию, а затем преобразовать и собрать все в конечный список настолько частая задача, что в Python есть особый инструмент сочетающий в себе map и filter.
Списочные выражения
Вспомним задачу из предыдущих уроков. Возьмем словарь пользователей, отфильтруем тех, кто старше 10 лет, и получим список их имен.
Попробуем решить ту же задачу другим способом:
Вся обработка коллекции умещается в одну короткую строку. Распишем ее подробнее:
Теперь код стал похож на запись цикла. Сравните:
Код выглядит очень похоже, но есть два различия:
- В первом варианте мы создаем новый список, а во втором — изменяем заранее созданный
- Первый вариант — это выражение, а второй — набор инструкций. Следовательно, первый вариант можно использовать как часть любых других выражений. При этом нам не пришлось объявлять вспомогательные функции, лямбды тоже не понадобились
Выражения вида [… for … in …] называются списочными выражениями, list comprehensions.
В общем виде списочное выражение описывается так:
Рассмотрим этот шаблон подробнее:
ВЫРАЖЕНИЕможет использоватьПЕРЕМЕННУЮи вычисляется в элемент будущего спискаПЕРЕМЕННАЯ— имя, с которым поочередно связываются элементыИСТОЧНИКАИСТОЧНИК— любой итератор или итерируемый объектУСЛОВИЕ— выражение, которое используетПЕРЕМЕННУЮ, вычисляемую на каждой итерации
Если условие оказывается ложным, то вычисление выражения для текущей итерации пропускается — в итоговый список новый элемент не добавится. Если условие вместе с ключевым словом if будет пропущено, то это будет эквивалентно условию if True.
В общем случае переменных может быть несколько. Здесь тоже работает распаковка кортежей и списков, в том числе и вложенных.
Вот несколько примеров:
Также в списочное выражение можно добавить ветку else с помощью тернарного .. if .. else ... Общий синтаксис не меняется, только в место выражения подставляется тернарник:
Когда использовать списочные выражения
Выше мы увидели, что списочные выражения не отменяют все встроенные функции для работы с итераторами. Одно с другим отлично сочетается.
С другой стороны, лучше не смешивать их с функциями map() и filter() — это как раз взаимозаменяемые сущности. Еще не стоит их смешивать с какими-либо побочными эффектами.
Это касается не только кода с функциями map() и filter(), но и вообще любых конвейеров обработки. Стоит разделять код, ответственный за работу с побочными эффектами и чистую обработку. Например, ввод-вывод — это один из основных видов побочных эффектов. Он может находиться в начале конвейера или в его конце, но не в середине.
Словарные выражения
Наряду с созданием списков через выражения, в Python существует подобный способ создавать множества и словари. Главное отличие, что теперь выражение заключено в фигурные {} скобки.
Создание словарей выглядят очень похоже на создание множеств. Разница заключается в том, как описывается элемент словаря.
Нужно сгенерировать не только значение, но и ключ. При этом ключ надо указать через двоеточие:
Обратите внимание, что в этом примере ключ 'l'имеет значение 10. Посмотрим, какие значения имели char и pos во время генерации. Для простоты будем смотреть только на позиции символа 'l':
Как можно заметить, 'l' встречается в исходной строке три раза — в последнем случае как раз в позиции 10. При генерации словаря используется последнее значение для каждого из ключей, будто словарь был заполнен в подобном цикле:
В примере выше порядок ключей получается тот же самый — это порядок первого появления соответствующего символа в строке. Последующие перезаписи значений этот порядок не изменят. Словари в Python запоминают порядок добавления ключей, но не порядок последующих изменений значений.
Генераторные выражения
Хоть списочные и словарные выражения почти всегда заменяют использование map() и filter(), у них есть один главный недостаток - они вычисляются сразу. Ранее мы говорили, что многие функции для работы с коллекциями в питоне ленивые. Так мы можем собирать конвейеры обработки и "протаскивать" данные через них по одному, без создания промежуточных коллекций.
Но list и dict comprehensions всегда сразу создают коллекцию, что может быть непрактично при работе с большими данными. Более того, зачастую последовательности не нужно вычислять целиком, в конце обработки данные соберутся в какой-то вывод.
Для решения задач выше, но в ленивом подходе, существуют генераторные выражения. Выглядят они как списочные выражения, разница только в круглых скобках вместо квадратных:
Как видите, результатом вычисления второго выражения является не список, а generator object — это объект-генератор, уже знакомый нам ленивый итератор.
Часто можно встретить генераторное выражение в таком месте кода, где интерпретатор может однозначно понять, где границы этого выражения. Самый частый пример — генераторное выражение в роли единственного аргумента функции:
В подобных случаях скобки вокруг самого выражения можно опустить. Такое избавление от лишних скобок часто делает код еще более лаконичным:
Код выше можно перевести так:
Есть ли любой икс больше ста среди иксов в диапазоне от нуля до миллиона?
Это выражение вычислится мгновенно, а числа будут проверяться по одному за раз.
А теперь представим, что мы использовали any([… for …]). В таком случае Python тоже искал бы первое значение True в списке, но предварительно построил бы в памяти список в миллион элементов.
Старайтесь применять генераторные выражения везде, где это возможно. Использовать объекты-генераторы могут практически любые функции, которые работают с последовательностями в том или ином виде. Даже при вызове функции для пачки аргументов лучше использовать генераторное выражение:
И уж тем более стоит использовать генераторные выражения посреди выражений с list, set и dict. Генераторные выражения регулярно используются вместе с sum, any, all, а также среди конвейеров на основе map() или filter().

