Пример с usort
хорошо демонстрирует важность и удобство функций высшего порядка для решения повседневных задач. Описав алгоритм один раз, мы можем получать различные варианты поведения, специфицируя их функциями. То же самое относится к рассмотренным функциям map
, filter
и reduce
. Но есть еще один важный аспект, который требует рассмотрения.
Типичный код на PHP выглядит так: программа делает один цикл, внутри которого выполняются сразу все операции. В конце получается некоторый интересующий нас результат. Ничего криминального, но такой код сложно анализировать, потому что приходится держать в голове сразу все операции. С другой стороны, при использовании функций высшего порядка принято разделять задачу на подзадачи и выполнять их последовательно друг за другом, выстраивая в цепочку операций.
Представим функцию, которая принимает на вход список путей файловой системы, находит среди них файлы с расширением .php без учета регистра и возвращает имена этих файлов. Для решения этой задачи понадобятся следующие функции:
is_file
проверяет, что переданный путь — это реально существующий файлpathinfo
позволяет извлекать расширение из имени файлаbasename
извлекает имя файла из полного пути
Код выглядит так:
<?php
function getPHPFileNames(array $paths)
{
$result = [];
foreach ($paths as $path) {
$extension = strtolower(pathinfo($path, PATHINFO_EXTENSION));
if (is_file($path) && $extension === 'php') {
$result[] = basename($path);
}
}
return $result;
}
$names = getPHPFileNames(['index.php', 'wop.PHP', 'nonexists', 'node_modules']);
print_r($names);
// => Array
// (
// [0] => index.php
// [1] => wop.PHP
// )
В примере выше вы видите типовое решение с использованием цикла. Его алгоритм можно описать так:
- Просматриваем каждый путь
- Если текущий путь — файл с расширением
php
(без учета регистра), то добавляем его имя в результирующий массив
Если попытаться то же самое реализовать через функцию array_reduce
, то на выходе получится код, идентичный решению на циклах. Но если хорошо подумать, то эта задача распадается на две — фильтрацию и отображение:
<?php
function getPHPFileNames(array $paths)
{
// Фильтруем, оставляя только подходящие пути
$phpFiles = array_filter($paths, function ($path) {
$extension = strtolower(pathinfo($path, PATHINFO_EXTENSION));
return is_file($path) && $extension === 'php';
});
// Извлекаем имена файлов из оставшихся путей и возвращаем их наружу
return array_map(fn($path) => basename($path), $phpFiles);
}
$names = getPHPFileNames(['index.php', 'wop.PHP', 'nonexists', 'node_modules']);
print_r($names);
// => Array
// (
// [0] => index.php
// [1] => wop.PHP
// )
Код получился чуть короче, но и многословнее — это исключительно особенность PHP. Тем не менее здесь размер не принципиален. С увеличением количества операций и их сложности такой код читается и анализируется значительно проще, потому что каждая операция выполняется независимо для всего набора сразу. В голове приходится держать меньше деталей, можно сразу увидеть то, как операция влияет на все данные. Но научиться правильно разбивать задачу на подзадачи не так просто, как может показаться. Нужна некоторая практика и сноровка перед тем, как ваш код станет удобоваримым.
Сама возможность такого разбиения основывается на простой идее, которую иногда называют стандартные интерфейсы. Эта идея заключается в том, что на входе и выходе из функций ожидается один и тот же тип данных в нашем случае, это массив. Это позволяет соединять функции и строить цепочки, выполняющие большое количество разных задач, причем без необходимости реализовывать новые функции.
Обсудим рассмотренные ранее операции — отображение, фильтрация и агрегация. Комбинируясь друг с другом, они позволяют решать подавляющее число задач по обработке коллекций. С чем-то подобным мы все встречались в своей жизни, когда собирали конструкторы Lego. Небольшое число примитивных деталей за счет одинаковых соединений позволяет строить конструкции практически неограниченной сложности.
Кстати, подобные цепочки нередко заканчиваются на агрегации, потому что агрегация почти всегда выполняется в конце и сводит коллекцию к некоторому значению.
Производительность
За кадром остался вопрос производительности. Возможно, вы догадались, что на каждый вызов функции, обрабатывающей коллекцию, мы получаем проход по всему списку. Чем больше таких функций, тем больше проходов. Казалось бы, код замедляется, зачем так делать? На практике дополнительные проходы практически никогда не проблема (см. ссылку "Продуманная оптимизация"). Задачи, в которых требуется одномоментная обработка десятков и сотен тысяч элементов, встречаются крайне редко. Большая часть операций происходит со списками до тысяч элементов. А для такого списка одним проходом больше, одним меньше — нет никакой разницы.
Но это не вся правда. На самом деле, существуют специальные коллекции, которые в момент вызова функций фильтрации и отображения не выполняют операции сразу. Они накапливают необходимые действия, а во время первого использования выполняют сразу все одним проходом. Это так называемые ленивые коллекции.
Дополнительные материалы
Остались вопросы? Задайте их в разделе «Обсуждение»
Вам ответят команда поддержки Хекслета или другие студенты
- Статья «Как учиться и справляться с негативными мыслями»
- Статья «Ловушки обучения»
- Статья «Сложные простые задачи по программированию»
- Вебинар «Как самостоятельно учиться»
Для полного доступа к курсу нужен базовый план
Базовый план откроет полный доступ ко всем курсам, упражнениям и урокам Хекслета, проектам и пожизненный доступ к теории пройденных уроков. Подписку можно отменить в любой момент.