Файловая система – пример дерева, с которым знакомы все, кто пользуется компьютером. Она состоит из директорий и разного вида файлов:
php-package # директория
├── Makefile # файл
├── README.md # файл
├── tests # директория
│ └── halfTest.php # файл
├── phpunit.xml # файл
└── vendor # директория
└── squizlabs # директория
└── php_codesniffer # директория
Деревом она называется из-за своей структуры. Все элементы файловой системы выстраиваются в иерархию. В ней, на верхнем уровне, находится корневая директория (или диск если речь идет про Windows) и дальше, файлы и директории, которые сами по себе могут содержать файлы и директории.
Ключевая черта древовидной структуры в том, что она рекурсивна. Другими словами, дерево состоит из поддеревьев, которые в свою очередь состоят из поддеревьев, которые в свою очередь... Эта особенность определяет основные способы работы с деревьями в коде, все они работают рекурсивно.
Дерево состоит из узлов (вершин или нод, так как по-английски узел — это node) и ребер между ними. Ребра в реальности не существуют, они нужны лишь для того, чтобы визуализировать связь и по необходимости описать ее. Узлы делятся на два типа: внутренние (те, у которых есть потомки) и листовые узлы (те, у которых нет потомков). В случае файловой системы листовые узлы представлены файлами, а внутренние — директориями.
У каждой вершины в дереве есть родитель (или предок). Единственным исключением является корневой узел — у него нет родителей, и именно с него начинается дерево. Количество потомков у любой внутренней вершины, в общем случае, может быть любым. Кроме того, в деревьях выделяют понятие глубины (depth), определяющей то, сколько шагов нужно пройти по вершинам от корневой, чтобы достичь текущей (той, на которую смотрим). Вершины, находящиеся на одной глубине и имеющие общего родителя, называют братскими или сестринскими.
Реализация
Количество способов, которыми можно описать деревья, бесконечно. Самый примитивный вариант — это вложенные массивы:
<?php
[['index.html', 'main.php'], 'index.php', ['favicon.ico', 'app.css']];
// * корень – сам массив
// / | \
// * index.php *
// / | | \
// index.html main.php favicon.ico app.css
// Еще пара примеров деревьев с произвольными данными:
[]; // пустое дерево
[3, 2, [3, 8], [[8], 3]];
[1, null, [[3]], [5, 'string', [true, [3], ['key' => 'value']]]];
В примерах выше корень — это сам массив, а все его элементы — это дети. Если ребенок не является массивом, то он рассматривается как листовой узел, иначе — как внутренний узел. Внутренний узел, в свою очередь, состоит из детей.
Любое дерево состоит из двух больших частей:
- Данных, которые хранятся внутри дерева
- Структуры дерева, которая отвечает за связи между данными
<?php
[['index.html', 'main.php'], 'index.php', ['favicon.ico', 'app.css']];
Что в этом дереве структура, а что данные? Данные здесь – листовые узлы, а вот внутренние массивы – исключительно структура. Они определяют, где какие данные (в данном случае файлы) находятся, но сами не содержат никаких данных. Подобная организация дерева непригодна для хранения файловой структуры. Как минимум это дерево не позволяет задать имя для директории.
Расширим структуру так, чтобы она позволяла добавлять больше информации. Представим каждый элемент дерева массивом, в котором первый элемент — это значение, хранящееся в узле, а второй элемент — массив детей. Если второй элемент отсутствует, то считаем, что текущий узел — листовой.
<?php
['app', [ // Корень
['dist', [ // Внутренний узел
['index.html'], // лист
['main.php'] // лист
]],
['index.php'], // Лист
['assets', [ // Внутренний узел
['favicon.ico'], // лист
['app.css'], // лист
]],
]];
// app
// / | \
// dist index.php assets
// / | | \
// index.html main.php favicon.ico app.css
Такой вариант многословнее, но позволяет хранить данные в любом узле, даже не листовом. Причем это не обязательно должна быть строка, как в примере выше. Изменение данных на объекты позволит добавлять туда все что угодно.
И самый гибкий и удобный способ представления деревьев это ассоциативные массивы. В таком дереве каждый узел это ассоциативный массив, а обычные массивы используются только для хранения списка детей.
<?php
// Обратите внимание на разделение структуры и данных
// Здесь оно значительно более очевидное
$tree = [
'value' => 5,
'children' => [
['value' => 10],
['value' => 100],
['value' => 'nested', 'children' => [/* ... */]]
]
];
По большому счету, что обычный массив, что ассоциативный сами по себе всегда могут рассматриваться как деревья. Это справедливо для любой рекурсивной структуры данных, то есть для такой структуры, элементами которой может быть сама структура. В любом массиве может содержаться массив, как и в любом ассоциативном массиве может содержаться ассоциативный массив.
Дополнительные материалы
Остались вопросы? Задайте их в разделе «Обсуждение»
Вам ответят команда поддержки Хекслета или другие студенты
- Статья «Как учиться и справляться с негативными мыслями»
- Статья «Ловушки обучения»
- Статья «Сложные простые задачи по программированию»
- Вебинар «Как самостоятельно учиться»
Для полного доступа к курсу нужен базовый план
Базовый план откроет полный доступ ко всем курсам, упражнениям и урокам Хекслета, проектам и пожизненный доступ к теории пройденных уроков. Подписку можно отменить в любой момент.