- WHERE
- Проверка на равенство с NULL
- Равенство строк
- Другие операции сравнения
- Логические операторы
- BETWEEN
- IN
- LIKE
- Выводы
Обычно данных в базе много, и мы хотим работать только с их частью, а не всеми данными сразу. Например, нам нужно посмотреть данные только тех пользователей, которые зарегистрировались вчера. Для выборки части данных из базы используются условия. В этом уроке мы научимся строить подобные условия при выполнении запросов в базу данных с помощью WHERE
.
WHERE
Самое простое условие — указать прямое соответствие. Например, выборка по идентификатору:
-- В случае базы данных знак `=` должен восприниматься
-- как математическое равенство, а не присваивание.
SELECT * FROM users WHERE id = 3;
UPDATE users SET first_name = 'Valya' WHERE id = 3;
DELETE FROM users WHERE id = 3;
Первый запрос выше звучит так: выбрать всех пользователей, у которых идентификатор равен трем. Такая формулировка звучит странно, так как если мы выбираем по идентификатору, то и запись должна быть одна. С точки зрения семантики идентификатора она будет одна, но в реляционной базе данных результатом любой операции над множеством является множество.
В том случае, если ничего не найдено, возвращается не пустота, а пустое множество. Если же в базе есть пользователь с указанным идентификатором, то вернется множество, которое содержит один элемент — найденного пользователя.
Если нужно получить все записи, кроме тех, у которых есть определенное значение, то нужно =
, заменить на !=
:
-- выбрать всех пользователей с идентификатором, НЕ равным трем
SELECT * FROM users WHERE id != 3;
Сравнение с конкретным значением работает для всех типов данных, кроме NULL
. Разберем эту ситуацию подробнее.
Проверка на равенство с NULL
У данных типа NULL
свой синтаксис:
Равно NULL
:
SELECT * FROM users WHERE first_name IS NULL;
Не равно NULL
:
SELECT * FROM users WHERE created_at IS NOT NULL;
NOT
, как и отрицание в языках программирования, может добавляться практически к любому оператору.
Равенство строк
У строк тоже свои особенности. В соответствии со стандартом ANSI SQL, строки в PostgreSQL регистрозависимые — результат зависит от регистра, в котором записан текст. Например, следующие два запроса выбирают разные данные:
SELECT * FROM users WHERE first_name = 'sunny';
SELECT * FROM users WHERE first_name = 'Sunny';
По этой причине данные в базе стараются хранить в нормализованном виде — перед добавлением в БД их приводят, например, к нижнему регистру, и то же самое делают при выборках. Классический пример — email. Его нужно хранить только в нижнем регистре.
Другие операции сравнения
Кроме точного соответствия SQL поддерживает и все остальные операции сравнения:
>
— больше<
— меньше!=
— не равно>=
— больше либо равно, не меньше<=
— меньше либо равно, не больше
Например, так может выглядеть запрос на сравнение:
SELECT *
FROM users
WHERE created_at < '2018-10-05';
Здесь мы выбираем всех пользователей, созданных до 2018-10-05.
Логические операторы
Все операции можно объединять в цепочки, если использовать логические операторы OR
и AND
:
SELECT *
FROM users
WHERE created_at > '2018-01-01' AND created_at < '2018-10-05';
Здесь мы выбираем пользователей, которые зарегистрировались между 2018-01-01 и 2018-10-05.
Как и в случае с языками программирования, здесь действуют те же приоритеты. Чтобы не создавать неоднозначностей, в сложных ситуациях используются круглые скобки:
SELECT *
FROM users
WHERE first_name = 'Sunny' OR (created_at > '2018-01-01' AND created_at < '2018-10-05');
BETWEEN
Для условий с проверкой диапазона SQL поддерживает особый формат BETWEEN
. По сути, это сокращенная версия для двух условий соединенных через AND
:
SELECT *
FROM users
WHERE created_at BETWEEN '2018-01-01' AND '2018-10-05';
-- WHERE created_at >= '2018-01-01' AND created_at <= '2018-10-05';
Здесь мы выбираем пользователей, которые зарегистрировались между 2018-01-01 и 2018-10-05, включая эти даты. BETWEEN
всегда учитывает границы диапазона.
IN
В некоторых ситуациях требуется найти не диапазон строк, а строки, в которых поле соответствует одному значению из набора. Предположим, что мы хотим выполнить один запрос и найти пользователей с идентификаторами 1, 2 или 5. Для этого используют OR
:
SELECT * FROM users WHERE id = 1 OR id = 2 OR id = 5;
Если понадобится найти десяток совпадений, можно использовать другое решение — IN
:
SELECT * FROM users WHERE id IN (1, 2, 5);
Если нужно исключить определенные записи, достаточно добавить NOT
:
SELECT * FROM users WHERE id NOT IN (1, 2, 5);
LIKE
Иногда нужно искать по частичному совпадению: например, проверить, что строка начинается или заканчивается с определенной последовательности символов. Допустим, мы хотим посмотреть пользователей, имя которых начинается с буквы A
:
SELECT * FROM users WHERE first_name LIKE 'A%';
%
— специальный заполнитель, который означает «все что угодно». Если его поставить в конце, то поиск выполняется по совпадению в начале фразы, если в начале — то по совпадению с концом, а если по краям — то проверяется совпадение внутри текста. Совпадение в конце может понадобиться, чтобы анализировать пользователей, которые регистрировались с определенного почтового домена:
SELECT * FROM users WHERE email LIKE '%hotmail.com';
Здесь мы выбираем всех пользователей, электронная почта которых заканчивается на hotmail.com.
Обратите внимание на то, что этот поиск регистрозависимый. Если вы хотите искать без учета регистра, то используйте ILIKE
.
Выводы
В этом уроке мы разобрали, как работать с выборками части данных по условию. Теперь вы умеете строить условия при выполнении запросов в базу данных с помощью WHERE
и таким образом сможете работать только с частью данных, а не со всей базой сразу.
Дополнительные материалы
Остались вопросы? Задайте их в разделе «Обсуждение»
Вам ответят команда поддержки Хекслета или другие студенты