pandas как удалить пустые строки

Аватар пользователя Ivan Mamtsev
Ivan Mamtsev
29 мая 2024

Для удаления пустых строк из DataFrame в библиотеке Pandas можно использовать метод dropna(). Этот метод позволяет удалить строки, содержащие пропущенные значения (NaN) в указанных столбцах или во всех столбцах.

import pandas as pd

# Создаем исходный DataFrame
data = {'A': [1, 2, None, 4],
        'B': [None, 5, 6, 7],
        'C': [8, 9, 10, 11]}
df = pd.DataFrame(data)

# Удаление всех строк с пропущенными значениями
df_cleaned = df.dropna()

В результате выполнения данного кода будут удалены строки, в которых хотя бы одно значение равно NaN. Теперь DataFrame df_cleaned будет содержать только строки без пропущенных значений.

Если необходимо удалить только строки, в которых все значения равны NaN, то можно использовать параметр how='all':

# Удаление только строк, в которых все значения NaN
df_cleaned = df.dropna(how='all')

Также можно использовать параметр subset для указания столбцов, в которых нужно проверять наличие пропущенных значений:

# Удаление строк с пропущенными значениями только в столбцах 'A' и 'B'
df_cleaned = df.dropna(subset=['A', 'B'])

Теперь DataFrame df_cleaned будет содержать только строки, в которых значения в столбцах 'A' и 'B' не являются NaN.

0 0