Python Библиотеки

Автор

Джейд Картер

Год написания книги

2024

Теги

<< 1 2 3 4 5 6 7 8 9 10 ... 16 >>

На страницу:

Перейти

6 из 16

Настройки чтения

Размер шрифта

Высота строк

Поля

1 Борис 30 Санкт-Петербург

2 Виктория 22 Киев

```

DataFrame в Pandas является важным инструментом для анализа и обработки данных, и он широко используется в областях работы с данными, машинного обучения, статистики и других.

Из списка словарей:

```python

import pandas as pd

data = {'Имя': ['Анна', 'Борис', 'Виктория'],

'Возраст': [25, 30, 22],

'Город': ['Москва', 'Санкт-Петербург', 'Киев']}

df = pd.DataFrame(data)

print(df)

```

Из CSV-файла:

```python

import pandas as pd

df = pd.read_csv('данные.csv')

print(df)

```

CSV (Comma-Separated Values) – это текстовый формат для представления табличных данных. В файле CSV данные организованы в виде таблицы, где каждая строка представляет собой отдельную запись, а столбцы разделены разделителем, обычно запятой (`,`). Однако, в зависимости от локали, могут использоваться и другие разделители, такие как точка с запятой (`;`) или табуляция (`\t`).

CSV-файлы позволяют эффективно хранить и передавать табличные данные между программами. Этот формат широко используется в области обработки данных, анализа данных, а также в различных приложениях для импорта и экспорта информации в табличной форме.

Пример CSV-файла:

Имя,Возраст,Город

Анна,25,Москва

Борис,30,Санкт-Петербург

Виктория,22,Киев

В этом примере каждая строка представляет собой запись с именем, возрастом и городом. Значения разделены запятыми, что является стандартным подходом, но можно использовать и другие разделители.

CSV-файлы легко читаются и создаются с использованием различных программ, включая текстовые редакторы, электронные таблицы (например, Microsoft Excel, Google Sheets) и программы для обработки данных (например, Python с библиотекой Pandas).

3. Основные операции с DataFrame

Просмотр данных:

```python

# Вывести первые n строк DataFrame

print(df.head())

# Вывести последние n строк DataFrame

print(df.tail())

```

Индексация и выбор данных:

```python

# Выбор столбца по имени

age = df['Возраст']

# Выбор строки по индексу

row = df.loc[0]

```

Фильтрация данных:

```python

# Фильтрация по условию

filtered_df = df[df['Возраст'] > 25]

```

Добавление новых столбцов:

```python