1 Борис 30 Санкт-Петербург
2 Виктория 22 Киев
```
DataFrame в Pandas является важным инструментом для анализа и обработки данных, и он широко используется в областях работы с данными, машинного обучения, статистики и других.
Из списка словарей:
```python
import pandas as pd
data = {'Имя': ['Анна', 'Борис', 'Виктория'],
'Возраст': [25, 30, 22],
'Город': ['Москва', 'Санкт-Петербург', 'Киев']}
df = pd.DataFrame(data)
print(df)
```
Из CSV-файла:
```python
import pandas as pd
df = pd.read_csv('данные.csv')
print(df)
```
CSV (Comma-Separated Values) – это текстовый формат для представления табличных данных. В файле CSV данные организованы в виде таблицы, где каждая строка представляет собой отдельную запись, а столбцы разделены разделителем, обычно запятой (`,`). Однако, в зависимости от локали, могут использоваться и другие разделители, такие как точка с запятой (`;`) или табуляция (`\t`).
CSV-файлы позволяют эффективно хранить и передавать табличные данные между программами. Этот формат широко используется в области обработки данных, анализа данных, а также в различных приложениях для импорта и экспорта информации в табличной форме.
Пример CSV-файла:
Имя,Возраст,Город
Анна,25,Москва
Борис,30,Санкт-Петербург
Виктория,22,Киев
В этом примере каждая строка представляет собой запись с именем, возрастом и городом. Значения разделены запятыми, что является стандартным подходом, но можно использовать и другие разделители.
CSV-файлы легко читаются и создаются с использованием различных программ, включая текстовые редакторы, электронные таблицы (например, Microsoft Excel, Google Sheets) и программы для обработки данных (например, Python с библиотекой Pandas).
3. Основные операции с DataFrame
Просмотр данных:
```python
# Вывести первые n строк DataFrame
print(df.head())
# Вывести последние n строк DataFrame
print(df.tail())
```
Индексация и выбор данных:
```python
# Выбор столбца по имени
age = df['Возраст']
# Выбор строки по индексу
row = df.loc[0]
```
Фильтрация данных:
```python
# Фильтрация по условию
filtered_df = df[df['Возраст'] > 25]
```
Добавление новых столбцов:
```python