Skip to content

Latest commit

 

History

History
30 lines (21 loc) · 840 Bytes

titanic_data_set.md

File metadata and controls

30 lines (21 loc) · 840 Bytes

Titanic data set

Každý tutoriál datové analýzy začíná zpracováváním data setu pasažérů lodi Titanic.
Nebude tomu jinak ani v našem případě. Stáhni si soubor titanic.csv.

  • Načti data do DataFrame, který si pojmenuj titanic.
  • Nech si zobrazit názvy sloupců, které jsou v souboru uloženy.
  • Podívej se, kolik má soubor řádků.
  • Zjisti, v jakých sloupcích nějaké hodnoty chybí.
Řešení
import pandas as pd

# nactecni dat
titanic = pd.read_csv('titanic.csv')

# zobrazeni sloupcu
print(titanic.columns)

# pocet radku
print(titanic.shape[0])

# chybejici hodnoty zjistíme ze sloupce "Non-Null Count"
print(titanic.info())