Skip to content

Latest commit

 

History

History
33 lines (23 loc) · 1.34 KB

hlaseni_chyb.md

File metadata and controls

33 lines (23 loc) · 1.34 KB

HLášení chyb

V datech se bohužel můžou vyskytnout i chyby. V případě výživných látek jsou uváděné hodnoty vždy přepočtené na 100 gramů potraviny. Chybou by tedy například bylo, pokud by bylo nějaké výživné látky v potravině více než 100 gramů, tj. výživné látky by bylo více než samotné potraviny. Podobně to platí i pro miligramy. Více než 100 000 miligramů výživné látky též nedává smysl (1 gram = 1 000 miligramů).

Vyhledej všechny řádky, kde jsou hodnoty v miligramech (ve sloupci unit_name je hodnota MG) a množství látky (sloupec amount) má větší hodnotu než 100 000. Ulož tato data do tabulky error_report.csv. K tomu využij metodu .to_csv(), které zadáš jako parametr název tabulky. Níže je příklad jejího použití.

tabulky.to_csv("nazev_souboru.csv")

Takto vytvořenou tabulku bychom mohli poslat poskytovateli dat a požádat ho o opravu.

Řešení
import pandas as pd

url_food_nutrient = "https://kodim.cz/cms/assets/czechitas/python-data-1/python-pro-data-1/podmineny-vyber/podmineny-vyber/food_nutrient.csv"
food_nutrient = pd.read_csv(url_food_nutrient)

errors = food_nutrient[
    (food_nutrient["unit_name"] == "MG")
    & (food_nutrient["amount"] > 100_000)
]

errors.to_csv("error_reports.csv")