From 456b026bb4352ec825d8707f72081a19c91d2890 Mon Sep 17 00:00:00 2001 From: Michael Zingale Date: Fri, 6 Feb 2026 13:28:28 -0500 Subject: [PATCH] remove pandas --- content/07-pandas/exercises.txt | 2 - content/07-pandas/ideas.txt | 1 - content/07-pandas/pandas-babynames.ipynb | 6652 -------------------- content/07-pandas/pandas-experiments.ipynb | 719 --- content/07-pandas/pandas-intro.ipynb | 5108 --------------- content/07-pandas/pandas-worldbank.ipynb | 4013 ------------ content/07-pandas/pandas_solutions.txt | 37 - content/07-pandas/sample.csv | 20 - 8 files changed, 16552 deletions(-) delete mode 100644 content/07-pandas/exercises.txt delete mode 100644 content/07-pandas/ideas.txt delete mode 100644 content/07-pandas/pandas-babynames.ipynb delete mode 100644 content/07-pandas/pandas-experiments.ipynb delete mode 100644 content/07-pandas/pandas-intro.ipynb delete mode 100644 content/07-pandas/pandas-worldbank.ipynb delete mode 100644 content/07-pandas/pandas_solutions.txt delete mode 100644 content/07-pandas/sample.csv diff --git a/content/07-pandas/exercises.txt b/content/07-pandas/exercises.txt deleted file mode 100644 index c4b054ba..00000000 --- a/content/07-pandas/exercises.txt +++ /dev/null @@ -1,2 +0,0 @@ --- work with the World Bank data --- curve fit from pandas diff --git a/content/07-pandas/ideas.txt b/content/07-pandas/ideas.txt deleted file mode 100644 index 7236428d..00000000 --- a/content/07-pandas/ideas.txt +++ /dev/null @@ -1 +0,0 @@ -https://gist.github.com/jakevdp/9ffd72a81c1af80a10314cba0569af84 diff --git a/content/07-pandas/pandas-babynames.ipynb b/content/07-pandas/pandas-babynames.ipynb deleted file mode 100644 index 1f1176ee..00000000 --- a/content/07-pandas/pandas-babynames.ipynb +++ /dev/null @@ -1,6652 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# pandas exercises" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "We'll use the sample dataset from the Social Secury Administration on baby names:\n", - "https://www.ssa.gov/oact/babynames/limits.html\n", - "\n", - "Download the \"National\" version and unzip it. There will be one file for each year.\n", - "\n", - "This example follows the _Python for Data Analysis_ book closely" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import numpy as np\n", - "%matplotlib inline\n", - "import matplotlib.pyplot as plt" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Let's start by reading in just a single dataset, for the first year available (1880). We give the names of the columns here. The index will just be the line / record number in the file (not really important for us)" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namesexbirths
0MaryF7065
1AnnaF2604
2EmmaF2003
3ElizabethF1939
4MinnieF1746
5MargaretF1578
6IdaF1472
7AliceF1414
8BerthaF1320
9SarahF1288
10AnnieF1258
11ClaraF1226
12EllaF1156
13FlorenceF1063
14CoraF1045
15MarthaF1040
16LauraF1012
17NellieF995
18GraceF982
19CarrieF949
20MaudeF858
21MabelF808
22BessieF796
23JennieF793
24GertrudeF787
25JuliaF783
26HattieF769
27EdithF768
28MattieF704
29RoseF700
............
1970PhiloM5
1971PhineasM5
1972PresleyM5
1973RansomM5
1974ReeceM5
1975ReneM5
1976RoswellM5
1977RowlandM5
1978SampsonM5
1979SamualM5
1980SantosM5
1981SchuylerM5
1982SheppardM5
1983SpurgeonM5
1984StarlingM5
1985SylvanusM5
1986TheadoreM5
1987TheophileM5
1988TilmonM5
1989TommyM5
1990UnknownM5
1991VannM5
1992WesM5
1993WinstonM5
1994WoodM5
1995WoodieM5
1996WorthyM5
1997WrightM5
1998YorkM5
1999ZachariahM5
\n", - "

2000 rows × 3 columns

\n", - "
" - ], - "text/plain": [ - " name sex births\n", - "0 Mary F 7065\n", - "1 Anna F 2604\n", - "2 Emma F 2003\n", - "3 Elizabeth F 1939\n", - "4 Minnie F 1746\n", - "5 Margaret F 1578\n", - "6 Ida F 1472\n", - "7 Alice F 1414\n", - "8 Bertha F 1320\n", - "9 Sarah F 1288\n", - "10 Annie F 1258\n", - "11 Clara F 1226\n", - "12 Ella F 1156\n", - "13 Florence F 1063\n", - "14 Cora F 1045\n", - "15 Martha F 1040\n", - "16 Laura F 1012\n", - "17 Nellie F 995\n", - "18 Grace F 982\n", - "19 Carrie F 949\n", - "20 Maude F 858\n", - "21 Mabel F 808\n", - "22 Bessie F 796\n", - "23 Jennie F 793\n", - "24 Gertrude F 787\n", - "25 Julia F 783\n", - "26 Hattie F 769\n", - "27 Edith F 768\n", - "28 Mattie F 704\n", - "29 Rose F 700\n", - "... ... .. ...\n", - "1970 Philo M 5\n", - "1971 Phineas M 5\n", - "1972 Presley M 5\n", - "1973 Ransom M 5\n", - "1974 Reece M 5\n", - "1975 Rene M 5\n", - "1976 Roswell M 5\n", - "1977 Rowland M 5\n", - "1978 Sampson M 5\n", - "1979 Samual M 5\n", - "1980 Santos M 5\n", - "1981 Schuyler M 5\n", - "1982 Sheppard M 5\n", - "1983 Spurgeon M 5\n", - "1984 Starling M 5\n", - "1985 Sylvanus M 5\n", - "1986 Theadore M 5\n", - "1987 Theophile M 5\n", - "1988 Tilmon M 5\n", - "1989 Tommy M 5\n", - "1990 Unknown M 5\n", - "1991 Vann M 5\n", - "1992 Wes M 5\n", - "1993 Winston M 5\n", - "1994 Wood M 5\n", - "1995 Woodie M 5\n", - "1996 Worthy M 5\n", - "1997 Wright M 5\n", - "1998 York M 5\n", - "1999 Zachariah M 5\n", - "\n", - "[2000 rows x 3 columns]" - ] - }, - "execution_count": 2, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "names_1880 = pd.read_csv('babynames/yob1880.txt', names=[\"name\", \"sex\", \"births\"])\n", - "names_1880" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## number of births\n", - "\n", - "Now we want to start doing some analysis. `.groupby()` creates a new type of container that groups items. Here, we'll group by sex.\n", - "\n", - "See this:\n", - "http://pandas.pydata.org/pandas-docs/stable/groupby.html\n", - "https://community.modeanalytics.com/python/tutorial/pandas-groupby-and-python-lambda-functions/\n", - "\n", - "for a nice explanation of this method." - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "sex\n", - "F 90992\n", - "M 110490\n", - "Name: births, dtype: int64" - ] - }, - "execution_count": 3, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "names_1880.groupby(\"sex\")[\"births\"].sum()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Note that we can use a column name as a parameter of the object, so we can equivalently do this as:" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "sex\n", - "F 90992\n", - "M 110490\n", - "Name: births, dtype: int64" - ] - }, - "execution_count": 4, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "names_1880.groupby(\"sex\").births.sum()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "On its own, you can't print a `GroupBy` object. You need to do a transformation or filter on it to get back a `Series` or `DataFrame`." - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namebirths
sex
F942942
M10581058
\n", - "
" - ], - "text/plain": [ - " name births\n", - "sex \n", - "F 942 942\n", - "M 1058 1058" - ] - }, - "execution_count": 5, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "gb = names_1880.groupby(\"sex\")\n", - "gb.count()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "As we saw in the intro, we can propagate a scalar to all indices in the `DataFrame`. We'll use this to add a new column that represents the year:" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namesexbirthsyear
0MaryF70651880
1AnnaF26041880
2EmmaF20031880
3ElizabethF19391880
4MinnieF17461880
5MargaretF15781880
6IdaF14721880
7AliceF14141880
8BerthaF13201880
9SarahF12881880
10AnnieF12581880
11ClaraF12261880
12EllaF11561880
13FlorenceF10631880
14CoraF10451880
15MarthaF10401880
16LauraF10121880
17NellieF9951880
18GraceF9821880
19CarrieF9491880
20MaudeF8581880
21MabelF8081880
22BessieF7961880
23JennieF7931880
24GertrudeF7871880
25JuliaF7831880
26HattieF7691880
27EdithF7681880
28MattieF7041880
29RoseF7001880
...............
1970PhiloM51880
1971PhineasM51880
1972PresleyM51880
1973RansomM51880
1974ReeceM51880
1975ReneM51880
1976RoswellM51880
1977RowlandM51880
1978SampsonM51880
1979SamualM51880
1980SantosM51880
1981SchuylerM51880
1982SheppardM51880
1983SpurgeonM51880
1984StarlingM51880
1985SylvanusM51880
1986TheadoreM51880
1987TheophileM51880
1988TilmonM51880
1989TommyM51880
1990UnknownM51880
1991VannM51880
1992WesM51880
1993WinstonM51880
1994WoodM51880
1995WoodieM51880
1996WorthyM51880
1997WrightM51880
1998YorkM51880
1999ZachariahM51880
\n", - "

2000 rows × 4 columns

\n", - "
" - ], - "text/plain": [ - " name sex births year\n", - "0 Mary F 7065 1880\n", - "1 Anna F 2604 1880\n", - "2 Emma F 2003 1880\n", - "3 Elizabeth F 1939 1880\n", - "4 Minnie F 1746 1880\n", - "5 Margaret F 1578 1880\n", - "6 Ida F 1472 1880\n", - "7 Alice F 1414 1880\n", - "8 Bertha F 1320 1880\n", - "9 Sarah F 1288 1880\n", - "10 Annie F 1258 1880\n", - "11 Clara F 1226 1880\n", - "12 Ella F 1156 1880\n", - "13 Florence F 1063 1880\n", - "14 Cora F 1045 1880\n", - "15 Martha F 1040 1880\n", - "16 Laura F 1012 1880\n", - "17 Nellie F 995 1880\n", - "18 Grace F 982 1880\n", - "19 Carrie F 949 1880\n", - "20 Maude F 858 1880\n", - "21 Mabel F 808 1880\n", - "22 Bessie F 796 1880\n", - "23 Jennie F 793 1880\n", - "24 Gertrude F 787 1880\n", - "25 Julia F 783 1880\n", - "26 Hattie F 769 1880\n", - "27 Edith F 768 1880\n", - "28 Mattie F 704 1880\n", - "29 Rose F 700 1880\n", - "... ... .. ... ...\n", - "1970 Philo M 5 1880\n", - "1971 Phineas M 5 1880\n", - "1972 Presley M 5 1880\n", - "1973 Ransom M 5 1880\n", - "1974 Reece M 5 1880\n", - "1975 Rene M 5 1880\n", - "1976 Roswell M 5 1880\n", - "1977 Rowland M 5 1880\n", - "1978 Sampson M 5 1880\n", - "1979 Samual M 5 1880\n", - "1980 Santos M 5 1880\n", - "1981 Schuyler M 5 1880\n", - "1982 Sheppard M 5 1880\n", - "1983 Spurgeon M 5 1880\n", - "1984 Starling M 5 1880\n", - "1985 Sylvanus M 5 1880\n", - "1986 Theadore M 5 1880\n", - "1987 Theophile M 5 1880\n", - "1988 Tilmon M 5 1880\n", - "1989 Tommy M 5 1880\n", - "1990 Unknown M 5 1880\n", - "1991 Vann M 5 1880\n", - "1992 Wes M 5 1880\n", - "1993 Winston M 5 1880\n", - "1994 Wood M 5 1880\n", - "1995 Woodie M 5 1880\n", - "1996 Worthy M 5 1880\n", - "1997 Wright M 5 1880\n", - "1998 York M 5 1880\n", - "1999 Zachariah M 5 1880\n", - "\n", - "[2000 rows x 4 columns]" - ] - }, - "execution_count": 6, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "names_1880[\"year\"] = 1880\n", - "names_1880" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## all data sets\n", - "\n", - "Now we can read in all of the datasets. We will read them in one-by-one and add the \"year\" column to them. We'll keep a list of all the `DataFrame`s and then we'll use a pandas method to transform this list of `DataFrame`s into a single `DataFrame`" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "years = range(1880, 2016)\n", - "\n", - "pieces = []\n", - "columns = [\"name\", \"sex\", \"births\"]\n", - "\n", - "for yr in years:\n", - " frame = pd.read_csv(\"babynames/yob{}.txt\".format(yr), names=columns)\n", - " \n", - " # this creates a new column and gives all rows the same value -- the year\n", - " frame[\"year\"] = yr\n", - " pieces.append(frame)\n", - "\n", - "# create a single dataframe through concatenation -- ignore_index means that\n", - "# we don't care about the original line numbers\n", - "names = pd.concat(pieces, ignore_index=True)" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namesexbirthsyear
0MaryF70651880
1AnnaF26041880
2EmmaF20031880
3ElizabethF19391880
4MinnieF17461880
5MargaretF15781880
6IdaF14721880
7AliceF14141880
8BerthaF13201880
9SarahF12881880
10AnnieF12581880
11ClaraF12261880
12EllaF11561880
13FlorenceF10631880
14CoraF10451880
15MarthaF10401880
16LauraF10121880
17NellieF9951880
18GraceF9821880
19CarrieF9491880
20MaudeF8581880
21MabelF8081880
22BessieF7961880
23JennieF7931880
24GertrudeF7871880
25JuliaF7831880
26HattieF7691880
27EdithF7681880
28MattieF7041880
29RoseF7001880
...............
1858659ZavonM52015
1858660ZayM52015
1858661ZaylorM52015
1858662ZayquanM52015
1858663ZechariaM52015
1858664ZecharyaM52015
1858665ZeeM52015
1858666ZeevM52015
1858667ZeikM52015
1858668ZekariahM52015
1858669ZepplinM52015
1858670ZerekM52015
1858671ZeydM52015
1858672ZhiM52015
1858673ZielM52015
1858674ZihanM52015
1858675ZihaoM52015
1858676ZihengM52015
1858677ZimereM52015
1858678ZiyiM52015
1858679ZiyuM52015
1858680ZoelM52015
1858681ZoharM52015
1858682ZoltonM52015
1858683ZyahM52015
1858684ZykellM52015
1858685ZykingM52015
1858686ZykirM52015
1858687ZyrusM52015
1858688ZyusM52015
\n", - "

1858689 rows × 4 columns

\n", - "
" - ], - "text/plain": [ - " name sex births year\n", - "0 Mary F 7065 1880\n", - "1 Anna F 2604 1880\n", - "2 Emma F 2003 1880\n", - "3 Elizabeth F 1939 1880\n", - "4 Minnie F 1746 1880\n", - "5 Margaret F 1578 1880\n", - "6 Ida F 1472 1880\n", - "7 Alice F 1414 1880\n", - "8 Bertha F 1320 1880\n", - "9 Sarah F 1288 1880\n", - "10 Annie F 1258 1880\n", - "11 Clara F 1226 1880\n", - "12 Ella F 1156 1880\n", - "13 Florence F 1063 1880\n", - "14 Cora F 1045 1880\n", - "15 Martha F 1040 1880\n", - "16 Laura F 1012 1880\n", - "17 Nellie F 995 1880\n", - "18 Grace F 982 1880\n", - "19 Carrie F 949 1880\n", - "20 Maude F 858 1880\n", - "21 Mabel F 808 1880\n", - "22 Bessie F 796 1880\n", - "23 Jennie F 793 1880\n", - "24 Gertrude F 787 1880\n", - "25 Julia F 783 1880\n", - "26 Hattie F 769 1880\n", - "27 Edith F 768 1880\n", - "28 Mattie F 704 1880\n", - "29 Rose F 700 1880\n", - "... ... .. ... ...\n", - "1858659 Zavon M 5 2015\n", - "1858660 Zay M 5 2015\n", - "1858661 Zaylor M 5 2015\n", - "1858662 Zayquan M 5 2015\n", - "1858663 Zecharia M 5 2015\n", - "1858664 Zecharya M 5 2015\n", - "1858665 Zee M 5 2015\n", - "1858666 Zeev M 5 2015\n", - "1858667 Zeik M 5 2015\n", - "1858668 Zekariah M 5 2015\n", - "1858669 Zepplin M 5 2015\n", - "1858670 Zerek M 5 2015\n", - "1858671 Zeyd M 5 2015\n", - "1858672 Zhi M 5 2015\n", - "1858673 Ziel M 5 2015\n", - "1858674 Zihan M 5 2015\n", - "1858675 Zihao M 5 2015\n", - "1858676 Ziheng M 5 2015\n", - "1858677 Zimere M 5 2015\n", - "1858678 Ziyi M 5 2015\n", - "1858679 Ziyu M 5 2015\n", - "1858680 Zoel M 5 2015\n", - "1858681 Zohar M 5 2015\n", - "1858682 Zolton M 5 2015\n", - "1858683 Zyah M 5 2015\n", - "1858684 Zykell M 5 2015\n", - "1858685 Zyking M 5 2015\n", - "1858686 Zykir M 5 2015\n", - "1858687 Zyrus M 5 2015\n", - "1858688 Zyus M 5 2015\n", - "\n", - "[1858689 rows x 4 columns]" - ] - }, - "execution_count": 8, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "names" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## pivot tables" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "a _pivot table_ creates a new dataframe from our original one, usually summarizing the data in a new way. In particular, with a pivot table, we can create a new index and columns, with the data in the `DataFrame` reduced via some operation across another column.\n", - "\n", - "Here, the column that we are going to aggregate is \"births\", and the function will will use for the aggregating is `sum` (to sum over the names)." - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namesexbirthsyear
0MaryF70651880
1AnnaF26041880
2EmmaF20031880
3ElizabethF19391880
4MinnieF17461880
\n", - "
" - ], - "text/plain": [ - " name sex births year\n", - "0 Mary F 7065 1880\n", - "1 Anna F 2604 1880\n", - "2 Emma F 2003 1880\n", - "3 Elizabeth F 1939 1880\n", - "4 Minnie F 1746 1880" - ] - }, - "execution_count": 9, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "names.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "total_births = names.pivot_table(\"births\", index=\"year\", columns=\"sex\", aggfunc=sum)" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
sexFM
year
188090992110490
188191953100743
1882107848113686
1883112318104627
1884129020114443
1885133055107799
1886144534110785
1887145981101415
1888178624120850
1889178366110582
1890190376111025
1891185482101193
1892212341122036
1893212905112317
1894222922115770
1895233628117396
1896237918119568
1897234200112758
1898258770122691
1899233023106212
1900299822150490
1901239347106469
1902264075122659
1903261972119233
1904275371128125
1905291623132318
1906295304133157
1907318565146830
1908334315154343
1909347232163999
.........
198617147841840347
198717379811865804
198817799751912764
198918431752000082
199018978072052662
199118744892019523
199218433831996492
199318085081960486
199417851841931313
199517580101902971
199617523641893548
199717399631884324
199817660751910424
199917727881918984
200018147381962556
200117991991941401
200217953671939950
200318255091973612
200418343791983010
200518456401995115
200618987762052652
200719197752072505
200818876602036750
200918334611979895
201017734401914629
201117544241894262
201217552541890889
201317475441883945
201417772421910876
201517693251898858
\n", - "

136 rows × 2 columns

\n", - "
" - ], - "text/plain": [ - "sex F M\n", - "year \n", - "1880 90992 110490\n", - "1881 91953 100743\n", - "1882 107848 113686\n", - "1883 112318 104627\n", - "1884 129020 114443\n", - "1885 133055 107799\n", - "1886 144534 110785\n", - "1887 145981 101415\n", - "1888 178624 120850\n", - "1889 178366 110582\n", - "1890 190376 111025\n", - "1891 185482 101193\n", - "1892 212341 122036\n", - "1893 212905 112317\n", - "1894 222922 115770\n", - "1895 233628 117396\n", - "1896 237918 119568\n", - "1897 234200 112758\n", - "1898 258770 122691\n", - "1899 233023 106212\n", - "1900 299822 150490\n", - "1901 239347 106469\n", - "1902 264075 122659\n", - "1903 261972 119233\n", - "1904 275371 128125\n", - "1905 291623 132318\n", - "1906 295304 133157\n", - "1907 318565 146830\n", - "1908 334315 154343\n", - "1909 347232 163999\n", - "... ... ...\n", - "1986 1714784 1840347\n", - "1987 1737981 1865804\n", - "1988 1779975 1912764\n", - "1989 1843175 2000082\n", - "1990 1897807 2052662\n", - "1991 1874489 2019523\n", - "1992 1843383 1996492\n", - "1993 1808508 1960486\n", - "1994 1785184 1931313\n", - "1995 1758010 1902971\n", - "1996 1752364 1893548\n", - "1997 1739963 1884324\n", - "1998 1766075 1910424\n", - "1999 1772788 1918984\n", - "2000 1814738 1962556\n", - "2001 1799199 1941401\n", - "2002 1795367 1939950\n", - "2003 1825509 1973612\n", - "2004 1834379 1983010\n", - "2005 1845640 1995115\n", - "2006 1898776 2052652\n", - "2007 1919775 2072505\n", - "2008 1887660 2036750\n", - "2009 1833461 1979895\n", - "2010 1773440 1914629\n", - "2011 1754424 1894262\n", - "2012 1755254 1890889\n", - "2013 1747544 1883945\n", - "2014 1777242 1910876\n", - "2015 1769325 1898858\n", - "\n", - "[136 rows x 2 columns]" - ] - }, - "execution_count": 11, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "total_births" - ] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 12, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "\n", - "text/plain": [ - "" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "total_births.plot()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## `.apply()` and new columns" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Now we'll use `.groupby()` again to allow use to derive a new column -- the fraction of the births with the name specified by the index. \n", - "\n", - "`apply()` uses what Pandas calls the _split-apply-combine_ rules, e.g., it splits the data into groups, applies your function, and then intelligently concatenates it back together. Here, the result will be a `DataFrame` with the original information and this new column." - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [], - "source": [ - "def add_prop(group):\n", - " group[\"prop\"] = group[\"births\"]/group[\"births\"].sum()\n", - " return group\n", - "\n", - "names = names.groupby([\"year\", \"sex\"]).apply(add_prop)" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namesexbirthsyearprop
0MaryF706518800.077644
1AnnaF260418800.028618
2EmmaF200318800.022013
3ElizabethF193918800.021310
4MinnieF174618800.019189
5MargaretF157818800.017342
6IdaF147218800.016177
7AliceF141418800.015540
8BerthaF132018800.014507
9SarahF128818800.014155
10AnnieF125818800.013825
11ClaraF122618800.013474
12EllaF115618800.012704
13FlorenceF106318800.011682
14CoraF104518800.011485
15MarthaF104018800.011430
16LauraF101218800.011122
17NellieF99518800.010935
18GraceF98218800.010792
19CarrieF94918800.010429
20MaudeF85818800.009429
21MabelF80818800.008880
22BessieF79618800.008748
23JennieF79318800.008715
24GertrudeF78718800.008649
25JuliaF78318800.008605
26HattieF76918800.008451
27EdithF76818800.008440
28MattieF70418800.007737
29RoseF70018800.007693
..................
1858659ZavonM520150.000003
1858660ZayM520150.000003
1858661ZaylorM520150.000003
1858662ZayquanM520150.000003
1858663ZechariaM520150.000003
1858664ZecharyaM520150.000003
1858665ZeeM520150.000003
1858666ZeevM520150.000003
1858667ZeikM520150.000003
1858668ZekariahM520150.000003
1858669ZepplinM520150.000003
1858670ZerekM520150.000003
1858671ZeydM520150.000003
1858672ZhiM520150.000003
1858673ZielM520150.000003
1858674ZihanM520150.000003
1858675ZihaoM520150.000003
1858676ZihengM520150.000003
1858677ZimereM520150.000003
1858678ZiyiM520150.000003
1858679ZiyuM520150.000003
1858680ZoelM520150.000003
1858681ZoharM520150.000003
1858682ZoltonM520150.000003
1858683ZyahM520150.000003
1858684ZykellM520150.000003
1858685ZykingM520150.000003
1858686ZykirM520150.000003
1858687ZyrusM520150.000003
1858688ZyusM520150.000003
\n", - "

1858689 rows × 5 columns

\n", - "
" - ], - "text/plain": [ - " name sex births year prop\n", - "0 Mary F 7065 1880 0.077644\n", - "1 Anna F 2604 1880 0.028618\n", - "2 Emma F 2003 1880 0.022013\n", - "3 Elizabeth F 1939 1880 0.021310\n", - "4 Minnie F 1746 1880 0.019189\n", - "5 Margaret F 1578 1880 0.017342\n", - "6 Ida F 1472 1880 0.016177\n", - "7 Alice F 1414 1880 0.015540\n", - "8 Bertha F 1320 1880 0.014507\n", - "9 Sarah F 1288 1880 0.014155\n", - "10 Annie F 1258 1880 0.013825\n", - "11 Clara F 1226 1880 0.013474\n", - "12 Ella F 1156 1880 0.012704\n", - "13 Florence F 1063 1880 0.011682\n", - "14 Cora F 1045 1880 0.011485\n", - "15 Martha F 1040 1880 0.011430\n", - "16 Laura F 1012 1880 0.011122\n", - "17 Nellie F 995 1880 0.010935\n", - "18 Grace F 982 1880 0.010792\n", - "19 Carrie F 949 1880 0.010429\n", - "20 Maude F 858 1880 0.009429\n", - "21 Mabel F 808 1880 0.008880\n", - "22 Bessie F 796 1880 0.008748\n", - "23 Jennie F 793 1880 0.008715\n", - "24 Gertrude F 787 1880 0.008649\n", - "25 Julia F 783 1880 0.008605\n", - "26 Hattie F 769 1880 0.008451\n", - "27 Edith F 768 1880 0.008440\n", - "28 Mattie F 704 1880 0.007737\n", - "29 Rose F 700 1880 0.007693\n", - "... ... .. ... ... ...\n", - "1858659 Zavon M 5 2015 0.000003\n", - "1858660 Zay M 5 2015 0.000003\n", - "1858661 Zaylor M 5 2015 0.000003\n", - "1858662 Zayquan M 5 2015 0.000003\n", - "1858663 Zecharia M 5 2015 0.000003\n", - "1858664 Zecharya M 5 2015 0.000003\n", - "1858665 Zee M 5 2015 0.000003\n", - "1858666 Zeev M 5 2015 0.000003\n", - "1858667 Zeik M 5 2015 0.000003\n", - "1858668 Zekariah M 5 2015 0.000003\n", - "1858669 Zepplin M 5 2015 0.000003\n", - "1858670 Zerek M 5 2015 0.000003\n", - "1858671 Zeyd M 5 2015 0.000003\n", - "1858672 Zhi M 5 2015 0.000003\n", - "1858673 Ziel M 5 2015 0.000003\n", - "1858674 Zihan M 5 2015 0.000003\n", - "1858675 Zihao M 5 2015 0.000003\n", - "1858676 Ziheng M 5 2015 0.000003\n", - "1858677 Zimere M 5 2015 0.000003\n", - "1858678 Ziyi M 5 2015 0.000003\n", - "1858679 Ziyu M 5 2015 0.000003\n", - "1858680 Zoel M 5 2015 0.000003\n", - "1858681 Zohar M 5 2015 0.000003\n", - "1858682 Zolton M 5 2015 0.000003\n", - "1858683 Zyah M 5 2015 0.000003\n", - "1858684 Zykell M 5 2015 0.000003\n", - "1858685 Zyking M 5 2015 0.000003\n", - "1858686 Zykir M 5 2015 0.000003\n", - "1858687 Zyrus M 5 2015 0.000003\n", - "1858688 Zyus M 5 2015 0.000003\n", - "\n", - "[1858689 rows x 5 columns]" - ] - }, - "execution_count": 14, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "names" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Q1: Sanity check\n", - "\n", - "Verify that within each of the groups we just used above that the \"prop\" column sums to 1 (it should be close, to roundoff). The `np.allclose()` function might be useful here." - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Now we will group by \"year\" and \"sex\" and then sort by births to get just the top N most popular names.\n", - "\n", - "Notice that we simply append any additional arguments to our apply function after the function name (this is an example of the `**kwargs` behavior in python" - ] - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [], - "source": [ - "def get_top(group, N=1000):\n", - " return group.sort_values(by=\"births\", ascending=False)[:N]\n", - "\n", - "grouped = names.groupby([\"year\", \"sex\"])\n", - "top = grouped.apply(get_top, 1000)" - ] - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namesexbirthsyearprop
yearsex
1880F0MaryF706518800.077644
1AnnaF260418800.028618
2EmmaF200318800.022013
3ElizabethF193918800.021310
4MinnieF174618800.019189
5MargaretF157818800.017342
6IdaF147218800.016177
7AliceF141418800.015540
8BerthaF132018800.014507
9SarahF128818800.014155
10AnnieF125818800.013825
11ClaraF122618800.013474
12EllaF115618800.012704
13FlorenceF106318800.011682
14CoraF104518800.011485
15MarthaF104018800.011430
16LauraF101218800.011122
17NellieF99518800.010935
18GraceF98218800.010792
19CarrieF94918800.010429
20MaudeF85818800.009429
21MabelF80818800.008880
22BessieF79618800.008748
23JennieF79318800.008715
24GertrudeF78718800.008649
25JuliaF78318800.008605
26HattieF76918800.008451
27EdithF76818800.008440
28MattieF70418800.007737
29RoseF70018800.007693
........................
2015M1845703YadielM21120150.000111
1845704YahyaM21120150.000111
1845700AarushM21120150.000111
1845702RobinM21120150.000111
1845701DeangeloM21120150.000111
1845705BodenM20920150.000110
1845707KyeM20920150.000110
1845708KylenM20920150.000110
1845709ToddM20920150.000110
1845710TrumanM20920150.000110
1845706EanM20920150.000110
1845712GilbertM20820150.000110
1845713HaidenM20820150.000110
1845711ChevyM20820150.000110
1845715DangeloM20720150.000109
1845716JuelzM20720150.000109
1845717OsvaldoM20720150.000109
1845714BrixtonM20720150.000109
1845718BishopM20620150.000108
1845719FreddyM20620150.000108
1845720ReaganM20620150.000108
1845721FrankieM20520150.000108
1845722MalakiM20520150.000108
1845725JayvionM20420150.000107
1845726LeroyM20420150.000107
1845724DeshawnM20420150.000107
1845723CamrenM20420150.000107
1845728JaydonM20320150.000107
1845727BriarM20320150.000107
1845730AyanM20220150.000106
\n", - "

271877 rows × 5 columns

\n", - "
" - ], - "text/plain": [ - " name sex births year prop\n", - "year sex \n", - "1880 F 0 Mary F 7065 1880 0.077644\n", - " 1 Anna F 2604 1880 0.028618\n", - " 2 Emma F 2003 1880 0.022013\n", - " 3 Elizabeth F 1939 1880 0.021310\n", - " 4 Minnie F 1746 1880 0.019189\n", - " 5 Margaret F 1578 1880 0.017342\n", - " 6 Ida F 1472 1880 0.016177\n", - " 7 Alice F 1414 1880 0.015540\n", - " 8 Bertha F 1320 1880 0.014507\n", - " 9 Sarah F 1288 1880 0.014155\n", - " 10 Annie F 1258 1880 0.013825\n", - " 11 Clara F 1226 1880 0.013474\n", - " 12 Ella F 1156 1880 0.012704\n", - " 13 Florence F 1063 1880 0.011682\n", - " 14 Cora F 1045 1880 0.011485\n", - " 15 Martha F 1040 1880 0.011430\n", - " 16 Laura F 1012 1880 0.011122\n", - " 17 Nellie F 995 1880 0.010935\n", - " 18 Grace F 982 1880 0.010792\n", - " 19 Carrie F 949 1880 0.010429\n", - " 20 Maude F 858 1880 0.009429\n", - " 21 Mabel F 808 1880 0.008880\n", - " 22 Bessie F 796 1880 0.008748\n", - " 23 Jennie F 793 1880 0.008715\n", - " 24 Gertrude F 787 1880 0.008649\n", - " 25 Julia F 783 1880 0.008605\n", - " 26 Hattie F 769 1880 0.008451\n", - " 27 Edith F 768 1880 0.008440\n", - " 28 Mattie F 704 1880 0.007737\n", - " 29 Rose F 700 1880 0.007693\n", - "... ... .. ... ... ...\n", - "2015 M 1845703 Yadiel M 211 2015 0.000111\n", - " 1845704 Yahya M 211 2015 0.000111\n", - " 1845700 Aarush M 211 2015 0.000111\n", - " 1845702 Robin M 211 2015 0.000111\n", - " 1845701 Deangelo M 211 2015 0.000111\n", - " 1845705 Boden M 209 2015 0.000110\n", - " 1845707 Kye M 209 2015 0.000110\n", - " 1845708 Kylen M 209 2015 0.000110\n", - " 1845709 Todd M 209 2015 0.000110\n", - " 1845710 Truman M 209 2015 0.000110\n", - " 1845706 Ean M 209 2015 0.000110\n", - " 1845712 Gilbert M 208 2015 0.000110\n", - " 1845713 Haiden M 208 2015 0.000110\n", - " 1845711 Chevy M 208 2015 0.000110\n", - " 1845715 Dangelo M 207 2015 0.000109\n", - " 1845716 Juelz M 207 2015 0.000109\n", - " 1845717 Osvaldo M 207 2015 0.000109\n", - " 1845714 Brixton M 207 2015 0.000109\n", - " 1845718 Bishop M 206 2015 0.000108\n", - " 1845719 Freddy M 206 2015 0.000108\n", - " 1845720 Reagan M 206 2015 0.000108\n", - " 1845721 Frankie M 205 2015 0.000108\n", - " 1845722 Malaki M 205 2015 0.000108\n", - " 1845725 Jayvion M 204 2015 0.000107\n", - " 1845726 Leroy M 204 2015 0.000107\n", - " 1845724 Deshawn M 204 2015 0.000107\n", - " 1845723 Camren M 204 2015 0.000107\n", - " 1845728 Jaydon M 203 2015 0.000107\n", - " 1845727 Briar M 203 2015 0.000107\n", - " 1845730 Ayan M 202 2015 0.000106\n", - "\n", - "[271877 rows x 5 columns]" - ] - }, - "execution_count": 16, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "top" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Q2: split by sex\n", - "\n", - "create two new dataframes, one `boys` with just those in `top` that are \"M\" and one `girls` with those in `top` who are \"F\"" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": {}, - "outputs": [ - { - "ename": "NameError", - "evalue": "name 'boys' is not defined", - "output_type": "error", - "traceback": [ - "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", - "\u001b[0;31mNameError\u001b[0m Traceback (most recent call last)", - "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m()\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0mboys\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", - "\u001b[0;31mNameError\u001b[0m: name 'boys' is not defined" - ] - } - ], - "source": [ - "boys" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## More analysis" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "How many times does each name appear, by year? This dataframe is the total number of births by year and name" - ] - }, - { - "cell_type": "code", - "execution_count": 18, - "metadata": {}, - "outputs": [ - { - "name": "stderr", - "output_type": "stream", - "text": [ - "/usr/lib64/python3.6/site-packages/pandas/core/reshape/pivot.py:135: FutureWarning: 'year' is both a column name and an index level.\n", - "Defaulting to column but this will raise an ambiguity error in a future version\n", - " grouped = data.groupby(keys)\n" - ] - } - ], - "source": [ - "total_births = top.pivot_table(\"births\", index=\"year\", columns=\"name\", aggfunc=sum)" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
nameAadenAaliyahAanyaAaravAaronAarushAbAbagailAbbAbbey...ZoaZoeZoeyZoieZolaZollieZonaZoraZulaZuri
year
1880NaNNaNNaNNaN102.0NaNNaNNaNNaNNaN...8.023.0NaNNaN7.0NaN8.028.027.0NaN
1881NaNNaNNaNNaN94.0NaNNaNNaNNaNNaN...NaN22.0NaNNaN10.0NaN9.021.027.0NaN
1882NaNNaNNaNNaN85.0NaNNaNNaNNaNNaN...8.025.0NaNNaN9.0NaN17.032.021.0NaN
1883NaNNaNNaNNaN105.0NaNNaNNaNNaNNaN...NaN23.0NaNNaN10.0NaN11.035.025.0NaN
1884NaNNaNNaNNaN97.0NaNNaNNaNNaNNaN...13.031.0NaNNaN14.06.08.058.027.0NaN
1885NaNNaNNaNNaN88.0NaN6.0NaNNaNNaN...6.027.0NaNNaN12.06.014.048.038.0NaN
1886NaNNaNNaNNaN86.0NaNNaNNaNNaNNaN...13.025.0NaNNaN8.0NaN20.052.043.0NaN
1887NaNNaNNaNNaN78.0NaNNaNNaNNaNNaN...9.034.0NaNNaN23.0NaN28.046.033.0NaN
1888NaNNaNNaNNaN90.0NaNNaNNaNNaNNaN...11.042.0NaNNaN23.07.030.042.045.0NaN
1889NaNNaNNaNNaN85.0NaNNaNNaNNaNNaN...14.029.0NaNNaN22.0NaN29.053.055.0NaN
1890NaNNaNNaNNaN96.0NaNNaNNaN6.0NaN...NaN42.0NaNNaN32.07.027.060.065.0NaN
1891NaNNaNNaNNaN69.0NaNNaNNaNNaNNaN...NaN34.0NaNNaN29.06.014.052.045.0NaN
1892NaNNaNNaNNaN95.0NaNNaNNaNNaNNaN...NaN34.0NaNNaN27.0NaN25.066.053.0NaN
1893NaNNaNNaNNaN81.0NaNNaNNaNNaNNaN...NaN23.0NaNNaN34.06.015.067.070.0NaN
1894NaNNaNNaNNaN79.0NaNNaNNaNNaNNaN...NaN28.0NaNNaN51.0NaN23.066.064.0NaN
1895NaNNaNNaNNaN94.0NaNNaNNaNNaNNaN...NaN34.0NaNNaN60.011.038.055.055.0NaN
1896NaNNaNNaNNaN69.0NaNNaNNaNNaNNaN...NaN36.0NaNNaN47.0NaN38.072.065.0NaN
1897NaNNaNNaNNaN87.0NaNNaNNaNNaNNaN...NaN35.0NaNNaN51.0NaN28.067.079.0NaN
1898NaNNaNNaNNaN89.0NaNNaNNaNNaNNaN...NaN30.0NaNNaN62.0NaN28.065.083.0NaN
1899NaNNaNNaNNaN71.0NaNNaNNaNNaNNaN...NaN27.0NaNNaN49.06.031.056.060.0NaN
1900NaNNaNNaNNaN103.0NaNNaNNaNNaNNaN...NaN26.0NaNNaN48.09.044.099.071.0NaN
1901NaNNaNNaNNaN80.0NaNNaNNaNNaNNaN...NaN26.0NaNNaN56.0NaN31.058.057.0NaN
1902NaNNaNNaNNaN78.0NaNNaNNaNNaNNaN...NaN34.0NaNNaN58.0NaN23.058.066.0NaN
1903NaNNaNNaNNaN93.0NaNNaNNaNNaNNaN...NaN19.0NaNNaN64.0NaN41.083.074.0NaN
1904NaNNaNNaNNaN117.0NaNNaNNaNNaNNaN...NaN27.0NaNNaN46.0NaN35.054.074.0NaN
1905NaNNaNNaNNaN96.0NaNNaNNaNNaNNaN...NaN24.0NaNNaN66.08.024.055.061.0NaN
1906NaNNaNNaNNaN96.0NaNNaNNaNNaNNaN...NaN19.0NaNNaN59.0NaN37.064.058.0NaN
1907NaNNaNNaNNaN130.0NaNNaNNaNNaNNaN...NaN19.0NaNNaN53.011.039.092.072.0NaN
1908NaNNaNNaNNaN114.0NaNNaNNaNNaNNaN...NaN23.0NaNNaN70.0NaN31.059.053.0NaN
1909NaNNaNNaNNaN142.0NaNNaNNaNNaNNaN...NaN22.0NaNNaN59.0NaN39.057.076.0NaN
..................................................................
1986NaNNaNNaNNaN12690.0NaNNaNNaNNaN370.0...NaN213.0NaNNaNNaNNaNNaNNaNNaNNaN
1987NaNNaNNaNNaN12678.0NaNNaNNaNNaN327.0...NaN247.0NaNNaNNaNNaNNaNNaNNaNNaN
1988NaNNaNNaNNaN14397.0NaNNaNNaNNaN404.0...NaN241.0NaNNaNNaNNaNNaNNaNNaNNaN
1989NaNNaNNaNNaN15314.0NaNNaNNaNNaN470.0...NaN376.0NaNNaNNaNNaNNaNNaNNaNNaN
1990NaNNaNNaNNaN14550.0NaNNaNNaNNaN507.0...NaN478.0NaNNaNNaNNaNNaNNaNNaNNaN
1991NaNNaNNaNNaN14240.0NaNNaNNaNNaN451.0...NaN722.0NaNNaNNaNNaNNaNNaNNaNNaN
1992NaNNaNNaNNaN14506.0NaNNaNNaNNaN430.0...NaN981.0NaNNaNNaNNaNNaNNaNNaNNaN
1993NaNNaNNaNNaN13825.0NaNNaNNaNNaN503.0...NaN1193.0NaNNaNNaNNaNNaNNaNNaNNaN
1994NaN1451.0NaNNaN14380.0NaNNaNNaNNaN597.0...NaN1333.0NaNNaNNaNNaNNaNNaNNaNNaN
1995NaN1255.0NaNNaN13286.0NaNNaNNaNNaN549.0...NaN1726.0219.0NaNNaNNaNNaNNaNNaNNaN
1996NaN831.0NaNNaN11969.0NaNNaNNaNNaN552.0...NaN2064.0339.0NaNNaNNaNNaNNaNNaNNaN
1997NaN1738.0NaNNaN11166.0NaNNaNNaNNaN645.0...NaN2362.0407.0NaNNaNNaNNaNNaNNaNNaN
1998NaN1399.0NaNNaN10544.0NaNNaNNaNNaN661.0...NaN2692.0478.0225.0NaNNaNNaNNaNNaNNaN
1999NaN1088.0NaNNaN9852.0NaNNaN211.0NaN710.0...NaN3237.0563.0257.0NaNNaNNaNNaNNaNNaN
2000NaN1495.0NaNNaN9551.0NaNNaN222.0NaN660.0...NaN3785.0691.0320.0NaNNaNNaNNaNNaNNaN
2001NaN3352.0NaNNaN9534.0NaNNaN244.0NaN687.0...NaN4644.0822.0439.0NaNNaNNaNNaNNaNNaN
2002NaN4778.0NaNNaN8999.0NaNNaN256.0NaN600.0...NaN4884.01182.0438.0NaNNaNNaNNaNNaNNaN
2003NaN3671.0NaNNaN8859.0NaNNaN276.0NaN625.0...NaN5085.01469.0449.0NaNNaNNaNNaNNaNNaN
2004NaN3486.0NaNNaN8386.0NaNNaN258.0NaN504.0...NaN5362.01622.0515.0NaNNaNNaNNaNNaNNaN
2005NaN3456.0NaNNaN7799.0NaNNaN287.0NaN452.0...NaN4957.02270.0502.0NaNNaNNaNNaNNaNNaN
2006NaN3742.0NaNNaN8291.0NaNNaN298.0NaN404.0...NaN5152.02848.0531.0NaNNaNNaNNaNNaNNaN
2007NaN3952.0NaNNaN8933.0NaNNaN313.0NaN349.0...NaN4931.03031.0527.0NaNNaNNaNNaNNaNNaN
2008956.04038.0NaN219.08536.0NaNNaN320.0NaN344.0...NaN4779.03445.0493.0NaNNaNNaNNaNNaNNaN
20091267.04366.0NaN270.07966.0NaNNaN297.0NaN307.0...NaN5144.03991.0499.0NaNNaNNaNNaNNaNNaN
2010450.04659.0NaN438.07458.0227.0NaN281.0NaN299.0...NaN6263.05200.0508.0NaNNaNNaNNaNNaN259.0
2011274.05105.0NaN436.07610.0NaNNaNNaNNaN287.0...NaN6294.06394.0523.0NaNNaNNaNNaNNaN313.0
2012223.05499.0NaN435.07519.0NaNNaNNaNNaNNaN...NaN6445.07457.0516.0NaNNaNNaNNaNNaN434.0
2013203.05217.0NaN495.07289.0NaNNaNNaNNaNNaN...NaN5967.07224.0431.0NaNNaNNaNNaNNaN566.0
2014237.04871.0266.0531.07368.0NaNNaNNaNNaNNaN...NaN5857.07384.0365.0NaNNaNNaNNaNNaN664.0
2015296.04836.0NaN539.07113.0211.0NaNNaNNaNNaN...NaN5995.06900.0367.0NaNNaNNaNNaNNaN709.0
\n", - "

136 rows × 7062 columns

\n", - "
" - ], - "text/plain": [ - "name Aaden Aaliyah Aanya Aarav Aaron Aarush Ab Abagail Abb \\\n", - "year \n", - "1880 NaN NaN NaN NaN 102.0 NaN NaN NaN NaN \n", - "1881 NaN NaN NaN NaN 94.0 NaN NaN NaN NaN \n", - "1882 NaN NaN NaN NaN 85.0 NaN NaN NaN NaN \n", - "1883 NaN NaN NaN NaN 105.0 NaN NaN NaN NaN \n", - "1884 NaN NaN NaN NaN 97.0 NaN NaN NaN NaN \n", - "1885 NaN NaN NaN NaN 88.0 NaN 6.0 NaN NaN \n", - "1886 NaN NaN NaN NaN 86.0 NaN NaN NaN NaN \n", - "1887 NaN NaN NaN NaN 78.0 NaN NaN NaN NaN \n", - "1888 NaN NaN NaN NaN 90.0 NaN NaN NaN NaN \n", - "1889 NaN NaN NaN NaN 85.0 NaN NaN NaN NaN \n", - "1890 NaN NaN NaN NaN 96.0 NaN NaN NaN 6.0 \n", - "1891 NaN NaN NaN NaN 69.0 NaN NaN NaN NaN \n", - "1892 NaN NaN NaN NaN 95.0 NaN NaN NaN NaN \n", - "1893 NaN NaN NaN NaN 81.0 NaN NaN NaN NaN \n", - "1894 NaN NaN NaN NaN 79.0 NaN NaN NaN NaN \n", - "1895 NaN NaN NaN NaN 94.0 NaN NaN NaN NaN \n", - "1896 NaN NaN NaN NaN 69.0 NaN NaN NaN NaN \n", - "1897 NaN NaN NaN NaN 87.0 NaN NaN NaN NaN \n", - "1898 NaN NaN NaN NaN 89.0 NaN NaN NaN NaN \n", - "1899 NaN NaN NaN NaN 71.0 NaN NaN NaN NaN \n", - "1900 NaN NaN NaN NaN 103.0 NaN NaN NaN NaN \n", - "1901 NaN NaN NaN NaN 80.0 NaN NaN NaN NaN \n", - "1902 NaN NaN NaN NaN 78.0 NaN NaN NaN NaN \n", - "1903 NaN NaN NaN NaN 93.0 NaN NaN NaN NaN \n", - "1904 NaN NaN NaN NaN 117.0 NaN NaN NaN NaN \n", - "1905 NaN NaN NaN NaN 96.0 NaN NaN NaN NaN \n", - "1906 NaN NaN NaN NaN 96.0 NaN NaN NaN NaN \n", - "1907 NaN NaN NaN NaN 130.0 NaN NaN NaN NaN \n", - "1908 NaN NaN NaN NaN 114.0 NaN NaN NaN NaN \n", - "1909 NaN NaN NaN NaN 142.0 NaN NaN NaN NaN \n", - "... ... ... ... ... ... ... ... ... ... \n", - "1986 NaN NaN NaN NaN 12690.0 NaN NaN NaN NaN \n", - "1987 NaN NaN NaN NaN 12678.0 NaN NaN NaN NaN \n", - "1988 NaN NaN NaN NaN 14397.0 NaN NaN NaN NaN \n", - "1989 NaN NaN NaN NaN 15314.0 NaN NaN NaN NaN \n", - "1990 NaN NaN NaN NaN 14550.0 NaN NaN NaN NaN \n", - "1991 NaN NaN NaN NaN 14240.0 NaN NaN NaN NaN \n", - "1992 NaN NaN NaN NaN 14506.0 NaN NaN NaN NaN \n", - "1993 NaN NaN NaN NaN 13825.0 NaN NaN NaN NaN \n", - "1994 NaN 1451.0 NaN NaN 14380.0 NaN NaN NaN NaN \n", - "1995 NaN 1255.0 NaN NaN 13286.0 NaN NaN NaN NaN \n", - "1996 NaN 831.0 NaN NaN 11969.0 NaN NaN NaN NaN \n", - "1997 NaN 1738.0 NaN NaN 11166.0 NaN NaN NaN NaN \n", - "1998 NaN 1399.0 NaN NaN 10544.0 NaN NaN NaN NaN \n", - "1999 NaN 1088.0 NaN NaN 9852.0 NaN NaN 211.0 NaN \n", - "2000 NaN 1495.0 NaN NaN 9551.0 NaN NaN 222.0 NaN \n", - "2001 NaN 3352.0 NaN NaN 9534.0 NaN NaN 244.0 NaN \n", - "2002 NaN 4778.0 NaN NaN 8999.0 NaN NaN 256.0 NaN \n", - "2003 NaN 3671.0 NaN NaN 8859.0 NaN NaN 276.0 NaN \n", - "2004 NaN 3486.0 NaN NaN 8386.0 NaN NaN 258.0 NaN \n", - "2005 NaN 3456.0 NaN NaN 7799.0 NaN NaN 287.0 NaN \n", - "2006 NaN 3742.0 NaN NaN 8291.0 NaN NaN 298.0 NaN \n", - "2007 NaN 3952.0 NaN NaN 8933.0 NaN NaN 313.0 NaN \n", - "2008 956.0 4038.0 NaN 219.0 8536.0 NaN NaN 320.0 NaN \n", - "2009 1267.0 4366.0 NaN 270.0 7966.0 NaN NaN 297.0 NaN \n", - "2010 450.0 4659.0 NaN 438.0 7458.0 227.0 NaN 281.0 NaN \n", - "2011 274.0 5105.0 NaN 436.0 7610.0 NaN NaN NaN NaN \n", - "2012 223.0 5499.0 NaN 435.0 7519.0 NaN NaN NaN NaN \n", - "2013 203.0 5217.0 NaN 495.0 7289.0 NaN NaN NaN NaN \n", - "2014 237.0 4871.0 266.0 531.0 7368.0 NaN NaN NaN NaN \n", - "2015 296.0 4836.0 NaN 539.0 7113.0 211.0 NaN NaN NaN \n", - "\n", - "name Abbey ... Zoa Zoe Zoey Zoie Zola Zollie Zona Zora \\\n", - "year ... \n", - "1880 NaN ... 8.0 23.0 NaN NaN 7.0 NaN 8.0 28.0 \n", - "1881 NaN ... NaN 22.0 NaN NaN 10.0 NaN 9.0 21.0 \n", - "1882 NaN ... 8.0 25.0 NaN NaN 9.0 NaN 17.0 32.0 \n", - "1883 NaN ... NaN 23.0 NaN NaN 10.0 NaN 11.0 35.0 \n", - "1884 NaN ... 13.0 31.0 NaN NaN 14.0 6.0 8.0 58.0 \n", - "1885 NaN ... 6.0 27.0 NaN NaN 12.0 6.0 14.0 48.0 \n", - "1886 NaN ... 13.0 25.0 NaN NaN 8.0 NaN 20.0 52.0 \n", - "1887 NaN ... 9.0 34.0 NaN NaN 23.0 NaN 28.0 46.0 \n", - "1888 NaN ... 11.0 42.0 NaN NaN 23.0 7.0 30.0 42.0 \n", - "1889 NaN ... 14.0 29.0 NaN NaN 22.0 NaN 29.0 53.0 \n", - "1890 NaN ... NaN 42.0 NaN NaN 32.0 7.0 27.0 60.0 \n", - "1891 NaN ... NaN 34.0 NaN NaN 29.0 6.0 14.0 52.0 \n", - "1892 NaN ... NaN 34.0 NaN NaN 27.0 NaN 25.0 66.0 \n", - "1893 NaN ... NaN 23.0 NaN NaN 34.0 6.0 15.0 67.0 \n", - "1894 NaN ... NaN 28.0 NaN NaN 51.0 NaN 23.0 66.0 \n", - "1895 NaN ... NaN 34.0 NaN NaN 60.0 11.0 38.0 55.0 \n", - "1896 NaN ... NaN 36.0 NaN NaN 47.0 NaN 38.0 72.0 \n", - "1897 NaN ... NaN 35.0 NaN NaN 51.0 NaN 28.0 67.0 \n", - "1898 NaN ... NaN 30.0 NaN NaN 62.0 NaN 28.0 65.0 \n", - "1899 NaN ... NaN 27.0 NaN NaN 49.0 6.0 31.0 56.0 \n", - "1900 NaN ... NaN 26.0 NaN NaN 48.0 9.0 44.0 99.0 \n", - "1901 NaN ... NaN 26.0 NaN NaN 56.0 NaN 31.0 58.0 \n", - "1902 NaN ... NaN 34.0 NaN NaN 58.0 NaN 23.0 58.0 \n", - "1903 NaN ... NaN 19.0 NaN NaN 64.0 NaN 41.0 83.0 \n", - "1904 NaN ... NaN 27.0 NaN NaN 46.0 NaN 35.0 54.0 \n", - "1905 NaN ... NaN 24.0 NaN NaN 66.0 8.0 24.0 55.0 \n", - "1906 NaN ... NaN 19.0 NaN NaN 59.0 NaN 37.0 64.0 \n", - "1907 NaN ... NaN 19.0 NaN NaN 53.0 11.0 39.0 92.0 \n", - "1908 NaN ... NaN 23.0 NaN NaN 70.0 NaN 31.0 59.0 \n", - "1909 NaN ... NaN 22.0 NaN NaN 59.0 NaN 39.0 57.0 \n", - "... ... ... ... ... ... ... ... ... ... ... \n", - "1986 370.0 ... NaN 213.0 NaN NaN NaN NaN NaN NaN \n", - "1987 327.0 ... NaN 247.0 NaN NaN NaN NaN NaN NaN \n", - "1988 404.0 ... NaN 241.0 NaN NaN NaN NaN NaN NaN \n", - "1989 470.0 ... NaN 376.0 NaN NaN NaN NaN NaN NaN \n", - "1990 507.0 ... NaN 478.0 NaN NaN NaN NaN NaN NaN \n", - "1991 451.0 ... NaN 722.0 NaN NaN NaN NaN NaN NaN \n", - "1992 430.0 ... NaN 981.0 NaN NaN NaN NaN NaN NaN \n", - "1993 503.0 ... NaN 1193.0 NaN NaN NaN NaN NaN NaN \n", - "1994 597.0 ... NaN 1333.0 NaN NaN NaN NaN NaN NaN \n", - "1995 549.0 ... NaN 1726.0 219.0 NaN NaN NaN NaN NaN \n", - "1996 552.0 ... NaN 2064.0 339.0 NaN NaN NaN NaN NaN \n", - "1997 645.0 ... NaN 2362.0 407.0 NaN NaN NaN NaN NaN \n", - "1998 661.0 ... NaN 2692.0 478.0 225.0 NaN NaN NaN NaN \n", - "1999 710.0 ... NaN 3237.0 563.0 257.0 NaN NaN NaN NaN \n", - "2000 660.0 ... NaN 3785.0 691.0 320.0 NaN NaN NaN NaN \n", - "2001 687.0 ... NaN 4644.0 822.0 439.0 NaN NaN NaN NaN \n", - "2002 600.0 ... NaN 4884.0 1182.0 438.0 NaN NaN NaN NaN \n", - "2003 625.0 ... NaN 5085.0 1469.0 449.0 NaN NaN NaN NaN \n", - "2004 504.0 ... NaN 5362.0 1622.0 515.0 NaN NaN NaN NaN \n", - "2005 452.0 ... NaN 4957.0 2270.0 502.0 NaN NaN NaN NaN \n", - "2006 404.0 ... NaN 5152.0 2848.0 531.0 NaN NaN NaN NaN \n", - "2007 349.0 ... NaN 4931.0 3031.0 527.0 NaN NaN NaN NaN \n", - "2008 344.0 ... NaN 4779.0 3445.0 493.0 NaN NaN NaN NaN \n", - "2009 307.0 ... NaN 5144.0 3991.0 499.0 NaN NaN NaN NaN \n", - "2010 299.0 ... NaN 6263.0 5200.0 508.0 NaN NaN NaN NaN \n", - "2011 287.0 ... NaN 6294.0 6394.0 523.0 NaN NaN NaN NaN \n", - "2012 NaN ... NaN 6445.0 7457.0 516.0 NaN NaN NaN NaN \n", - "2013 NaN ... NaN 5967.0 7224.0 431.0 NaN NaN NaN NaN \n", - "2014 NaN ... NaN 5857.0 7384.0 365.0 NaN NaN NaN NaN \n", - "2015 NaN ... NaN 5995.0 6900.0 367.0 NaN NaN NaN NaN \n", - "\n", - "name Zula Zuri \n", - "year \n", - "1880 27.0 NaN \n", - "1881 27.0 NaN \n", - "1882 21.0 NaN \n", - "1883 25.0 NaN \n", - "1884 27.0 NaN \n", - "1885 38.0 NaN \n", - "1886 43.0 NaN \n", - "1887 33.0 NaN \n", - "1888 45.0 NaN \n", - "1889 55.0 NaN \n", - "1890 65.0 NaN \n", - "1891 45.0 NaN \n", - "1892 53.0 NaN \n", - "1893 70.0 NaN \n", - "1894 64.0 NaN \n", - "1895 55.0 NaN \n", - "1896 65.0 NaN \n", - "1897 79.0 NaN \n", - "1898 83.0 NaN \n", - "1899 60.0 NaN \n", - "1900 71.0 NaN \n", - "1901 57.0 NaN \n", - "1902 66.0 NaN \n", - "1903 74.0 NaN \n", - "1904 74.0 NaN \n", - "1905 61.0 NaN \n", - "1906 58.0 NaN \n", - "1907 72.0 NaN \n", - "1908 53.0 NaN \n", - "1909 76.0 NaN \n", - "... ... ... \n", - "1986 NaN NaN \n", - "1987 NaN NaN \n", - "1988 NaN NaN \n", - "1989 NaN NaN \n", - "1990 NaN NaN \n", - "1991 NaN NaN \n", - "1992 NaN NaN \n", - "1993 NaN NaN \n", - "1994 NaN NaN \n", - "1995 NaN NaN \n", - "1996 NaN NaN \n", - "1997 NaN NaN \n", - "1998 NaN NaN \n", - "1999 NaN NaN \n", - "2000 NaN NaN \n", - "2001 NaN NaN \n", - "2002 NaN NaN \n", - "2003 NaN NaN \n", - "2004 NaN NaN \n", - "2005 NaN NaN \n", - "2006 NaN NaN \n", - "2007 NaN NaN \n", - "2008 NaN NaN \n", - "2009 NaN NaN \n", - "2010 NaN 259.0 \n", - "2011 NaN 313.0 \n", - "2012 NaN 434.0 \n", - "2013 NaN 566.0 \n", - "2014 NaN 664.0 \n", - "2015 NaN 709.0 \n", - "\n", - "[136 rows x 7062 columns]" - ] - }, - "execution_count": 19, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "total_births" - ] - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "year\n", - "1880 9701.0\n", - "1881 8795.0\n", - "1882 9597.0\n", - "1883 8934.0\n", - "1884 9428.0\n", - "1885 8801.0\n", - "1886 9074.0\n", - "1887 8166.0\n", - "1888 9299.0\n", - "1889 8600.0\n", - "1890 8558.0\n", - "1891 7724.0\n", - "1892 9093.0\n", - "1893 8110.0\n", - "1894 8298.0\n", - "1895 8381.0\n", - "1896 8189.0\n", - "1897 7596.0\n", - "1898 8214.0\n", - "1899 7030.0\n", - "1900 9875.0\n", - "1901 6938.0\n", - "1902 7945.0\n", - "1903 7649.0\n", - "1904 8148.0\n", - "1905 8103.0\n", - "1906 8307.0\n", - "1907 9048.0\n", - "1908 9400.0\n", - "1909 9658.0\n", - " ... \n", - "1986 30410.0\n", - "1987 29732.0\n", - "1988 29561.0\n", - "1989 29838.0\n", - "1990 29066.0\n", - "1991 27798.0\n", - "1992 26241.0\n", - "1993 24989.0\n", - "1994 24175.0\n", - "1995 23232.0\n", - "1996 22169.0\n", - "1997 21372.0\n", - "1998 20615.0\n", - "1999 20341.0\n", - "2000 20084.0\n", - "2001 18879.0\n", - "2002 17442.0\n", - "2003 17222.0\n", - "2004 16439.0\n", - "2005 15760.0\n", - "2006 15153.0\n", - "2007 14424.0\n", - "2008 13310.0\n", - "2009 12103.0\n", - "2010 11543.0\n", - "2011 11027.0\n", - "2012 10607.0\n", - "2013 10687.0\n", - "2014 10659.0\n", - "2015 10303.0\n", - "Name: John, Length: 136, dtype: float64" - ] - }, - "execution_count": 20, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "total_births[\"John\"]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "We can see that this matches what we had in our previous data frame" - ] - }, - { - "cell_type": "code", - "execution_count": 21, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namesexbirthsyearprop
yearsex
1880F228JohnF4618800.000506
M942JohnM965518800.087383
1881F2312JohnF2618810.000283
M2938JohnM876918810.087043
1882F4212JohnF4018820.000371
M4963JohnM955718820.084065
1883F6340JohnF4018830.000356
M7116JohnM889418830.085007
1884F8454JohnF4018840.000310
M9318JohnM938818840.082032
1885F10739JohnF4518850.000338
M11640JohnM875618850.081225
1886F13036JohnF4818860.000332
M14019JohnM902618860.081473
1887F15414JohnF5618870.000384
M16435JohnM811018870.079968
1888F17834JohnF5218880.000291
M18976JohnM924718880.076516
1889F20498JohnF5218890.000292
M21632JohnM854818890.077300
1890F23086JohnF5618900.000294
M24277JohnM850218900.076577
1891F25816JohnF4418910.000237
M26971JohnM768018910.075895
1892F28460JohnF5418920.000254
M29759JohnM903918920.074068
1893F31361JohnF6118930.000287
M32671JohnM804918930.071663
1894F34211JohnF6018940.000269
M35552JohnM823818940.071158
........................
1987M1015237JohnM2953519870.015830
1988F1024361JohnF16719880.000094
M1037259JohnM2939419880.015367
1989M1060288JohnM2983819890.014918
1990M1084747JohnM2906619900.014160
1991M1109686JohnM2779819910.013765
1992M1134943JohnM2624119920.013144
1993M1160554JohnM2498919930.012746
1994M1186469JohnM2417519940.012517
1995M1212466JohnM2323219950.012208
1996M1238683JohnM2216919960.011708
1997M1265371JohnM2137219970.011342
1998M1292776JohnM2061519980.010791
1999M1321012JohnM2034119990.010600
2000M1350272JohnM2008420000.010234
2001M1380350JohnM1887920010.009724
2002M1410730JohnM1744220020.008991
2003M1441635JohnM1722220030.008726
2004M1473212JohnM1643920040.008290
2005M1505607JohnM1576020050.007899
2006M1539014JohnM1515320060.007382
2007M1573596JohnM1442420070.006960
2008M1608427JohnM1331020080.006535
2009M1643211JohnM1210320090.006113
2010M1677534JohnM1154320100.006029
2011M1711330JohnM1102720110.005821
2012M1745139JohnM1060720120.005610
2013M1778561JohnM1068720130.005673
2014M1811736JohnM1065920140.005578
2015M1844755JohnM1030320150.005426
\n", - "

245 rows × 5 columns

\n", - "
" - ], - "text/plain": [ - " name sex births year prop\n", - "year sex \n", - "1880 F 228 John F 46 1880 0.000506\n", - " M 942 John M 9655 1880 0.087383\n", - "1881 F 2312 John F 26 1881 0.000283\n", - " M 2938 John M 8769 1881 0.087043\n", - "1882 F 4212 John F 40 1882 0.000371\n", - " M 4963 John M 9557 1882 0.084065\n", - "1883 F 6340 John F 40 1883 0.000356\n", - " M 7116 John M 8894 1883 0.085007\n", - "1884 F 8454 John F 40 1884 0.000310\n", - " M 9318 John M 9388 1884 0.082032\n", - "1885 F 10739 John F 45 1885 0.000338\n", - " M 11640 John M 8756 1885 0.081225\n", - "1886 F 13036 John F 48 1886 0.000332\n", - " M 14019 John M 9026 1886 0.081473\n", - "1887 F 15414 John F 56 1887 0.000384\n", - " M 16435 John M 8110 1887 0.079968\n", - "1888 F 17834 John F 52 1888 0.000291\n", - " M 18976 John M 9247 1888 0.076516\n", - "1889 F 20498 John F 52 1889 0.000292\n", - " M 21632 John M 8548 1889 0.077300\n", - "1890 F 23086 John F 56 1890 0.000294\n", - " M 24277 John M 8502 1890 0.076577\n", - "1891 F 25816 John F 44 1891 0.000237\n", - " M 26971 John M 7680 1891 0.075895\n", - "1892 F 28460 John F 54 1892 0.000254\n", - " M 29759 John M 9039 1892 0.074068\n", - "1893 F 31361 John F 61 1893 0.000287\n", - " M 32671 John M 8049 1893 0.071663\n", - "1894 F 34211 John F 60 1894 0.000269\n", - " M 35552 John M 8238 1894 0.071158\n", - "... ... .. ... ... ...\n", - "1987 M 1015237 John M 29535 1987 0.015830\n", - "1988 F 1024361 John F 167 1988 0.000094\n", - " M 1037259 John M 29394 1988 0.015367\n", - "1989 M 1060288 John M 29838 1989 0.014918\n", - "1990 M 1084747 John M 29066 1990 0.014160\n", - "1991 M 1109686 John M 27798 1991 0.013765\n", - "1992 M 1134943 John M 26241 1992 0.013144\n", - "1993 M 1160554 John M 24989 1993 0.012746\n", - "1994 M 1186469 John M 24175 1994 0.012517\n", - "1995 M 1212466 John M 23232 1995 0.012208\n", - "1996 M 1238683 John M 22169 1996 0.011708\n", - "1997 M 1265371 John M 21372 1997 0.011342\n", - "1998 M 1292776 John M 20615 1998 0.010791\n", - "1999 M 1321012 John M 20341 1999 0.010600\n", - "2000 M 1350272 John M 20084 2000 0.010234\n", - "2001 M 1380350 John M 18879 2001 0.009724\n", - "2002 M 1410730 John M 17442 2002 0.008991\n", - "2003 M 1441635 John M 17222 2003 0.008726\n", - "2004 M 1473212 John M 16439 2004 0.008290\n", - "2005 M 1505607 John M 15760 2005 0.007899\n", - "2006 M 1539014 John M 15153 2006 0.007382\n", - "2007 M 1573596 John M 14424 2007 0.006960\n", - "2008 M 1608427 John M 13310 2008 0.006535\n", - "2009 M 1643211 John M 12103 2009 0.006113\n", - "2010 M 1677534 John M 11543 2010 0.006029\n", - "2011 M 1711330 John M 11027 2011 0.005821\n", - "2012 M 1745139 John M 10607 2012 0.005610\n", - "2013 M 1778561 John M 10687 2013 0.005673\n", - "2014 M 1811736 John M 10659 2014 0.005578\n", - "2015 M 1844755 John M 10303 2015 0.005426\n", - "\n", - "[245 rows x 5 columns]" - ] - }, - "execution_count": 21, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "top[top.name==\"John\"]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Which names are the most popular of all time?" - ] - }, - { - "cell_type": "code", - "execution_count": 22, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "name\n", - "James 5142912.0\n", - "John 5116313.0\n", - "Robert 4822265.0\n", - "Michael 4343106.0\n", - "Mary 4131873.0\n", - "William 4086383.0\n", - "David 3600738.0\n", - "Joseph 2589732.0\n", - "Richard 2565300.0\n", - "Charles 2381863.0\n", - "Thomas 2295502.0\n", - "Christopher 2011702.0\n", - "Daniel 1886299.0\n", - "Elizabeth 1613326.0\n", - "Patricia 1574798.0\n", - "Matthew 1569338.0\n", - "Jennifer 1467548.0\n", - "George 1465334.0\n", - "Linda 1454380.0\n", - "Barbara 1436646.0\n", - "Anthony 1417510.0\n", - "Donald 1412138.0\n", - "Paul 1385235.0\n", - "Mark 1347586.0\n", - "Edward 1286089.0\n", - "Steven 1276499.0\n", - "Kenneth 1269967.0\n", - "Andrew 1267471.0\n", - "Margaret 1244662.0\n", - "Joshua 1187636.0\n", - " ... \n", - "Amado 5.0\n", - "Pryor 5.0\n", - "Laban 5.0\n", - "Sheppard 5.0\n", - "Vinia 5.0\n", - "Tella 5.0\n", - "Tilford 5.0\n", - "Estie 5.0\n", - "Jep 5.0\n", - "Ollis 5.0\n", - "Clide 5.0\n", - "Tilmon 5.0\n", - "Affie 5.0\n", - "Lovisa 5.0\n", - "Alys 5.0\n", - "Etter 5.0\n", - "Lenzy 5.0\n", - "Maryland 5.0\n", - "Orlie 5.0\n", - "Orr 5.0\n", - "Lovey 5.0\n", - "Mathis 5.0\n", - "Orva 5.0\n", - "Matthews 5.0\n", - "Mattye 5.0\n", - "Voyle 5.0\n", - "Fronnie 5.0\n", - "Cordella 5.0\n", - "Bertina 5.0\n", - "Manervia 5.0\n", - "Length: 7062, dtype: float64" - ] - }, - "execution_count": 22, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "a = total_births.sum()\n", - "a.sort_values(ascending=False)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Let's plot naming trends, for a few of the most popular names" - ] - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 23, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "\n", - "text/plain": [ - "" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "subset = total_births[[\"Michael\", \"Jennifer\"]]\n", - "subset.plot()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Exercises" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Q3: unique names\n", - "\n", - "how many unique names appear in our top 1000 list? Use the `.unique()` method on the \"name\" `Series` to get a an array (it will actually be a NumPy `ndarray` of objects)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Q4: gender neutral names\n", - "\n", - "What are all the names that appear for both boys and girls?" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Q5: name diversity\n", - "\n", - "We want to make a plot of how many names it takes to reach 50% of the births in a given year. Let's start with the boys names:" - ] - }, - { - "cell_type": "code", - "execution_count": 24, - "metadata": {}, - "outputs": [], - "source": [ - "boys = top[top.sex == \"M\"]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Now, to understand the process, let's work just on a particular year, 2015" - ] - }, - { - "cell_type": "code", - "execution_count": 25, - "metadata": {}, - "outputs": [], - "source": [ - "b15 = boys[boys.year == 2015]" - ] - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 26, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "b15.info" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "We'll use the `cumsum()` property to do a cumulative sum over the `prop` column we added previously" - ] - }, - { - "cell_type": "code", - "execution_count": 27, - "metadata": {}, - "outputs": [], - "source": [ - "prop_cumsum = b15.sort_values(by=\"prop\", ascending=False)[\"prop\"].cumsum()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "and now we can use `searchsorted` to return the position where \"if the corresponding elements in v were inserted before the indices, the order of self would be preserved.\" (see http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.searchsorted.html)" - ] - }, - { - "cell_type": "code", - "execution_count": 28, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "array([134])" - ] - }, - "execution_count": 28, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "prop_cumsum.searchsorted(0.5)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Since we start counting at 0, we add 1 to this to get the number of names needed in this year to reach 50% of births." - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Now generalize this to a function that you can use `apply()` on and make a plot of the number of names to reach 50% by year" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.6.5" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} diff --git a/content/07-pandas/pandas-experiments.ipynb b/content/07-pandas/pandas-experiments.ipynb deleted file mode 100644 index 21660d13..00000000 --- a/content/07-pandas/pandas-experiments.ipynb +++ /dev/null @@ -1,719 +0,0 @@ -{ - "cells": [ - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import numpy as np\n", - "import pandas as pd" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Sort by Two Columns" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "df = pd.DataFrame(np.random.randint(1, 5, (10,2)), columns=['a','b'])\n", - "df.sort_values([\"a\", \"b\"], inplace=True) " - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
ab
412
213
714
822
623
024
132
532
933
334
\n", - "
" - ], - "text/plain": [ - " a b\n", - "4 1 2\n", - "2 1 3\n", - "7 1 4\n", - "8 2 2\n", - "6 2 3\n", - "0 2 4\n", - "1 3 2\n", - "5 3 2\n", - "9 3 3\n", - "3 3 4" - ] - }, - "execution_count": 7, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Duplicated Labels" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "df = pd.DataFrame(np.random.randint(1, 5, (15,3)), columns=['a','b','b'])" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
abb
0131
1144
2221
3414
4322
5122
6331
7412
8113
9134
10314
11423
12132
13412
14234
\n", - "
" - ], - "text/plain": [ - " a b b\n", - "0 1 3 1\n", - "1 1 4 4\n", - "2 2 2 1\n", - "3 4 1 4\n", - "4 3 2 2\n", - "5 1 2 2\n", - "6 3 3 1\n", - "7 4 1 2\n", - "8 1 1 3\n", - "9 1 3 4\n", - "10 3 1 4\n", - "11 4 2 3\n", - "12 1 3 2\n", - "13 4 1 2\n", - "14 2 3 4" - ] - }, - "execution_count": 9, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
bb
031
144
221
314
422
522
631
712
813
934
1014
1123
1232
1312
1434
\n", - "
" - ], - "text/plain": [ - " b b\n", - "0 3 1\n", - "1 4 4\n", - "2 2 1\n", - "3 1 4\n", - "4 2 2\n", - "5 2 2\n", - "6 3 1\n", - "7 1 2\n", - "8 1 3\n", - "9 3 4\n", - "10 1 4\n", - "11 2 3\n", - "12 3 2\n", - "13 1 2\n", - "14 3 4" - ] - }, - "execution_count": 11, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df[\"b\"]" - ] - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": { - "scrolled": true - }, - "outputs": [ - { - "data": { - "text/plain": [ - "0 3\n", - "1 4\n", - "2 2\n", - "3 1\n", - "4 2\n", - "5 2\n", - "6 3\n", - "7 1\n", - "8 1\n", - "9 3\n", - "10 1\n", - "11 2\n", - "12 3\n", - "13 1\n", - "14 3\n", - "Name: b, dtype: int64" - ] - }, - "execution_count": 16, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df.iloc[:,1]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## `pivot_table` vs. `groupby`\n", - "\n", - "see https://stackoverflow.com/questions/34702815/pandas-group-by-and-pivot-table-difference" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
abc
0110.122273
1210.785140
2310.003996
3120.669116
4220.599575
5320.095478
\n", - "
" - ], - "text/plain": [ - " a b c\n", - "0 1 1 0.122273\n", - "1 2 1 0.785140\n", - "2 3 1 0.003996\n", - "3 1 2 0.669116\n", - "4 2 2 0.599575\n", - "5 3 2 0.095478" - ] - }, - "execution_count": 19, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df = pd.DataFrame({\"a\": [1,2,3,1,2,3], \"b\":[1,1,1,2,2,2], \"c\":np.random.rand(6)})\n", - "df" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "A pivot table creates a new dataframe, with the specified column in the original treated as the index, and any columns given as columns in the dataframe, with the values taken to be \"c\"" - ] - }, - { - "cell_type": "code", - "execution_count": 24, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
b12
a
10.1222730.669116
20.7851400.599575
30.0039960.095478
\n", - "
" - ], - "text/plain": [ - "b 1 2\n", - "a \n", - "1 0.122273 0.669116\n", - "2 0.785140 0.599575\n", - "3 0.003996 0.095478" - ] - }, - "execution_count": 24, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df.pivot_table(\"c\", index=[\"a\"], columns=[\"b\"]) " - ] - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a b\n", - "1 1 0.122273\n", - " 2 0.669116\n", - "2 1 0.785140\n", - " 2 0.599575\n", - "3 1 0.003996\n", - " 2 0.095478\n", - "Name: c, dtype: float64" - ] - }, - "execution_count": 23, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df.groupby(['a','b'])['c'].sum()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.6.5" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} diff --git a/content/07-pandas/pandas-intro.ipynb b/content/07-pandas/pandas-intro.ipynb deleted file mode 100644 index 17a8e536..00000000 --- a/content/07-pandas/pandas-intro.ipynb +++ /dev/null @@ -1,5108 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Pandas" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "pandas extends the numpy ndarray to allow for a data-structure that labels the columns (called a data frame). You can kind of think about this functionality as operating how a spreadsheet might work.\n", - "\n", - "In this manner, it provides much of the same functionality of R -- the data frame provides the basis for data analysis.\n", - "\n", - "Nice documentation is here:\n", - "\n", - "http://pandas.pydata.org/pandas-docs/stable/dsintro.html#dsintro" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import numpy as np\n", - "import matplotlib.pyplot as plt" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## series\n", - "\n", - "A series is a labeled array. It looks superficially like a dictionary, but is fixed size, and can handle missing values. It also can also be operated on with any numpy operation or the standard operators (a dictionary cannot). The labels are referred to as the _index_.\n", - "\n", - "Some examples from: http://pandas.pydata.org/pandas-docs/stable/dsintro.html" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a -0.272166\n", - "b -0.594024\n", - "c -0.533180\n", - "d -0.666801\n", - "e -0.749968\n", - "dtype: float64" - ] - }, - "execution_count": 2, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s = pd.Series(np.random.randn(5), index=['a', 'b', 'c', 'd', 'e'])\n", - "s" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Index(['a', 'b', 'c', 'd', 'e'], dtype='object')" - ] - }, - "execution_count": 3, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s.index" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "If you don't specify an index, one will be made up for you" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "0 -0.098297\n", - "1 -0.840109\n", - "2 1.282849\n", - "3 0.475101\n", - "4 -0.283392\n", - "dtype: float64" - ] - }, - "execution_count": 4, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pd.Series(np.random.randn(5))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "you can initialize from a dictionary. By default it will use the dictionary keys (sorted) as the index" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a 0.0\n", - "b 1.0\n", - "c 2.0\n", - "dtype: float64" - ] - }, - "execution_count": 5, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "d = {'a' : 0., 'b' : 1., 'c' : 2.}\n", - "pd.Series(d)" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "b 1.0\n", - "c 2.0\n", - "d NaN\n", - "a 0.0\n", - "dtype: float64" - ] - }, - "execution_count": 6, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pd.Series(d, index=['b', 'c', 'd', 'a'])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Note that NaN indicates a missing value" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "you can operate on a series as you would any ndarray" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a -0.272166\n", - "b -0.594024\n", - "c -0.533180\n", - "d -0.666801\n", - "e -0.749968\n", - "dtype: float64" - ] - }, - "execution_count": 7, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "-0.27216618170818768" - ] - }, - "execution_count": 8, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s[0]" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a -0.272166\n", - "b -0.594024\n", - "c -0.533180\n", - "dtype: float64" - ] - }, - "execution_count": 9, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s[:3]" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a -0.272166\n", - "c -0.533180\n", - "dtype: float64" - ] - }, - "execution_count": 10, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s[s > s.median()]" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a 0.761728\n", - "b 0.552101\n", - "c 0.586736\n", - "d 0.513348\n", - "e 0.472382\n", - "dtype: float64" - ] - }, - "execution_count": 11, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "np.exp(s)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "you can also index by label -- this mimics the behavior of a dictionary" - ] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "-0.27216618170818768" - ] - }, - "execution_count": 12, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s['a']" - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "-0.74996754801095999" - ] - }, - "execution_count": 13, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s['e']" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "True" - ] - }, - "execution_count": 14, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "'e' in s" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "The `get()` method can be used to safely access an element if it is possible it does not exist -- you can specify a default to return in that case. The alternative is to use a `try` / `except` block." - ] - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "nan" - ] - }, - "execution_count": 15, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s.get('f', np.nan)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Operations, like those you use with an ndarray work fine on a Series" - ] - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a -0.544332\n", - "b -1.188048\n", - "c -1.066360\n", - "d -1.333602\n", - "e -1.499935\n", - "dtype: float64" - ] - }, - "execution_count": 16, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s + s" - ] - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a -0.544332\n", - "b -1.188048\n", - "c -1.066360\n", - "d -1.333602\n", - "e -1.499935\n", - "dtype: float64" - ] - }, - "execution_count": 17, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s * 2" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "note that operations are always done on like labels, so the following is not exactly the same as numpy arrays. In this sense, pandas results respect the union of indices " - ] - }, - { - "cell_type": "code", - "execution_count": 18, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a NaN\n", - "b -1.188048\n", - "c -1.066360\n", - "d -1.333602\n", - "e NaN\n", - "dtype: float64" - ] - }, - "execution_count": 18, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s[1:] + s[:-1]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "a series can have a name" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "0 1.026684\n", - "1 0.306580\n", - "2 0.135363\n", - "3 -0.352485\n", - "4 -0.188115\n", - "Name: something, dtype: float64" - ] - }, - "execution_count": 19, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "s = pd.Series(np.random.randn(5), name='something')\n", - "s" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## DataFrame\n", - "\n", - "The dataframe is like a spreadsheet -- the columns and rows have labels. It is 2-d. This is what you will usually use with pandas.\n", - "\n", - "you can initialize from:\n", - " * Dict of 1D ndarrays, lists, dicts, or Series\n", - " * 2-D numpy.ndarray\n", - " * Structured or record ndarray\n", - " * A Series\n", - " * Another DataFrame" - ] - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [], - "source": [ - "d = {'one' : pd.Series([1., 2., 3.], index=['b', 'a', 'c']),\n", - " 'two' : pd.Series([2, 1., 3., 4.], index=['b', 'a', 'c', 'd'])}" - ] - }, - { - "cell_type": "code", - "execution_count": 21, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
onetwo
a2.01.0
b1.02.0
c3.03.0
dNaN4.0
\n", - "
" - ], - "text/plain": [ - " one two\n", - "a 2.0 1.0\n", - "b 1.0 2.0\n", - "c 3.0 3.0\n", - "d NaN 4.0" - ] - }, - "execution_count": 21, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df = pd.DataFrame(d)\n", - "df" - ] - }, - { - "cell_type": "code", - "execution_count": 22, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "one 2.0\n", - "two 2.5\n", - "dtype: float64" - ] - }, - "execution_count": 22, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df.mean()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "You can exclude some labels" - ] - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
onetwo
dNaN4.0
b1.02.0
a2.01.0
\n", - "
" - ], - "text/plain": [ - " one two\n", - "d NaN 4.0\n", - "b 1.0 2.0\n", - "a 2.0 1.0" - ] - }, - "execution_count": 23, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pd.DataFrame(d, index=['d', 'b', 'a'])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Here's initialization from lists / ndarrays" - ] - }, - { - "cell_type": "code", - "execution_count": 24, - "metadata": {}, - "outputs": [], - "source": [ - "d = {'one' : [1., 2., 3., 4.],\n", - " 'two' : [4., 3., 2., 1.]}" - ] - }, - { - "cell_type": "code", - "execution_count": 25, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
onetwo
01.04.0
12.03.0
23.02.0
34.01.0
\n", - "
" - ], - "text/plain": [ - " one two\n", - "0 1.0 4.0\n", - "1 2.0 3.0\n", - "2 3.0 2.0\n", - "3 4.0 1.0" - ] - }, - "execution_count": 25, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pd.DataFrame(d)" - ] - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
onetwo
a1.04.0
b2.03.0
c3.02.0
d4.01.0
\n", - "
" - ], - "text/plain": [ - " one two\n", - "a 1.0 4.0\n", - "b 2.0 3.0\n", - "c 3.0 2.0\n", - "d 4.0 1.0" - ] - }, - "execution_count": 26, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pd.DataFrame(d, index=['a', 'b', 'c', 'd'])" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "collapsed": true - }, - "source": [ - "there are lots of other initialization methods, e.g, list of dicts" - ] - }, - { - "cell_type": "code", - "execution_count": 27, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
abc
first12NaN
second51020.0
\n", - "
" - ], - "text/plain": [ - " a b c\n", - "first 1 2 NaN\n", - "second 5 10 20.0" - ] - }, - "execution_count": 27, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "data2 = [{'a': 1, 'b': 2}, {'a': 5, 'b': 10, 'c': 20}]\n", - "pd.DataFrame(data2, index=['first', 'second'])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### working with the dataframe\n", - "\n", - "you can index it as it it were Series objects. Other access is as follows:\n", - "\n", - " * Select column: `df[col]` (returns Series)\n", - " * Select row by label: `df.loc[label]` (returns Series)\n", - " * Select row by integer location: `df.iloc[loc]` (returns Series)\n", - " * Slice rows: `df[5:10]` (returns DataFrame)\n", - " * Select rows by boolean vector: `df[bool_vec]` (return DataFrame)" - ] - }, - { - "cell_type": "code", - "execution_count": 28, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a 2.0\n", - "b 1.0\n", - "c 3.0\n", - "d NaN\n", - "Name: one, dtype: float64" - ] - }, - "execution_count": 28, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df['one']" - ] - }, - { - "cell_type": "code", - "execution_count": 29, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
onetwo
a2.01.0
b1.02.0
c3.03.0
dNaN4.0
\n", - "
" - ], - "text/plain": [ - " one two\n", - "a 2.0 1.0\n", - "b 1.0 2.0\n", - "c 3.0 3.0\n", - "d NaN 4.0" - ] - }, - "execution_count": 29, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df" - ] - }, - { - "cell_type": "code", - "execution_count": 30, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "pandas.core.series.Series" - ] - }, - "execution_count": 30, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "type(df['one'])" - ] - }, - { - "cell_type": "code", - "execution_count": 31, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
onetwothreeflag
a2.01.02.0False
b1.02.02.0False
c3.03.09.0True
dNaN4.0NaNFalse
\n", - "
" - ], - "text/plain": [ - " one two three flag\n", - "a 2.0 1.0 2.0 False\n", - "b 1.0 2.0 2.0 False\n", - "c 3.0 3.0 9.0 True\n", - "d NaN 4.0 NaN False" - ] - }, - "execution_count": 31, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df['three'] = df['one'] * df['two']\n", - "df['flag'] = df['one'] > 2\n", - "df" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "you can also treat any index name as if it were a property" - ] - }, - { - "cell_type": "code", - "execution_count": 32, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a 2.0\n", - "b 2.0\n", - "c 9.0\n", - "d NaN\n", - "Name: three, dtype: float64" - ] - }, - "execution_count": 32, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df.three" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "you can delete or pop columns---popping returns a `Series`" - ] - }, - { - "cell_type": "code", - "execution_count": 33, - "metadata": {}, - "outputs": [], - "source": [ - "del df['two']" - ] - }, - { - "cell_type": "code", - "execution_count": 34, - "metadata": {}, - "outputs": [], - "source": [ - "three = df.pop('three')" - ] - }, - { - "cell_type": "code", - "execution_count": 35, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
oneflag
a2.0False
b1.0False
c3.0True
dNaNFalse
\n", - "
" - ], - "text/plain": [ - " one flag\n", - "a 2.0 False\n", - "b 1.0 False\n", - "c 3.0 True\n", - "d NaN False" - ] - }, - "execution_count": 35, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df" - ] - }, - { - "cell_type": "code", - "execution_count": 36, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "a 2.0\n", - "b 2.0\n", - "c 9.0\n", - "d NaN\n", - "Name: three, dtype: float64" - ] - }, - "execution_count": 36, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "three" - ] - }, - { - "cell_type": "code", - "execution_count": 37, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "pandas.core.series.Series" - ] - }, - "execution_count": 37, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "type(three)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "initializing with a scalar propagates that scalar to all the rows" - ] - }, - { - "cell_type": "code", - "execution_count": 38, - "metadata": {}, - "outputs": [], - "source": [ - "df['foo'] = 'bar'" - ] - }, - { - "cell_type": "code", - "execution_count": 39, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
oneflagfoo
a2.0Falsebar
b1.0Falsebar
c3.0Truebar
dNaNFalsebar
\n", - "
" - ], - "text/plain": [ - " one flag foo\n", - "a 2.0 False bar\n", - "b 1.0 False bar\n", - "c 3.0 True bar\n", - "d NaN False bar" - ] - }, - "execution_count": 39, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## CSV\n", - "\n", - "you can also read from CSV\n", - "\n", - "Note, if there is stray whitespace in your strings in the CSV, pandas will keep it. This is a bit annoying, and you might need to investigate converters to get things properly formatted.\n", - "\n", - "There are similar methods for HDF5 and excel" - ] - }, - { - "cell_type": "code", - "execution_count": 40, - "metadata": {}, - "outputs": [], - "source": [ - "grades = pd.read_csv('sample.csv', index_col=\"student\", skipinitialspace=True)" - ] - }, - { - "cell_type": "code", - "execution_count": 41, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4exam
student
A10.09.010797
B8.07.09982
CNaN9.06575
D8.09.09990
ENaN10.0101095
F8.02.06766
G6.0NaN4560
H8.08.09884
I10.07.0101092
J10.06.09991
K8.07.06887
L3.08.05771
M9.09.08994
N8.010.09990
O10.010.010999
P8.09.081094
Q5.07.06578
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam\n", - "student \n", - "A 10.0 9.0 10 7 97\n", - "B 8.0 7.0 9 9 82\n", - "C NaN 9.0 6 5 75\n", - "D 8.0 9.0 9 9 90\n", - "E NaN 10.0 10 10 95\n", - "F 8.0 2.0 6 7 66\n", - "G 6.0 NaN 4 5 60\n", - "H 8.0 8.0 9 8 84\n", - "I 10.0 7.0 10 10 92\n", - "J 10.0 6.0 9 9 91\n", - "K 8.0 7.0 6 8 87\n", - "L 3.0 8.0 5 7 71\n", - "M 9.0 9.0 8 9 94\n", - "N 8.0 10.0 9 9 90\n", - "O 10.0 10.0 10 9 99\n", - "P 8.0 9.0 8 10 94\n", - "Q 5.0 7.0 6 5 78" - ] - }, - "execution_count": 41, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "grades" - ] - }, - { - "cell_type": "code", - "execution_count": 42, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Index(['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N',\n", - " 'O', 'P', 'Q'],\n", - " dtype='object', name='student')" - ] - }, - "execution_count": 42, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "grades.index" - ] - }, - { - "cell_type": "code", - "execution_count": 43, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Index(['hw 1', 'hw 2', 'hw 3', 'hw 4', 'exam'], dtype='object')" - ] - }, - "execution_count": 43, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "grades.columns" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "A single student's grades" - ] - }, - { - "cell_type": "code", - "execution_count": 47, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "hw 1 10.0\n", - "hw 2 9.0\n", - "hw 3 10.0\n", - "hw 4 7.0\n", - "exam 97.0\n", - "Name: A, dtype: float64" - ] - }, - "execution_count": 47, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "grades.loc[\"A\"]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "All the grades for the first homework" - ] - }, - { - "cell_type": "code", - "execution_count": 48, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "student\n", - "A 10.0\n", - "B 8.0\n", - "C NaN\n", - "D 8.0\n", - "E NaN\n", - "F 8.0\n", - "G 6.0\n", - "H 8.0\n", - "I 10.0\n", - "J 10.0\n", - "K 8.0\n", - "L 3.0\n", - "M 9.0\n", - "N 8.0\n", - "O 10.0\n", - "P 8.0\n", - "Q 5.0\n", - "Name: hw 1, dtype: float64" - ] - }, - "execution_count": 48, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "grades['hw 1']" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Creating a new column based on the existing ones" - ] - }, - { - "cell_type": "code", - "execution_count": 49, - "metadata": {}, - "outputs": [], - "source": [ - "grades['hw average'] = (grades['hw 1'] + grades['hw 2'] + grades['hw 3'] + grades['hw 4'])/4.0" - ] - }, - { - "cell_type": "code", - "execution_count": 50, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw average
student
A10.09.0107979.00
B8.07.099828.25
CNaN9.06575NaN
D8.09.099908.75
ENaN10.0101095NaN
F8.02.067665.75
G6.0NaN4560NaN
H8.08.098848.25
I10.07.01010929.25
J10.06.099918.50
K8.07.068877.25
L3.08.057715.75
M9.09.089948.75
N8.010.099909.00
O10.010.0109999.75
P8.09.0810948.75
Q5.07.065785.75
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average\n", - "student \n", - "A 10.0 9.0 10 7 97 9.00\n", - "B 8.0 7.0 9 9 82 8.25\n", - "C NaN 9.0 6 5 75 NaN\n", - "D 8.0 9.0 9 9 90 8.75\n", - "E NaN 10.0 10 10 95 NaN\n", - "F 8.0 2.0 6 7 66 5.75\n", - "G 6.0 NaN 4 5 60 NaN\n", - "H 8.0 8.0 9 8 84 8.25\n", - "I 10.0 7.0 10 10 92 9.25\n", - "J 10.0 6.0 9 9 91 8.50\n", - "K 8.0 7.0 6 8 87 7.25\n", - "L 3.0 8.0 5 7 71 5.75\n", - "M 9.0 9.0 8 9 94 8.75\n", - "N 8.0 10.0 9 9 90 9.00\n", - "O 10.0 10.0 10 9 99 9.75\n", - "P 8.0 9.0 8 10 94 8.75\n", - "Q 5.0 7.0 6 5 78 5.75" - ] - }, - "execution_count": 50, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "grades" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "this didn't handle the missing data properly -- let's replace the NaNs with 0" - ] - }, - { - "cell_type": "code", - "execution_count": 51, - "metadata": {}, - "outputs": [], - "source": [ - "g2 = grades.fillna(0)" - ] - }, - { - "cell_type": "code", - "execution_count": 52, - "metadata": {}, - "outputs": [], - "source": [ - "g2['hw average'] = (g2['hw 1'] + g2['hw 2'] + g2['hw 3'] + g2['hw 4'])/4.0" - ] - }, - { - "cell_type": "code", - "execution_count": 53, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw average
student
A10.09.0107979.00
B8.07.099828.25
C0.09.065755.00
D8.09.099908.75
E0.010.01010957.50
F8.02.067665.75
G6.00.045603.75
H8.08.098848.25
I10.07.01010929.25
J10.06.099918.50
K8.07.068877.25
L3.08.057715.75
M9.09.089948.75
N8.010.099909.00
O10.010.0109999.75
P8.09.0810948.75
Q5.07.065785.75
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average\n", - "student \n", - "A 10.0 9.0 10 7 97 9.00\n", - "B 8.0 7.0 9 9 82 8.25\n", - "C 0.0 9.0 6 5 75 5.00\n", - "D 8.0 9.0 9 9 90 8.75\n", - "E 0.0 10.0 10 10 95 7.50\n", - "F 8.0 2.0 6 7 66 5.75\n", - "G 6.0 0.0 4 5 60 3.75\n", - "H 8.0 8.0 9 8 84 8.25\n", - "I 10.0 7.0 10 10 92 9.25\n", - "J 10.0 6.0 9 9 91 8.50\n", - "K 8.0 7.0 6 8 87 7.25\n", - "L 3.0 8.0 5 7 71 5.75\n", - "M 9.0 9.0 8 9 94 8.75\n", - "N 8.0 10.0 9 9 90 9.00\n", - "O 10.0 10.0 10 9 99 9.75\n", - "P 8.0 9.0 8 10 94 8.75\n", - "Q 5.0 7.0 6 5 78 5.75" - ] - }, - "execution_count": 53, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "For big dataframes, we can view just pieces" - ] - }, - { - "cell_type": "code", - "execution_count": 54, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw average
student
A10.09.0107979.00
B8.07.099828.25
C0.09.065755.00
D8.09.099908.75
E0.010.01010957.50
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average\n", - "student \n", - "A 10.0 9.0 10 7 97 9.00\n", - "B 8.0 7.0 9 9 82 8.25\n", - "C 0.0 9.0 6 5 75 5.00\n", - "D 8.0 9.0 9 9 90 8.75\n", - "E 0.0 10.0 10 10 95 7.50" - ] - }, - "execution_count": 54, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 55, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw average
student
P8.09.0810948.75
Q5.07.065785.75
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average\n", - "student \n", - "P 8.0 9.0 8 10 94 8.75\n", - "Q 5.0 7.0 6 5 78 5.75" - ] - }, - "execution_count": 55, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.tail(2)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### statistics" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "we can get lots of statistics" - ] - }, - { - "cell_type": "code", - "execution_count": 56, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw average
count17.00000017.00000017.00000017.00000017.00000017.000000
mean7.0000007.4705887.8823538.00000085.0000007.588235
std3.2210252.7412961.9647631.73205111.4072351.747635
min0.0000000.0000004.0000005.00000060.0000003.750000
25%6.0000007.0000006.0000007.00000078.0000005.750000
50%8.0000008.0000009.0000009.00000090.0000008.250000
75%9.0000009.0000009.0000009.00000094.0000008.750000
max10.00000010.00000010.00000010.00000099.0000009.750000
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average\n", - "count 17.000000 17.000000 17.000000 17.000000 17.000000 17.000000\n", - "mean 7.000000 7.470588 7.882353 8.000000 85.000000 7.588235\n", - "std 3.221025 2.741296 1.964763 1.732051 11.407235 1.747635\n", - "min 0.000000 0.000000 4.000000 5.000000 60.000000 3.750000\n", - "25% 6.000000 7.000000 6.000000 7.000000 78.000000 5.750000\n", - "50% 8.000000 8.000000 9.000000 9.000000 90.000000 8.250000\n", - "75% 9.000000 9.000000 9.000000 9.000000 94.000000 8.750000\n", - "max 10.000000 10.000000 10.000000 10.000000 99.000000 9.750000" - ] - }, - "execution_count": 56, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.describe()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "want to sort by values?" - ] - }, - { - "cell_type": "code", - "execution_count": 57, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw average
student
G6.00.045603.75
F8.02.067665.75
L3.08.057715.75
C0.09.065755.00
Q5.07.065785.75
B8.07.099828.25
H8.08.098848.25
K8.07.068877.25
D8.09.099908.75
N8.010.099909.00
J10.06.099918.50
I10.07.01010929.25
M9.09.089948.75
P8.09.0810948.75
E0.010.01010957.50
A10.09.0107979.00
O10.010.0109999.75
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average\n", - "student \n", - "G 6.0 0.0 4 5 60 3.75\n", - "F 8.0 2.0 6 7 66 5.75\n", - "L 3.0 8.0 5 7 71 5.75\n", - "C 0.0 9.0 6 5 75 5.00\n", - "Q 5.0 7.0 6 5 78 5.75\n", - "B 8.0 7.0 9 9 82 8.25\n", - "H 8.0 8.0 9 8 84 8.25\n", - "K 8.0 7.0 6 8 87 7.25\n", - "D 8.0 9.0 9 9 90 8.75\n", - "N 8.0 10.0 9 9 90 9.00\n", - "J 10.0 6.0 9 9 91 8.50\n", - "I 10.0 7.0 10 10 92 9.25\n", - "M 9.0 9.0 8 9 94 8.75\n", - "P 8.0 9.0 8 10 94 8.75\n", - "E 0.0 10.0 10 10 95 7.50\n", - "A 10.0 9.0 10 7 97 9.00\n", - "O 10.0 10.0 10 9 99 9.75" - ] - }, - "execution_count": 57, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.sort_values(by=\"exam\")" - ] - }, - { - "cell_type": "code", - "execution_count": 58, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "hw 1 7.000000\n", - "hw 2 7.470588\n", - "hw 3 7.882353\n", - "hw 4 8.000000\n", - "exam 85.000000\n", - "hw average 7.588235\n", - "dtype: float64" - ] - }, - "execution_count": 58, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.mean()" - ] - }, - { - "cell_type": "code", - "execution_count": 59, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "hw 1 8.00\n", - "hw 2 8.00\n", - "hw 3 9.00\n", - "hw 4 9.00\n", - "exam 90.00\n", - "hw average 8.25\n", - "dtype: float64" - ] - }, - "execution_count": 59, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.median()" - ] - }, - { - "cell_type": "code", - "execution_count": 60, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "hw 1 10.00\n", - "hw 2 10.00\n", - "hw 3 10.00\n", - "hw 4 10.00\n", - "exam 99.00\n", - "hw average 9.75\n", - "dtype: float64" - ] - }, - "execution_count": 60, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.max()" - ] - }, - { - "cell_type": "code", - "execution_count": 61, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw average
student
A10.09.0107979.00
B8.07.099828.25
C0.09.065755.00
D8.09.099908.75
E0.010.01010957.50
F8.02.067665.75
G6.00.045603.75
H8.08.098848.25
I10.07.01010929.25
J10.06.099918.50
K8.07.068877.25
L3.08.057715.75
M9.09.089948.75
N8.010.099909.00
O10.010.0109999.75
P8.09.0810948.75
Q5.07.065785.75
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average\n", - "student \n", - "A 10.0 9.0 10 7 97 9.00\n", - "B 8.0 7.0 9 9 82 8.25\n", - "C 0.0 9.0 6 5 75 5.00\n", - "D 8.0 9.0 9 9 90 8.75\n", - "E 0.0 10.0 10 10 95 7.50\n", - "F 8.0 2.0 6 7 66 5.75\n", - "G 6.0 0.0 4 5 60 3.75\n", - "H 8.0 8.0 9 8 84 8.25\n", - "I 10.0 7.0 10 10 92 9.25\n", - "J 10.0 6.0 9 9 91 8.50\n", - "K 8.0 7.0 6 8 87 7.25\n", - "L 3.0 8.0 5 7 71 5.75\n", - "M 9.0 9.0 8 9 94 8.75\n", - "N 8.0 10.0 9 9 90 9.00\n", - "O 10.0 10.0 10 9 99 9.75\n", - "P 8.0 9.0 8 10 94 8.75\n", - "Q 5.0 7.0 6 5 78 5.75" - ] - }, - "execution_count": 61, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "`.apply()` let's you apply a function to the `DataFrame`. By default, it will work over indices (e.g., applying your function on a column), treating the inputs as a `Series`. " - ] - }, - { - "cell_type": "code", - "execution_count": 62, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "hw 1 10.0\n", - "hw 2 10.0\n", - "hw 3 6.0\n", - "hw 4 5.0\n", - "exam 39.0\n", - "hw average 6.0\n", - "dtype: float64" - ] - }, - "execution_count": 62, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.apply(lambda x: x.max() - x.min())" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### access" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Pandas provides optimizes methods for accessing data: .at, .iat, .loc, .iloc, and .ix" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "The standard slice notation works for rows, but note *when using labels, both endpoints are included*" - ] - }, - { - "cell_type": "code", - "execution_count": 63, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw average
student
E0.010.01010957.50
F8.02.067665.75
G6.00.045603.75
H8.08.098848.25
I10.07.01010929.25
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average\n", - "student \n", - "E 0.0 10.0 10 10 95 7.50\n", - "F 8.0 2.0 6 7 66 5.75\n", - "G 6.0 0.0 4 5 60 3.75\n", - "H 8.0 8.0 9 8 84 8.25\n", - "I 10.0 7.0 10 10 92 9.25" - ] - }, - "execution_count": 63, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2[\"E\":\"I\"]" - ] - }, - { - "cell_type": "code", - "execution_count": 64, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1exam
student
A10.097
B8.082
C0.075
D8.090
E0.095
F8.066
G6.060
H8.084
I10.092
J10.091
K8.087
L3.071
M9.094
N8.090
O10.099
P8.094
Q5.078
\n", - "
" - ], - "text/plain": [ - " hw 1 exam\n", - "student \n", - "A 10.0 97\n", - "B 8.0 82\n", - "C 0.0 75\n", - "D 8.0 90\n", - "E 0.0 95\n", - "F 8.0 66\n", - "G 6.0 60\n", - "H 8.0 84\n", - "I 10.0 92\n", - "J 10.0 91\n", - "K 8.0 87\n", - "L 3.0 71\n", - "M 9.0 94\n", - "N 8.0 90\n", - "O 10.0 99\n", - "P 8.0 94\n", - "Q 5.0 78" - ] - }, - "execution_count": 64, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.loc[:,[\"hw 1\", \"exam\"]]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "`at` is a faster access method" - ] - }, - { - "cell_type": "code", - "execution_count": 65, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "97" - ] - }, - "execution_count": 65, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.at[\"A\",\"exam\"]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "The `i` routines work in index space, similar to how numpy does" - ] - }, - { - "cell_type": "code", - "execution_count": 66, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2
student
D8.09.0
E0.010.0
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2\n", - "student \n", - "D 8.0 9.0\n", - "E 0.0 10.0" - ] - }, - "execution_count": 66, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.iloc[3:5,0:2]" - ] - }, - { - "cell_type": "code", - "execution_count": 67, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 2hw 3hw 4exam
student
B7.09982
D9.09990
F2.06766
\n", - "
" - ], - "text/plain": [ - " hw 2 hw 3 hw 4 exam\n", - "student \n", - "B 7.0 9 9 82\n", - "D 9.0 9 9 90\n", - "F 2.0 6 7 66" - ] - }, - "execution_count": 67, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.iloc[[1,3,5], [1,2,3,4]]" - ] - }, - { - "cell_type": "code", - "execution_count": 68, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "6" - ] - }, - "execution_count": 68, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.iat[2,2]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### boolean indexing" - ] - }, - { - "cell_type": "code", - "execution_count": 69, - "metadata": { - "scrolled": true - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw average
student
A10.09.0107979.00
E0.010.01010957.50
I10.07.01010929.25
J10.06.099918.50
M9.09.089948.75
O10.010.0109999.75
P8.09.0810948.75
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average\n", - "student \n", - "A 10.0 9.0 10 7 97 9.00\n", - "E 0.0 10.0 10 10 95 7.50\n", - "I 10.0 7.0 10 10 92 9.25\n", - "J 10.0 6.0 9 9 91 8.50\n", - "M 9.0 9.0 8 9 94 8.75\n", - "O 10.0 10.0 10 9 99 9.75\n", - "P 8.0 9.0 8 10 94 8.75" - ] - }, - "execution_count": 69, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2[g2.exam > 90]" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### np arrays" - ] - }, - { - "cell_type": "code", - "execution_count": 70, - "metadata": {}, - "outputs": [], - "source": [ - "g2.loc[:, \"new\"] = np.random.random(len(g2))" - ] - }, - { - "cell_type": "code", - "execution_count": 71, - "metadata": { - "scrolled": true - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw averagenew
student
A10.09.0107979.000.848599
B8.07.099828.250.394722
C0.09.065755.000.957668
D8.09.099908.750.953680
E0.010.01010957.500.000388
F8.02.067665.750.898409
G6.00.045603.750.346747
H8.08.098848.250.716042
I10.07.01010929.250.965628
J10.06.099918.500.124690
K8.07.068877.250.694847
L3.08.057715.750.930668
M9.09.089948.750.606070
N8.010.099909.000.212891
O10.010.0109999.750.905785
P8.09.0810948.750.415708
Q5.07.065785.750.145941
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average new\n", - "student \n", - "A 10.0 9.0 10 7 97 9.00 0.848599\n", - "B 8.0 7.0 9 9 82 8.25 0.394722\n", - "C 0.0 9.0 6 5 75 5.00 0.957668\n", - "D 8.0 9.0 9 9 90 8.75 0.953680\n", - "E 0.0 10.0 10 10 95 7.50 0.000388\n", - "F 8.0 2.0 6 7 66 5.75 0.898409\n", - "G 6.0 0.0 4 5 60 3.75 0.346747\n", - "H 8.0 8.0 9 8 84 8.25 0.716042\n", - "I 10.0 7.0 10 10 92 9.25 0.965628\n", - "J 10.0 6.0 9 9 91 8.50 0.124690\n", - "K 8.0 7.0 6 8 87 7.25 0.694847\n", - "L 3.0 8.0 5 7 71 5.75 0.930668\n", - "M 9.0 9.0 8 9 94 8.75 0.606070\n", - "N 8.0 10.0 9 9 90 9.00 0.212891\n", - "O 10.0 10.0 10 9 99 9.75 0.905785\n", - "P 8.0 9.0 8 10 94 8.75 0.415708\n", - "Q 5.0 7.0 6 5 78 5.75 0.145941" - ] - }, - "execution_count": 71, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "resetting values" - ] - }, - { - "cell_type": "code", - "execution_count": 72, - "metadata": {}, - "outputs": [], - "source": [ - "a = g2[g2.exam < 80].index" - ] - }, - { - "cell_type": "code", - "execution_count": 73, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Index(['C', 'F', 'G', 'L', 'Q'], dtype='object', name='student')" - ] - }, - "execution_count": 73, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "a" - ] - }, - { - "cell_type": "code", - "execution_count": 74, - "metadata": {}, - "outputs": [], - "source": [ - "g2.loc[a, \"exam\"] = 80" - ] - }, - { - "cell_type": "code", - "execution_count": 75, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw averagenew
student
A10.09.0107979.000.848599
B8.07.099828.250.394722
C0.09.065805.000.957668
D8.09.099908.750.953680
E0.010.01010957.500.000388
F8.02.067805.750.898409
G6.00.045803.750.346747
H8.08.098848.250.716042
I10.07.01010929.250.965628
J10.06.099918.500.124690
K8.07.068877.250.694847
L3.08.057805.750.930668
M9.09.089948.750.606070
N8.010.099909.000.212891
O10.010.0109999.750.905785
P8.09.0810948.750.415708
Q5.07.065805.750.145941
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average new\n", - "student \n", - "A 10.0 9.0 10 7 97 9.00 0.848599\n", - "B 8.0 7.0 9 9 82 8.25 0.394722\n", - "C 0.0 9.0 6 5 80 5.00 0.957668\n", - "D 8.0 9.0 9 9 90 8.75 0.953680\n", - "E 0.0 10.0 10 10 95 7.50 0.000388\n", - "F 8.0 2.0 6 7 80 5.75 0.898409\n", - "G 6.0 0.0 4 5 80 3.75 0.346747\n", - "H 8.0 8.0 9 8 84 8.25 0.716042\n", - "I 10.0 7.0 10 10 92 9.25 0.965628\n", - "J 10.0 6.0 9 9 91 8.50 0.124690\n", - "K 8.0 7.0 6 8 87 7.25 0.694847\n", - "L 3.0 8.0 5 7 80 5.75 0.930668\n", - "M 9.0 9.0 8 9 94 8.75 0.606070\n", - "N 8.0 10.0 9 9 90 9.00 0.212891\n", - "O 10.0 10.0 10 9 99 9.75 0.905785\n", - "P 8.0 9.0 8 10 94 8.75 0.415708\n", - "Q 5.0 7.0 6 5 80 5.75 0.145941" - ] - }, - "execution_count": 75, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## histogramming" - ] - }, - { - "cell_type": "code", - "execution_count": 76, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "80 5\n", - "94 2\n", - "90 2\n", - "95 1\n", - "92 1\n", - "91 1\n", - "87 1\n", - "84 1\n", - "82 1\n", - "99 1\n", - "97 1\n", - "Name: exam, dtype: int64" - ] - }, - "execution_count": 76, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2[\"exam\"].value_counts()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## plotting" - ] - }, - { - "cell_type": "code", - "execution_count": 77, - "metadata": {}, - "outputs": [], - "source": [ - "%matplotlib inline" - ] - }, - { - "cell_type": "code", - "execution_count": 78, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 78, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "\n", - "text/plain": [ - "" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "g2.plot()" - ] - }, - { - "cell_type": "code", - "execution_count": 79, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 79, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "\n", - "text/plain": [ - "" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "g2.plot.scatter(x=\"hw average\", y=\"exam\", marker=\"o\")" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "A lot more examples at: http://pandas.pydata.org/pandas-docs/stable/visualization.html" - ] - }, - { - "cell_type": "code", - "execution_count": 80, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw averagenew
student
A10.09.0107979.000.848599
B8.07.099828.250.394722
C0.09.065805.000.957668
D8.09.099908.750.953680
E0.010.01010957.500.000388
F8.02.067805.750.898409
G6.00.045803.750.346747
H8.08.098848.250.716042
I10.07.01010929.250.965628
J10.06.099918.500.124690
K8.07.068877.250.694847
L3.08.057805.750.930668
M9.09.089948.750.606070
N8.010.099909.000.212891
O10.010.0109999.750.905785
P8.09.0810948.750.415708
Q5.07.065805.750.145941
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average new\n", - "student \n", - "A 10.0 9.0 10 7 97 9.00 0.848599\n", - "B 8.0 7.0 9 9 82 8.25 0.394722\n", - "C 0.0 9.0 6 5 80 5.00 0.957668\n", - "D 8.0 9.0 9 9 90 8.75 0.953680\n", - "E 0.0 10.0 10 10 95 7.50 0.000388\n", - "F 8.0 2.0 6 7 80 5.75 0.898409\n", - "G 6.0 0.0 4 5 80 3.75 0.346747\n", - "H 8.0 8.0 9 8 84 8.25 0.716042\n", - "I 10.0 7.0 10 10 92 9.25 0.965628\n", - "J 10.0 6.0 9 9 91 8.50 0.124690\n", - "K 8.0 7.0 6 8 87 7.25 0.694847\n", - "L 3.0 8.0 5 7 80 5.75 0.930668\n", - "M 9.0 9.0 8 9 94 8.75 0.606070\n", - "N 8.0 10.0 9 9 90 9.00 0.212891\n", - "O 10.0 10.0 10 9 99 9.75 0.905785\n", - "P 8.0 9.0 8 10 94 8.75 0.415708\n", - "Q 5.0 7.0 6 5 80 5.75 0.145941" - ] - }, - "execution_count": 80, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2" - ] - }, - { - "cell_type": "code", - "execution_count": 81, - "metadata": {}, - "outputs": [], - "source": [ - "g2.loc[\"R\", :] = 1" - ] - }, - { - "cell_type": "code", - "execution_count": 82, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hw 1hw 2hw 3hw 4examhw averagenew
student
A10.09.010.07.097.09.000.848599
B8.07.09.09.082.08.250.394722
C0.09.06.05.080.05.000.957668
D8.09.09.09.090.08.750.953680
E0.010.010.010.095.07.500.000388
F8.02.06.07.080.05.750.898409
G6.00.04.05.080.03.750.346747
H8.08.09.08.084.08.250.716042
I10.07.010.010.092.09.250.965628
J10.06.09.09.091.08.500.124690
K8.07.06.08.087.07.250.694847
L3.08.05.07.080.05.750.930668
M9.09.08.09.094.08.750.606070
N8.010.09.09.090.09.000.212891
O10.010.010.09.099.09.750.905785
P8.09.08.010.094.08.750.415708
Q5.07.06.05.080.05.750.145941
R1.01.01.01.01.01.001.000000
\n", - "
" - ], - "text/plain": [ - " hw 1 hw 2 hw 3 hw 4 exam hw average new\n", - "student \n", - "A 10.0 9.0 10.0 7.0 97.0 9.00 0.848599\n", - "B 8.0 7.0 9.0 9.0 82.0 8.25 0.394722\n", - "C 0.0 9.0 6.0 5.0 80.0 5.00 0.957668\n", - "D 8.0 9.0 9.0 9.0 90.0 8.75 0.953680\n", - "E 0.0 10.0 10.0 10.0 95.0 7.50 0.000388\n", - "F 8.0 2.0 6.0 7.0 80.0 5.75 0.898409\n", - "G 6.0 0.0 4.0 5.0 80.0 3.75 0.346747\n", - "H 8.0 8.0 9.0 8.0 84.0 8.25 0.716042\n", - "I 10.0 7.0 10.0 10.0 92.0 9.25 0.965628\n", - "J 10.0 6.0 9.0 9.0 91.0 8.50 0.124690\n", - "K 8.0 7.0 6.0 8.0 87.0 7.25 0.694847\n", - "L 3.0 8.0 5.0 7.0 80.0 5.75 0.930668\n", - "M 9.0 9.0 8.0 9.0 94.0 8.75 0.606070\n", - "N 8.0 10.0 9.0 9.0 90.0 9.00 0.212891\n", - "O 10.0 10.0 10.0 9.0 99.0 9.75 0.905785\n", - "P 8.0 9.0 8.0 10.0 94.0 8.75 0.415708\n", - "Q 5.0 7.0 6.0 5.0 80.0 5.75 0.145941\n", - "R 1.0 1.0 1.0 1.0 1.0 1.00 1.000000" - ] - }, - "execution_count": 82, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2" - ] - }, - { - "cell_type": "code", - "execution_count": 83, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "'\\\\begin{tabular}{lrrrrrrr}\\n\\\\toprule\\n{} & hw 1 & hw 2 & hw 3 & hw 4 & exam & hw average & new \\\\\\\\\\nstudent & & & & & & & \\\\\\\\\\n\\\\midrule\\nA & 10.0 & 9.0 & 10.0 & 7.0 & 97.0 & 9.00 & 0.848599 \\\\\\\\\\nB & 8.0 & 7.0 & 9.0 & 9.0 & 82.0 & 8.25 & 0.394722 \\\\\\\\\\nC & 0.0 & 9.0 & 6.0 & 5.0 & 80.0 & 5.00 & 0.957668 \\\\\\\\\\nD & 8.0 & 9.0 & 9.0 & 9.0 & 90.0 & 8.75 & 0.953680 \\\\\\\\\\nE & 0.0 & 10.0 & 10.0 & 10.0 & 95.0 & 7.50 & 0.000388 \\\\\\\\\\nF & 8.0 & 2.0 & 6.0 & 7.0 & 80.0 & 5.75 & 0.898409 \\\\\\\\\\nG & 6.0 & 0.0 & 4.0 & 5.0 & 80.0 & 3.75 & 0.346747 \\\\\\\\\\nH & 8.0 & 8.0 & 9.0 & 8.0 & 84.0 & 8.25 & 0.716042 \\\\\\\\\\nI & 10.0 & 7.0 & 10.0 & 10.0 & 92.0 & 9.25 & 0.965628 \\\\\\\\\\nJ & 10.0 & 6.0 & 9.0 & 9.0 & 91.0 & 8.50 & 0.124690 \\\\\\\\\\nK & 8.0 & 7.0 & 6.0 & 8.0 & 87.0 & 7.25 & 0.694847 \\\\\\\\\\nL & 3.0 & 8.0 & 5.0 & 7.0 & 80.0 & 5.75 & 0.930668 \\\\\\\\\\nM & 9.0 & 9.0 & 8.0 & 9.0 & 94.0 & 8.75 & 0.606070 \\\\\\\\\\nN & 8.0 & 10.0 & 9.0 & 9.0 & 90.0 & 9.00 & 0.212891 \\\\\\\\\\nO & 10.0 & 10.0 & 10.0 & 9.0 & 99.0 & 9.75 & 0.905785 \\\\\\\\\\nP & 8.0 & 9.0 & 8.0 & 10.0 & 94.0 & 8.75 & 0.415708 \\\\\\\\\\nQ & 5.0 & 7.0 & 6.0 & 5.0 & 80.0 & 5.75 & 0.145941 \\\\\\\\\\nR & 1.0 & 1.0 & 1.0 & 1.0 & 1.0 & 1.00 & 1.000000 \\\\\\\\\\n\\\\bottomrule\\n\\\\end{tabular}\\n'" - ] - }, - "execution_count": 83, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "g2.to_latex()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.6.5" - } - }, - "nbformat": 4, - "nbformat_minor": 1 -} diff --git a/content/07-pandas/pandas-worldbank.ipynb b/content/07-pandas/pandas-worldbank.ipynb deleted file mode 100644 index be238897..00000000 --- a/content/07-pandas/pandas-worldbank.ipynb +++ /dev/null @@ -1,4013 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Dataset from: http://data.worldbank.org/" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": { - "collapsed": true - }, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import numpy as np\n", - "import matplotlib.pyplot as plt" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": { - "collapsed": false - }, - "outputs": [], - "source": [ - "wb = pd.read_csv(\"WDI_Data.csv\", index_col=\"Country Name\")" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": { - "collapsed": false - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
Country CodeIndicator NameIndicator Code1960196119621963196419651966...200820092010201120122013201420152016Unnamed: 61
Country Name
Arab WorldARB2005 PPP conversion factor, GDP (LCU per inter...PA.NUS.PPP.05NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARB2005 PPP conversion factor, private consumptio...PA.NUS.PRVT.PP.05NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAccess to electricity (% of population)EG.ELC.ACCS.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN8.436235e+01NaN8.628035e+01NaNNaNNaNNaNNaN
Arab WorldARBAccess to electricity, rural (% of rural popul...EG.ELC.ACCS.RU.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN7.198423e+01NaN7.391781e+01NaNNaNNaNNaNNaN
Arab WorldARBAccess to electricity, urban (% of urban popul...EG.ELC.ACCS.UR.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN9.383966e+01NaN9.515673e+01NaNNaNNaNNaNNaN
Arab WorldARBAccess to non-solid fuel (% of population)EG.NSF.ACCS.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN8.602252e+01NaN8.658057e+01NaNNaNNaNNaNNaN
Arab WorldARBAccess to non-solid fuel, rural (% of rural po...EG.NSF.ACCS.RU.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN7.456626e+01NaN7.494069e+01NaNNaNNaNNaNNaN
Arab WorldARBAccess to non-solid fuel, urban (% of urban po...EG.NSF.ACCS.UR.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN9.455237e+01NaN9.497705e+01NaNNaNNaNNaNNaN
Arab WorldARBAccount at a financial institution (% age 15+)...WP_time_01.1NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAccount at a financial institution, female (% ...WP_time_01.3NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAccount at a financial institution, income, po...WP_time_01.8NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAccount at a financial institution, income, ri...WP_time_01.9NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAccount at a financial institution, male (% ag...WP_time_01.2NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAdequacy of social insurance programs (% of to...per_si_allsi.adq_pop_totNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAdequacy of social protection and labor progra...per_allsp.adq_pop_totNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAdequacy of social safety net programs (% of t...per_sa_allsa.adq_pop_totNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAdequacy of unemployment benefits and ALMP (% ...per_lm_alllm.adq_pop_totNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAdjusted net enrollment rate, primary, female ...SE.PRM.TENR.FENaNNaNNaNNaNNaNNaNNaN...8.147380e+018.169569e+018.287165e+018.286139e+018.440141e+018.391403e+018.382083e+01NaNNaNNaN
Arab WorldARBAdjusted net enrollment rate, primary, male (%...SE.PRM.TENR.MANaNNaNNaNNaNNaNNaNNaN...8.644414e+018.659069e+018.745258e+018.752652e+018.772817e+018.703988e+018.675339e+01NaNNaNNaN
Arab WorldARBAdjusted net enrolment rate, primary, both sex...SE.PRM.TENRNaNNaNNaNNaNNaNNaNNaN...8.401187e+018.419596e+018.521200e+018.524514e+018.610167e+018.551194e+018.532015e+01NaNNaNNaN
Arab WorldARBAdjusted net national income (annual % growth)NY.ADJ.NNTY.KD.ZGNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN9.524779e+006.706404e+002.499334e+00NaNNaNNaNNaN
Arab WorldARBAdjusted net national income (constant 2010 US$)NY.ADJ.NNTY.KDNaNNaNNaNNaNNaNNaNNaN...NaNNaN1.529192e+121.674845e+121.787166e+121.831834e+12NaNNaNNaNNaN
Arab WorldARBAdjusted net national income (current US$)NY.ADJ.NNTY.CDNaNNaNNaNNaNNaNNaNNaN...1.424482e+121.354331e+121.529192e+121.773875e+122.012007e+122.088333e+122.156246e+12NaNNaNNaN
Arab WorldARBAdjusted net national income per capita (annua...NY.ADJ.NNTY.PC.KD.ZGNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN7.122247e+004.458066e+004.026424e-01NaNNaNNaNNaN
Arab WorldARBAdjusted net national income per capita (const...NY.ADJ.NNTY.PC.KDNaNNaNNaNNaNNaNNaNNaN...NaNNaN4.330613e+034.639050e+034.845862e+034.865373e+03NaNNaNNaNNaN
Arab WorldARBAdjusted net national income per capita (curre...NY.ADJ.NNTY.PC.CDNaNNaNNaNNaNNaNNaNNaN...4.228375e+033.924980e+034.330613e+034.913349e+035.455513e+035.546640e+035.611972e+03NaNNaNNaN
Arab WorldARBAdjusted net savings, excluding particulate em...NY.ADJ.SVNX.GN.ZSNaNNaNNaNNaNNaNNaNNaN...1.725361e+019.157418e+001.220151e+011.690138e+011.645197e+011.592986e+01NaNNaNNaNNaN
Arab WorldARBAdjusted net savings, excluding particulate em...NY.ADJ.SVNX.CDNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
Arab WorldARBAdjusted net savings, including particulate em...NY.ADJ.SVNG.GN.ZSNaNNaNNaNNaNNaNNaNNaN...1.704717e+018.936666e+001.198311e+011.668852e+011.624965e+011.573042e+01NaNNaNNaNNaN
Arab WorldARBAdjusted net savings, including particulate em...NY.ADJ.SVNG.CDNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
..................................................................
ZimbabweZWEUrban land area where elevation is below 5 met...AG.LND.EL5M.UR.K2NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
ZimbabweZWEUrban populationSP.URB.TOTL473101.000000497024.000000524099.000000562238.000000603076.000000646516.000000692786.00000...4.529077e+064.579794e+064.638775e+064.706484e+064.782430e+064.864823e+064.955055e+065.051547e+06NaNNaN
ZimbabweZWEUrban population (% of total)SP.URB.TOTL.IN.ZS12.60800012.82100013.08200013.57800014.09200014.62000015.16500...3.356000e+013.337800e+013.319600e+013.301500e+013.283400e+013.265400e+013.250100e+013.237600e+01NaNNaN
ZimbabweZWEUrban population growth (annual %)SP.URB.GROW4.8977464.9329425.3042287.0244657.0117986.9554726.91232...9.316901e-011.113585e+001.279630e+001.449081e+001.600765e+001.708155e+001.837793e+001.928627e+00NaNNaN
ZimbabweZWEUrban population living in areas where elevati...EN.POP.EL5M.UR.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
ZimbabweZWEUrban poverty gap at national poverty lines (%)SI.POV.URGPNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN1.550000e+01NaNNaNNaNNaNNaNNaN
ZimbabweZWEUrban poverty headcount ratio at national pove...SI.POV.URHCNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN4.650000e+01NaNNaNNaNNaNNaNNaN
ZimbabweZWEUse of IMF credit (DOD, current US$)DT.DOD.DIMF.CDNaNNaNNaNNaNNaNNaNNaN...1.294260e+085.423170e+085.287290e+085.270950e+085.201240e+085.193420e+084.867300e+084.637530e+08NaNNaN
ZimbabweZWEUse of insecticide-treated bed nets (% of unde...SH.MLR.NETS.ZSNaNNaNNaNNaNNaNNaNNaN...NaN1.730000e+01NaN9.700000e+00NaNNaN2.680000e+01NaNNaNNaN
ZimbabweZWEValue lost due to electrical outages (% of sales)IC.FRM.OUTG.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN8.800000e+00NaNNaNNaNNaNNaNNaN
ZimbabweZWEVitamin A supplementation coverage rate (% of ...SN.ITK.VITA.ZSNaNNaNNaNNaNNaNNaNNaN...0.000000e+007.700000e+014.900000e+014.700000e+016.100000e+013.400000e+013.200000e+01NaNNaNNaN
ZimbabweZWEVulnerable employment, female (% of female emp...SL.EMP.VULN.FE.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN8.310000e+017.560000e+01NaNNaNNaNNaNNaN
ZimbabweZWEVulnerable employment, male (% of male employm...SL.EMP.VULN.MA.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN6.590000e+015.660000e+01NaNNaNNaNNaNNaN
ZimbabweZWEVulnerable employment, total (% of total emplo...SL.EMP.VULN.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN7.450000e+016.550000e+01NaNNaNNaNNaNNaN
ZimbabweZWEWage and salaried workers, female (% of female...SL.EMP.WORK.FE.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN1.650000e+012.410000e+01NaNNaNNaNNaNNaN
ZimbabweZWEWage and salaried workers, male (% of male emp...SL.EMP.WORK.MA.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN3.340000e+014.270000e+01NaNNaNNaNNaNNaN
ZimbabweZWEWage and salaried workers, total (% of total e...SL.EMP.WORK.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN2.490000e+013.400000e+01NaNNaNNaNNaNNaN
ZimbabweZWEWanted fertility rate (births per woman)SP.DYN.WFRTNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN3.500000e+00NaNNaNNaNNaNNaNNaN
ZimbabweZWEWater productivity, total (constant 2010 US$ G...ER.GDP.FWTL.M3.KDNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaN3.543247e+00NaNNaNNaN
ZimbabweZWEWholesale price index (2010 = 100)FP.WPI.TOTLNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
ZimbabweZWEWomen participating in the three decisions (ow...SG.DMK.ALLD.FN.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN7.450000e+01NaNNaNNaNNaNNaNNaN
ZimbabweZWEWomen who believe a husband is justified in be...SG.VAW.REAS.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN3.960000e+01NaNNaN3.740000e+01NaNNaNNaN
ZimbabweZWEWomen who believe a husband is justified in be...SG.VAW.ARGU.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN1.560000e+01NaNNaNNaNNaNNaNNaN
ZimbabweZWEWomen who believe a husband is justified in be...SG.VAW.BURN.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN7.500000e+00NaNNaNNaNNaNNaNNaN
ZimbabweZWEWomen who believe a husband is justified in be...SG.VAW.GOES.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN2.230000e+01NaNNaNNaNNaNNaNNaN
ZimbabweZWEWomen who believe a husband is justified in be...SG.VAW.NEGL.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN2.140000e+01NaNNaNNaNNaNNaNNaN
ZimbabweZWEWomen who believe a husband is justified in be...SG.VAW.REFU.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN1.690000e+01NaNNaNNaNNaNNaNNaN
ZimbabweZWEWomen who were first married by age 18 (% of w...SP.M18.2024.FE.ZSNaNNaNNaNNaNNaNNaNNaN...NaN3.010000e+01NaN3.050000e+01NaNNaN3.350000e+01NaNNaNNaN
ZimbabweZWEWomen's share of population ages 15+ living wi...SH.DYN.AIDS.FE.ZSNaNNaNNaNNaNNaNNaNNaN...5.876080e+015.881242e+015.882594e+015.889931e+015.893908e+015.890013e+015.882233e+015.885555e+01NaNNaN
ZimbabweZWEYouth literacy rate, population 15-24 years, b...SE.ADT.1524.LT.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN9.093070e+01NaNNaNNaN9.175005e+01NaNNaN
\n", - "

383328 rows × 61 columns

\n", - "
" - ], - "text/plain": [ - " Country Code Indicator Name \\\n", - "Country Name \n", - "Arab World ARB 2005 PPP conversion factor, GDP (LCU per inter... \n", - "Arab World ARB 2005 PPP conversion factor, private consumptio... \n", - "Arab World ARB Access to electricity (% of population) \n", - "Arab World ARB Access to electricity, rural (% of rural popul... \n", - "Arab World ARB Access to electricity, urban (% of urban popul... \n", - "Arab World ARB Access to non-solid fuel (% of population) \n", - "Arab World ARB Access to non-solid fuel, rural (% of rural po... \n", - "Arab World ARB Access to non-solid fuel, urban (% of urban po... \n", - "Arab World ARB Account at a financial institution (% age 15+)... \n", - "Arab World ARB Account at a financial institution, female (% ... \n", - "Arab World ARB Account at a financial institution, income, po... \n", - "Arab World ARB Account at a financial institution, income, ri... \n", - "Arab World ARB Account at a financial institution, male (% ag... \n", - "Arab World ARB Adequacy of social insurance programs (% of to... \n", - "Arab World ARB Adequacy of social protection and labor progra... \n", - "Arab World ARB Adequacy of social safety net programs (% of t... \n", - "Arab World ARB Adequacy of unemployment benefits and ALMP (% ... \n", - "Arab World ARB Adjusted net enrollment rate, primary, female ... \n", - "Arab World ARB Adjusted net enrollment rate, primary, male (%... \n", - "Arab World ARB Adjusted net enrolment rate, primary, both sex... \n", - "Arab World ARB Adjusted net national income (annual % growth) \n", - "Arab World ARB Adjusted net national income (constant 2010 US$) \n", - "Arab World ARB Adjusted net national income (current US$) \n", - "Arab World ARB Adjusted net national income per capita (annua... \n", - "Arab World ARB Adjusted net national income per capita (const... \n", - "Arab World ARB Adjusted net national income per capita (curre... \n", - "Arab World ARB Adjusted net savings, excluding particulate em... \n", - "Arab World ARB Adjusted net savings, excluding particulate em... \n", - "Arab World ARB Adjusted net savings, including particulate em... \n", - "Arab World ARB Adjusted net savings, including particulate em... \n", - "... ... ... \n", - "Zimbabwe ZWE Urban land area where elevation is below 5 met... \n", - "Zimbabwe ZWE Urban population \n", - "Zimbabwe ZWE Urban population (% of total) \n", - "Zimbabwe ZWE Urban population growth (annual %) \n", - "Zimbabwe ZWE Urban population living in areas where elevati... \n", - "Zimbabwe ZWE Urban poverty gap at national poverty lines (%) \n", - "Zimbabwe ZWE Urban poverty headcount ratio at national pove... \n", - "Zimbabwe ZWE Use of IMF credit (DOD, current US$) \n", - "Zimbabwe ZWE Use of insecticide-treated bed nets (% of unde... \n", - "Zimbabwe ZWE Value lost due to electrical outages (% of sales) \n", - "Zimbabwe ZWE Vitamin A supplementation coverage rate (% of ... \n", - "Zimbabwe ZWE Vulnerable employment, female (% of female emp... \n", - "Zimbabwe ZWE Vulnerable employment, male (% of male employm... \n", - "Zimbabwe ZWE Vulnerable employment, total (% of total emplo... \n", - "Zimbabwe ZWE Wage and salaried workers, female (% of female... \n", - "Zimbabwe ZWE Wage and salaried workers, male (% of male emp... \n", - "Zimbabwe ZWE Wage and salaried workers, total (% of total e... \n", - "Zimbabwe ZWE Wanted fertility rate (births per woman) \n", - "Zimbabwe ZWE Water productivity, total (constant 2010 US$ G... \n", - "Zimbabwe ZWE Wholesale price index (2010 = 100) \n", - "Zimbabwe ZWE Women participating in the three decisions (ow... \n", - "Zimbabwe ZWE Women who believe a husband is justified in be... \n", - "Zimbabwe ZWE Women who believe a husband is justified in be... \n", - "Zimbabwe ZWE Women who believe a husband is justified in be... \n", - "Zimbabwe ZWE Women who believe a husband is justified in be... \n", - "Zimbabwe ZWE Women who believe a husband is justified in be... \n", - "Zimbabwe ZWE Women who believe a husband is justified in be... \n", - "Zimbabwe ZWE Women who were first married by age 18 (% of w... \n", - "Zimbabwe ZWE Women's share of population ages 15+ living wi... \n", - "Zimbabwe ZWE Youth literacy rate, population 15-24 years, b... \n", - "\n", - " Indicator Code 1960 1961 \\\n", - "Country Name \n", - "Arab World PA.NUS.PPP.05 NaN NaN \n", - "Arab World PA.NUS.PRVT.PP.05 NaN NaN \n", - "Arab World EG.ELC.ACCS.ZS NaN NaN \n", - "Arab World EG.ELC.ACCS.RU.ZS NaN NaN \n", - "Arab World EG.ELC.ACCS.UR.ZS NaN NaN \n", - "Arab World EG.NSF.ACCS.ZS NaN NaN \n", - "Arab World EG.NSF.ACCS.RU.ZS NaN NaN \n", - "Arab World EG.NSF.ACCS.UR.ZS NaN NaN \n", - "Arab World WP_time_01.1 NaN NaN \n", - "Arab World WP_time_01.3 NaN NaN \n", - "Arab World WP_time_01.8 NaN NaN \n", - "Arab World WP_time_01.9 NaN NaN \n", - "Arab World WP_time_01.2 NaN NaN \n", - "Arab World per_si_allsi.adq_pop_tot NaN NaN \n", - "Arab World per_allsp.adq_pop_tot NaN NaN \n", - "Arab World per_sa_allsa.adq_pop_tot NaN NaN \n", - "Arab World per_lm_alllm.adq_pop_tot NaN NaN \n", - "Arab World SE.PRM.TENR.FE NaN NaN \n", - "Arab World SE.PRM.TENR.MA NaN NaN \n", - "Arab World SE.PRM.TENR NaN NaN \n", - "Arab World NY.ADJ.NNTY.KD.ZG NaN NaN \n", - "Arab World NY.ADJ.NNTY.KD NaN NaN \n", - "Arab World NY.ADJ.NNTY.CD NaN NaN \n", - "Arab World NY.ADJ.NNTY.PC.KD.ZG NaN NaN \n", - "Arab World NY.ADJ.NNTY.PC.KD NaN NaN \n", - "Arab World NY.ADJ.NNTY.PC.CD NaN NaN \n", - "Arab World NY.ADJ.SVNX.GN.ZS NaN NaN \n", - "Arab World NY.ADJ.SVNX.CD NaN NaN \n", - "Arab World NY.ADJ.SVNG.GN.ZS NaN NaN \n", - "Arab World NY.ADJ.SVNG.CD NaN NaN \n", - "... ... ... ... \n", - "Zimbabwe AG.LND.EL5M.UR.K2 NaN NaN \n", - "Zimbabwe SP.URB.TOTL 473101.000000 497024.000000 \n", - "Zimbabwe SP.URB.TOTL.IN.ZS 12.608000 12.821000 \n", - "Zimbabwe SP.URB.GROW 4.897746 4.932942 \n", - "Zimbabwe EN.POP.EL5M.UR.ZS NaN NaN \n", - "Zimbabwe SI.POV.URGP NaN NaN \n", - "Zimbabwe SI.POV.URHC NaN NaN \n", - "Zimbabwe DT.DOD.DIMF.CD NaN NaN \n", - "Zimbabwe SH.MLR.NETS.ZS NaN NaN \n", - "Zimbabwe IC.FRM.OUTG.ZS NaN NaN \n", - "Zimbabwe SN.ITK.VITA.ZS NaN NaN \n", - "Zimbabwe SL.EMP.VULN.FE.ZS NaN NaN \n", - "Zimbabwe SL.EMP.VULN.MA.ZS NaN NaN \n", - "Zimbabwe SL.EMP.VULN.ZS NaN NaN \n", - "Zimbabwe SL.EMP.WORK.FE.ZS NaN NaN \n", - "Zimbabwe SL.EMP.WORK.MA.ZS NaN NaN \n", - "Zimbabwe SL.EMP.WORK.ZS NaN NaN \n", - "Zimbabwe SP.DYN.WFRT NaN NaN \n", - "Zimbabwe ER.GDP.FWTL.M3.KD NaN NaN \n", - "Zimbabwe FP.WPI.TOTL NaN NaN \n", - "Zimbabwe SG.DMK.ALLD.FN.ZS NaN NaN \n", - "Zimbabwe SG.VAW.REAS.ZS NaN NaN \n", - "Zimbabwe SG.VAW.ARGU.ZS NaN NaN \n", - "Zimbabwe SG.VAW.BURN.ZS NaN NaN \n", - "Zimbabwe SG.VAW.GOES.ZS NaN NaN \n", - "Zimbabwe SG.VAW.NEGL.ZS NaN NaN \n", - "Zimbabwe SG.VAW.REFU.ZS NaN NaN \n", - "Zimbabwe SP.M18.2024.FE.ZS NaN NaN \n", - "Zimbabwe SH.DYN.AIDS.FE.ZS NaN NaN \n", - "Zimbabwe SE.ADT.1524.LT.ZS NaN NaN \n", - "\n", - " 1962 1963 1964 1965 \\\n", - "Country Name \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "... ... ... ... ... \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe 524099.000000 562238.000000 603076.000000 646516.000000 \n", - "Zimbabwe 13.082000 13.578000 14.092000 14.620000 \n", - "Zimbabwe 5.304228 7.024465 7.011798 6.955472 \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "\n", - " 1966 ... 2008 2009 \\\n", - "Country Name ... \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... 8.147380e+01 8.169569e+01 \n", - "Arab World NaN ... 8.644414e+01 8.659069e+01 \n", - "Arab World NaN ... 8.401187e+01 8.419596e+01 \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... 1.424482e+12 1.354331e+12 \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... 4.228375e+03 3.924980e+03 \n", - "Arab World NaN ... 1.725361e+01 9.157418e+00 \n", - "Arab World NaN ... NaN NaN \n", - "Arab World NaN ... 1.704717e+01 8.936666e+00 \n", - "Arab World NaN ... NaN NaN \n", - "... ... ... ... ... \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe 692786.00000 ... 4.529077e+06 4.579794e+06 \n", - "Zimbabwe 15.16500 ... 3.356000e+01 3.337800e+01 \n", - "Zimbabwe 6.91232 ... 9.316901e-01 1.113585e+00 \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... 1.294260e+08 5.423170e+08 \n", - "Zimbabwe NaN ... NaN 1.730000e+01 \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... 0.000000e+00 7.700000e+01 \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN NaN \n", - "Zimbabwe NaN ... NaN 3.010000e+01 \n", - "Zimbabwe NaN ... 5.876080e+01 5.881242e+01 \n", - "Zimbabwe NaN ... NaN NaN \n", - "\n", - " 2010 2011 2012 2013 \\\n", - "Country Name \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World 8.436235e+01 NaN 8.628035e+01 NaN \n", - "Arab World 7.198423e+01 NaN 7.391781e+01 NaN \n", - "Arab World 9.383966e+01 NaN 9.515673e+01 NaN \n", - "Arab World 8.602252e+01 NaN 8.658057e+01 NaN \n", - "Arab World 7.456626e+01 NaN 7.494069e+01 NaN \n", - "Arab World 9.455237e+01 NaN 9.497705e+01 NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World 8.287165e+01 8.286139e+01 8.440141e+01 8.391403e+01 \n", - "Arab World 8.745258e+01 8.752652e+01 8.772817e+01 8.703988e+01 \n", - "Arab World 8.521200e+01 8.524514e+01 8.610167e+01 8.551194e+01 \n", - "Arab World NaN 9.524779e+00 6.706404e+00 2.499334e+00 \n", - "Arab World 1.529192e+12 1.674845e+12 1.787166e+12 1.831834e+12 \n", - "Arab World 1.529192e+12 1.773875e+12 2.012007e+12 2.088333e+12 \n", - "Arab World NaN 7.122247e+00 4.458066e+00 4.026424e-01 \n", - "Arab World 4.330613e+03 4.639050e+03 4.845862e+03 4.865373e+03 \n", - "Arab World 4.330613e+03 4.913349e+03 5.455513e+03 5.546640e+03 \n", - "Arab World 1.220151e+01 1.690138e+01 1.645197e+01 1.592986e+01 \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World 1.198311e+01 1.668852e+01 1.624965e+01 1.573042e+01 \n", - "Arab World NaN NaN NaN NaN \n", - "... ... ... ... ... \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe 4.638775e+06 4.706484e+06 4.782430e+06 4.864823e+06 \n", - "Zimbabwe 3.319600e+01 3.301500e+01 3.283400e+01 3.265400e+01 \n", - "Zimbabwe 1.279630e+00 1.449081e+00 1.600765e+00 1.708155e+00 \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN 1.550000e+01 NaN NaN \n", - "Zimbabwe NaN 4.650000e+01 NaN NaN \n", - "Zimbabwe 5.287290e+08 5.270950e+08 5.201240e+08 5.193420e+08 \n", - "Zimbabwe NaN 9.700000e+00 NaN NaN \n", - "Zimbabwe NaN 8.800000e+00 NaN NaN \n", - "Zimbabwe 4.900000e+01 4.700000e+01 6.100000e+01 3.400000e+01 \n", - "Zimbabwe NaN 8.310000e+01 7.560000e+01 NaN \n", - "Zimbabwe NaN 6.590000e+01 5.660000e+01 NaN \n", - "Zimbabwe NaN 7.450000e+01 6.550000e+01 NaN \n", - "Zimbabwe NaN 1.650000e+01 2.410000e+01 NaN \n", - "Zimbabwe NaN 3.340000e+01 4.270000e+01 NaN \n", - "Zimbabwe NaN 2.490000e+01 3.400000e+01 NaN \n", - "Zimbabwe NaN 3.500000e+00 NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN 7.450000e+01 NaN NaN \n", - "Zimbabwe NaN 3.960000e+01 NaN NaN \n", - "Zimbabwe NaN 1.560000e+01 NaN NaN \n", - "Zimbabwe NaN 7.500000e+00 NaN NaN \n", - "Zimbabwe NaN 2.230000e+01 NaN NaN \n", - "Zimbabwe NaN 2.140000e+01 NaN NaN \n", - "Zimbabwe NaN 1.690000e+01 NaN NaN \n", - "Zimbabwe NaN 3.050000e+01 NaN NaN \n", - "Zimbabwe 5.882594e+01 5.889931e+01 5.893908e+01 5.890013e+01 \n", - "Zimbabwe NaN 9.093070e+01 NaN NaN \n", - "\n", - " 2014 2015 2016 Unnamed: 61 \n", - "Country Name \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World 8.382083e+01 NaN NaN NaN \n", - "Arab World 8.675339e+01 NaN NaN NaN \n", - "Arab World 8.532015e+01 NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World 2.156246e+12 NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World 5.611972e+03 NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "Arab World NaN NaN NaN NaN \n", - "... ... ... ... ... \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe 4.955055e+06 5.051547e+06 NaN NaN \n", - "Zimbabwe 3.250100e+01 3.237600e+01 NaN NaN \n", - "Zimbabwe 1.837793e+00 1.928627e+00 NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe 4.867300e+08 4.637530e+08 NaN NaN \n", - "Zimbabwe 2.680000e+01 NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe 3.200000e+01 NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe 3.543247e+00 NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe 3.740000e+01 NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe NaN NaN NaN NaN \n", - "Zimbabwe 3.350000e+01 NaN NaN NaN \n", - "Zimbabwe 5.882233e+01 5.885555e+01 NaN NaN \n", - "Zimbabwe NaN 9.175005e+01 NaN NaN \n", - "\n", - "[383328 rows x 61 columns]" - ] - }, - "execution_count": 4, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "wb" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": { - "collapsed": false - }, - "outputs": [ - { - "data": { - "text/plain": [ - "Index(['Arab World', 'Arab World', 'Arab World', 'Arab World', 'Arab World',\n", - " 'Arab World', 'Arab World', 'Arab World', 'Arab World', 'Arab World',\n", - " ...\n", - " 'Zimbabwe', 'Zimbabwe', 'Zimbabwe', 'Zimbabwe', 'Zimbabwe', 'Zimbabwe',\n", - " 'Zimbabwe', 'Zimbabwe', 'Zimbabwe', 'Zimbabwe'],\n", - " dtype='object', name='Country Name', length=383328)" - ] - }, - "execution_count": 5, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "wb.index" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": { - "collapsed": false - }, - "outputs": [], - "source": [ - "us = set([n for n in wb.index if n.startswith(\"U\")])" - ] - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": { - "collapsed": false, - "scrolled": true - }, - "outputs": [ - { - "data": { - "text/plain": [ - "False" - ] - }, - "execution_count": 20, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "\"United States\" in wb" - ] - }, - { - "cell_type": "code", - "execution_count": 21, - "metadata": { - "collapsed": false - }, - "outputs": [ - { - "data": { - "text/plain": [ - "{'Uganda',\n", - " 'Ukraine',\n", - " 'United Arab Emirates',\n", - " 'United Kingdom',\n", - " 'United States',\n", - " 'Upper middle income',\n", - " 'Uruguay',\n", - " 'Uzbekistan'}" - ] - }, - "execution_count": 21, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "us" - ] - }, - { - "cell_type": "code", - "execution_count": 22, - "metadata": { - "collapsed": false - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
Country CodeIndicator NameIndicator Code1960196119621963196419651966...200820092010201120122013201420152016Unnamed: 61
Country Name
United StatesUSA2005 PPP conversion factor, GDP (LCU per inter...PA.NUS.PPP.05NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSA2005 PPP conversion factor, private consumptio...PA.NUS.PRVT.PP.05NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAAccess to electricity (% of population)EG.ELC.ACCS.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN1.000000e+02NaN1.000000e+02NaNNaNNaNNaNNaN
United StatesUSAAccess to electricity, rural (% of rural popul...EG.ELC.ACCS.RU.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN1.000000e+02NaN1.000000e+02NaNNaNNaNNaNNaN
United StatesUSAAccess to electricity, urban (% of urban popul...EG.ELC.ACCS.UR.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN1.000000e+02NaN1.000000e+02NaNNaNNaNNaNNaN
United StatesUSAAccess to non-solid fuel (% of population)EG.NSF.ACCS.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN1.000000e+02NaN1.000000e+02NaNNaNNaNNaNNaN
United StatesUSAAccess to non-solid fuel, rural (% of rural po...EG.NSF.ACCS.RU.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN1.000000e+02NaN1.000000e+02NaNNaNNaNNaNNaN
United StatesUSAAccess to non-solid fuel, urban (% of urban po...EG.NSF.ACCS.UR.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN1.000000e+02NaN1.000000e+02NaNNaNNaNNaNNaN
United StatesUSAAccount at a financial institution (% age 15+)...WP_time_01.1NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN8.795786e+01NaNNaN9.358380e+01NaNNaNNaN
United StatesUSAAccount at a financial institution, female (% ...WP_time_01.3NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN8.406905e+01NaNNaN9.479771e+01NaNNaNNaN
United StatesUSAAccount at a financial institution, income, po...WP_time_01.8NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN8.099529e+01NaNNaN8.711619e+01NaNNaNNaN
United StatesUSAAccount at a financial institution, income, ri...WP_time_01.9NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN9.281008e+01NaNNaN9.790414e+01NaNNaNNaN
United StatesUSAAccount at a financial institution, male (% ag...WP_time_01.2NaNNaNNaNNaNNaNNaNNaN...NaNNaNNaN9.198194e+01NaNNaN9.236126e+01NaNNaNNaN
United StatesUSAAdequacy of social insurance programs (% of to...per_si_allsi.adq_pop_totNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAAdequacy of social protection and labor progra...per_allsp.adq_pop_totNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAAdequacy of social safety net programs (% of t...per_sa_allsa.adq_pop_totNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAAdequacy of unemployment benefits and ALMP (% ...per_lm_alllm.adq_pop_totNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAAdjusted net enrollment rate, primary, female ...SE.PRM.TENR.FENaNNaNNaNNaNNaNNaNNaN...9.794343e+019.709736e+019.513818e+019.467457e+019.410391e+019.262706e+019.443206e+01NaNNaNNaN
United StatesUSAAdjusted net enrollment rate, primary, male (%...SE.PRM.TENR.MANaNNaNNaNNaNNaNNaNNaN...9.704943e+019.501399e+019.446875e+019.324649e+019.411461e+019.292106e+019.365279e+01NaNNaNNaN
United StatesUSAAdjusted net enrolment rate, primary, both sex...SE.PRM.TENRNaNNaNNaNNaNNaNNaNNaN...9.748575e+019.603130e+019.479582e+019.394464e+019.410937e+019.277709e+019.403453e+01NaNNaNNaN
United StatesUSAAdjusted net national income (annual % growth)NY.ADJ.NNTY.KD.ZGNaNNaNNaNNaNNaNNaNNaN...-2.788922e+00-8.504354e-013.342398e+002.076668e+003.645016e+001.333261e+002.769931e+00NaNNaNNaN
United StatesUSAAdjusted net national income (constant 2010 US$)NY.ADJ.NNTY.KDNaNNaNNaNNaNNaNNaNNaN...1.231703e+131.221228e+131.262046e+131.288254e+131.335212e+131.353013e+131.390491e+13NaNNaNNaN
United StatesUSAAdjusted net national income (current US$)NY.ADJ.NNTY.CDNaNNaNNaNNaNNaNNaNNaN...1.216984e+131.203082e+131.262046e+131.319294e+131.391432e+131.429645e+131.494105e+13NaNNaNNaN
United StatesUSAAdjusted net national income per capita (annua...NY.ADJ.NNTY.PC.KD.ZGNaNNaNNaNNaNNaNNaNNaN...-3.704072e+00-1.715833e+002.482066e+001.299926e+002.858440e+005.887723e-011.970734e+00NaNNaNNaN
United StatesUSAAdjusted net national income per capita (const...NY.ADJ.NNTY.PC.KDNaNNaNNaNNaNNaNNaNNaN...4.050401e+043.980903e+044.079712e+044.132745e+044.250877e+044.275905e+044.360171e+04NaNNaNNaN
United StatesUSAAdjusted net national income per capita (curre...NY.ADJ.NNTY.PC.CDNaNNaNNaNNaNNaNNaNNaN...4.001999e+043.921754e+044.079712e+044.232319e+044.429865e+044.518081e+044.685075e+04NaNNaNNaN
United StatesUSAAdjusted net savings, excluding particulate em...NY.ADJ.SVNX.GN.ZSNaNNaNNaNNaNNaNNaNNaN...2.075956e+001.735874e+002.973072e+003.712649e+005.847932e+005.621072e+006.560417e+00NaNNaNNaN
United StatesUSAAdjusted net savings, excluding particulate em...NY.ADJ.SVNX.CDNaNNaNNaNNaNNaNNaNNaN...3.070588e+112.516063e+114.495612e+115.867062e+119.705286e+119.607086e+111.169276e+12NaNNaNNaN
United StatesUSAAdjusted net savings, including particulate em...NY.ADJ.SVNG.GN.ZSNaNNaNNaNNaNNaNNaNNaN...1.889611e+001.548930e+002.797694e+003.545417e+005.690151e+005.470228e+006.418385e+00NaNNaNNaN
United StatesUSAAdjusted net savings, including particulate em...NY.ADJ.SVNG.CDNaNNaNNaNNaNNaNNaNNaN...2.794962e+112.245096e+114.230421e+115.602786e+119.443431e+119.349277e+111.143962e+12NaNNaNNaN
..................................................................
United StatesUSAUrban land area where elevation is below 5 met...AG.LND.EL5M.UR.K2NaNNaNNaNNaNNaNNaNNaN...NaNNaN1.752022e+04NaNNaNNaNNaNNaNNaNNaN
United StatesUSAUrban populationSP.URB.TOTL1.264625e+081.292762e+081.319887e+081.346154e+081.372160e+081.396631e+081.420087e+08...2.446071e+082.472763e+082.498656e+082.523052e+082.547624e+082.571827e+082.597405e+082.623324e+08NaNNaN
United StatesUSAUrban population (% of total)SP.URB.TOTL.IN.ZS6.999600e+017.037700e+017.075700e+017.113400e+017.150800e+017.187900e+017.224700e+01...8.043800e+018.060600e+018.077200e+018.094000e+018.110800e+018.127700e+018.144700e+018.161700e+01NaNNaN
United StatesUSAUrban population growth (annual %)SP.URB.GROW2.449104e+002.200571e+002.076494e+001.970559e+001.913437e+001.767653e+001.665559e+00...1.156186e+001.085290e+001.041720e+009.716271e-019.691533e-019.455534e-019.896394e-019.929296e-01NaNNaN
United StatesUSAUrban population living in areas where elevati...EN.POP.EL5M.UR.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaN2.263942e+00NaNNaNNaNNaNNaNNaNNaN
United StatesUSAUrban poverty gap at national poverty lines (%)SI.POV.URGPNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAUrban poverty headcount ratio at national pove...SI.POV.URHCNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAUse of IMF credit (DOD, current US$)DT.DOD.DIMF.CDNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAUse of insecticide-treated bed nets (% of unde...SH.MLR.NETS.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAValue lost due to electrical outages (% of sales)IC.FRM.OUTG.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAVitamin A supplementation coverage rate (% of ...SN.ITK.VITA.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAVulnerable employment, female (% of female emp...SL.EMP.VULN.FE.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAVulnerable employment, male (% of male employm...SL.EMP.VULN.MA.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAVulnerable employment, total (% of total emplo...SL.EMP.VULN.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWage and salaried workers, female (% of female...SL.EMP.WORK.FE.ZSNaNNaNNaNNaNNaNNaNNaN...9.440000e+019.430000e+019.440000e+019.450000e+019.440000e+019.440000e+01NaNNaNNaNNaN
United StatesUSAWage and salaried workers, male (% of male emp...SL.EMP.WORK.MA.ZSNaNNaNNaNNaNNaNNaNNaN...9.170000e+019.160000e+019.170000e+019.200000e+019.220000e+019.250000e+01NaNNaNNaNNaN
United StatesUSAWage and salaried workers, total (% of total e...SL.EMP.WORK.ZSNaNNaNNaNNaNNaNNaNNaN...9.300000e+019.290000e+019.300000e+019.320000e+019.320000e+019.340000e+01NaNNaNNaNNaN
United StatesUSAWanted fertility rate (births per woman)SP.DYN.WFRTNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWater productivity, total (constant 2010 US$ G...ER.GDP.FWTL.M3.KDNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaN3.200610e+01NaN3.331436e+01NaNNaNNaN
United StatesUSAWholesale price index (2010 = 100)FP.WPI.TOTL1.715426e+011.709399e+011.713467e+011.708947e+011.712412e+011.746468e+011.803880e+01...1.026299e+029.359888e+011.000000e+021.088326e+021.094325e+021.101092e+021.111422e+021.030900e+02NaNNaN
United StatesUSAWomen participating in the three decisions (ow...SG.DMK.ALLD.FN.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWomen who believe a husband is justified in be...SG.VAW.REAS.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWomen who believe a husband is justified in be...SG.VAW.ARGU.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWomen who believe a husband is justified in be...SG.VAW.BURN.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWomen who believe a husband is justified in be...SG.VAW.GOES.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWomen who believe a husband is justified in be...SG.VAW.NEGL.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWomen who believe a husband is justified in be...SG.VAW.REFU.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWomen who were first married by age 18 (% of w...SP.M18.2024.FE.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAWomen's share of population ages 15+ living wi...SH.DYN.AIDS.FE.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
United StatesUSAYouth literacy rate, population 15-24 years, b...SE.ADT.1524.LT.ZSNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
\n", - "

1452 rows × 61 columns

\n", - "
" - ], - "text/plain": [ - " Country Code Indicator Name \\\n", - "Country Name \n", - "United States USA 2005 PPP conversion factor, GDP (LCU per inter... \n", - "United States USA 2005 PPP conversion factor, private consumptio... \n", - "United States USA Access to electricity (% of population) \n", - "United States USA Access to electricity, rural (% of rural popul... \n", - "United States USA Access to electricity, urban (% of urban popul... \n", - "United States USA Access to non-solid fuel (% of population) \n", - "United States USA Access to non-solid fuel, rural (% of rural po... \n", - "United States USA Access to non-solid fuel, urban (% of urban po... \n", - "United States USA Account at a financial institution (% age 15+)... \n", - "United States USA Account at a financial institution, female (% ... \n", - "United States USA Account at a financial institution, income, po... \n", - "United States USA Account at a financial institution, income, ri... \n", - "United States USA Account at a financial institution, male (% ag... \n", - "United States USA Adequacy of social insurance programs (% of to... \n", - "United States USA Adequacy of social protection and labor progra... \n", - "United States USA Adequacy of social safety net programs (% of t... \n", - "United States USA Adequacy of unemployment benefits and ALMP (% ... \n", - "United States USA Adjusted net enrollment rate, primary, female ... \n", - "United States USA Adjusted net enrollment rate, primary, male (%... \n", - "United States USA Adjusted net enrolment rate, primary, both sex... \n", - "United States USA Adjusted net national income (annual % growth) \n", - "United States USA Adjusted net national income (constant 2010 US$) \n", - "United States USA Adjusted net national income (current US$) \n", - "United States USA Adjusted net national income per capita (annua... \n", - "United States USA Adjusted net national income per capita (const... \n", - "United States USA Adjusted net national income per capita (curre... \n", - "United States USA Adjusted net savings, excluding particulate em... \n", - "United States USA Adjusted net savings, excluding particulate em... \n", - "United States USA Adjusted net savings, including particulate em... \n", - "United States USA Adjusted net savings, including particulate em... \n", - "... ... ... \n", - "United States USA Urban land area where elevation is below 5 met... \n", - "United States USA Urban population \n", - "United States USA Urban population (% of total) \n", - "United States USA Urban population growth (annual %) \n", - "United States USA Urban population living in areas where elevati... \n", - "United States USA Urban poverty gap at national poverty lines (%) \n", - "United States USA Urban poverty headcount ratio at national pove... \n", - "United States USA Use of IMF credit (DOD, current US$) \n", - "United States USA Use of insecticide-treated bed nets (% of unde... \n", - "United States USA Value lost due to electrical outages (% of sales) \n", - "United States USA Vitamin A supplementation coverage rate (% of ... \n", - "United States USA Vulnerable employment, female (% of female emp... \n", - "United States USA Vulnerable employment, male (% of male employm... \n", - "United States USA Vulnerable employment, total (% of total emplo... \n", - "United States USA Wage and salaried workers, female (% of female... \n", - "United States USA Wage and salaried workers, male (% of male emp... \n", - "United States USA Wage and salaried workers, total (% of total e... \n", - "United States USA Wanted fertility rate (births per woman) \n", - "United States USA Water productivity, total (constant 2010 US$ G... \n", - "United States USA Wholesale price index (2010 = 100) \n", - "United States USA Women participating in the three decisions (ow... \n", - "United States USA Women who believe a husband is justified in be... \n", - "United States USA Women who believe a husband is justified in be... \n", - "United States USA Women who believe a husband is justified in be... \n", - "United States USA Women who believe a husband is justified in be... \n", - "United States USA Women who believe a husband is justified in be... \n", - "United States USA Women who believe a husband is justified in be... \n", - "United States USA Women who were first married by age 18 (% of w... \n", - "United States USA Women's share of population ages 15+ living wi... \n", - "United States USA Youth literacy rate, population 15-24 years, b... \n", - "\n", - " Indicator Code 1960 1961 \\\n", - "Country Name \n", - "United States PA.NUS.PPP.05 NaN NaN \n", - "United States PA.NUS.PRVT.PP.05 NaN NaN \n", - "United States EG.ELC.ACCS.ZS NaN NaN \n", - "United States EG.ELC.ACCS.RU.ZS NaN NaN \n", - "United States EG.ELC.ACCS.UR.ZS NaN NaN \n", - "United States EG.NSF.ACCS.ZS NaN NaN \n", - "United States EG.NSF.ACCS.RU.ZS NaN NaN \n", - "United States EG.NSF.ACCS.UR.ZS NaN NaN \n", - "United States WP_time_01.1 NaN NaN \n", - "United States WP_time_01.3 NaN NaN \n", - "United States WP_time_01.8 NaN NaN \n", - "United States WP_time_01.9 NaN NaN \n", - "United States WP_time_01.2 NaN NaN \n", - "United States per_si_allsi.adq_pop_tot NaN NaN \n", - "United States per_allsp.adq_pop_tot NaN NaN \n", - "United States per_sa_allsa.adq_pop_tot NaN NaN \n", - "United States per_lm_alllm.adq_pop_tot NaN NaN \n", - "United States SE.PRM.TENR.FE NaN NaN \n", - "United States SE.PRM.TENR.MA NaN NaN \n", - "United States SE.PRM.TENR NaN NaN \n", - "United States NY.ADJ.NNTY.KD.ZG NaN NaN \n", - "United States NY.ADJ.NNTY.KD NaN NaN \n", - "United States NY.ADJ.NNTY.CD NaN NaN \n", - "United States NY.ADJ.NNTY.PC.KD.ZG NaN NaN \n", - "United States NY.ADJ.NNTY.PC.KD NaN NaN \n", - "United States NY.ADJ.NNTY.PC.CD NaN NaN \n", - "United States NY.ADJ.SVNX.GN.ZS NaN NaN \n", - "United States NY.ADJ.SVNX.CD NaN NaN \n", - "United States NY.ADJ.SVNG.GN.ZS NaN NaN \n", - "United States NY.ADJ.SVNG.CD NaN NaN \n", - "... ... ... ... \n", - "United States AG.LND.EL5M.UR.K2 NaN NaN \n", - "United States SP.URB.TOTL 1.264625e+08 1.292762e+08 \n", - "United States SP.URB.TOTL.IN.ZS 6.999600e+01 7.037700e+01 \n", - "United States SP.URB.GROW 2.449104e+00 2.200571e+00 \n", - "United States EN.POP.EL5M.UR.ZS NaN NaN \n", - "United States SI.POV.URGP NaN NaN \n", - "United States SI.POV.URHC NaN NaN \n", - "United States DT.DOD.DIMF.CD NaN NaN \n", - "United States SH.MLR.NETS.ZS NaN NaN \n", - "United States IC.FRM.OUTG.ZS NaN NaN \n", - "United States SN.ITK.VITA.ZS NaN NaN \n", - "United States SL.EMP.VULN.FE.ZS NaN NaN \n", - "United States SL.EMP.VULN.MA.ZS NaN NaN \n", - "United States SL.EMP.VULN.ZS NaN NaN \n", - "United States SL.EMP.WORK.FE.ZS NaN NaN \n", - "United States SL.EMP.WORK.MA.ZS NaN NaN \n", - "United States SL.EMP.WORK.ZS NaN NaN \n", - "United States SP.DYN.WFRT NaN NaN \n", - "United States ER.GDP.FWTL.M3.KD NaN NaN \n", - "United States FP.WPI.TOTL 1.715426e+01 1.709399e+01 \n", - "United States SG.DMK.ALLD.FN.ZS NaN NaN \n", - "United States SG.VAW.REAS.ZS NaN NaN \n", - "United States SG.VAW.ARGU.ZS NaN NaN \n", - "United States SG.VAW.BURN.ZS NaN NaN \n", - "United States SG.VAW.GOES.ZS NaN NaN \n", - "United States SG.VAW.NEGL.ZS NaN NaN \n", - "United States SG.VAW.REFU.ZS NaN NaN \n", - "United States SP.M18.2024.FE.ZS NaN NaN \n", - "United States SH.DYN.AIDS.FE.ZS NaN NaN \n", - "United States SE.ADT.1524.LT.ZS NaN NaN \n", - "\n", - " 1962 1963 1964 1965 \\\n", - "Country Name \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "... ... ... ... ... \n", - "United States NaN NaN NaN NaN \n", - "United States 1.319887e+08 1.346154e+08 1.372160e+08 1.396631e+08 \n", - "United States 7.075700e+01 7.113400e+01 7.150800e+01 7.187900e+01 \n", - "United States 2.076494e+00 1.970559e+00 1.913437e+00 1.767653e+00 \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States 1.713467e+01 1.708947e+01 1.712412e+01 1.746468e+01 \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "\n", - " 1966 ... 2008 2009 \\\n", - "Country Name ... \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... 9.794343e+01 9.709736e+01 \n", - "United States NaN ... 9.704943e+01 9.501399e+01 \n", - "United States NaN ... 9.748575e+01 9.603130e+01 \n", - "United States NaN ... -2.788922e+00 -8.504354e-01 \n", - "United States NaN ... 1.231703e+13 1.221228e+13 \n", - "United States NaN ... 1.216984e+13 1.203082e+13 \n", - "United States NaN ... -3.704072e+00 -1.715833e+00 \n", - "United States NaN ... 4.050401e+04 3.980903e+04 \n", - "United States NaN ... 4.001999e+04 3.921754e+04 \n", - "United States NaN ... 2.075956e+00 1.735874e+00 \n", - "United States NaN ... 3.070588e+11 2.516063e+11 \n", - "United States NaN ... 1.889611e+00 1.548930e+00 \n", - "United States NaN ... 2.794962e+11 2.245096e+11 \n", - "... ... ... ... ... \n", - "United States NaN ... NaN NaN \n", - "United States 1.420087e+08 ... 2.446071e+08 2.472763e+08 \n", - "United States 7.224700e+01 ... 8.043800e+01 8.060600e+01 \n", - "United States 1.665559e+00 ... 1.156186e+00 1.085290e+00 \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... 9.440000e+01 9.430000e+01 \n", - "United States NaN ... 9.170000e+01 9.160000e+01 \n", - "United States NaN ... 9.300000e+01 9.290000e+01 \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States 1.803880e+01 ... 1.026299e+02 9.359888e+01 \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "United States NaN ... NaN NaN \n", - "\n", - " 2010 2011 2012 2013 \\\n", - "Country Name \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States 1.000000e+02 NaN 1.000000e+02 NaN \n", - "United States 1.000000e+02 NaN 1.000000e+02 NaN \n", - "United States 1.000000e+02 NaN 1.000000e+02 NaN \n", - "United States 1.000000e+02 NaN 1.000000e+02 NaN \n", - "United States 1.000000e+02 NaN 1.000000e+02 NaN \n", - "United States 1.000000e+02 NaN 1.000000e+02 NaN \n", - "United States NaN 8.795786e+01 NaN NaN \n", - "United States NaN 8.406905e+01 NaN NaN \n", - "United States NaN 8.099529e+01 NaN NaN \n", - "United States NaN 9.281008e+01 NaN NaN \n", - "United States NaN 9.198194e+01 NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States 9.513818e+01 9.467457e+01 9.410391e+01 9.262706e+01 \n", - "United States 9.446875e+01 9.324649e+01 9.411461e+01 9.292106e+01 \n", - "United States 9.479582e+01 9.394464e+01 9.410937e+01 9.277709e+01 \n", - "United States 3.342398e+00 2.076668e+00 3.645016e+00 1.333261e+00 \n", - "United States 1.262046e+13 1.288254e+13 1.335212e+13 1.353013e+13 \n", - "United States 1.262046e+13 1.319294e+13 1.391432e+13 1.429645e+13 \n", - "United States 2.482066e+00 1.299926e+00 2.858440e+00 5.887723e-01 \n", - "United States 4.079712e+04 4.132745e+04 4.250877e+04 4.275905e+04 \n", - "United States 4.079712e+04 4.232319e+04 4.429865e+04 4.518081e+04 \n", - "United States 2.973072e+00 3.712649e+00 5.847932e+00 5.621072e+00 \n", - "United States 4.495612e+11 5.867062e+11 9.705286e+11 9.607086e+11 \n", - "United States 2.797694e+00 3.545417e+00 5.690151e+00 5.470228e+00 \n", - "United States 4.230421e+11 5.602786e+11 9.443431e+11 9.349277e+11 \n", - "... ... ... ... ... \n", - "United States 1.752022e+04 NaN NaN NaN \n", - "United States 2.498656e+08 2.523052e+08 2.547624e+08 2.571827e+08 \n", - "United States 8.077200e+01 8.094000e+01 8.110800e+01 8.127700e+01 \n", - "United States 1.041720e+00 9.716271e-01 9.691533e-01 9.455534e-01 \n", - "United States 2.263942e+00 NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States 9.440000e+01 9.450000e+01 9.440000e+01 9.440000e+01 \n", - "United States 9.170000e+01 9.200000e+01 9.220000e+01 9.250000e+01 \n", - "United States 9.300000e+01 9.320000e+01 9.320000e+01 9.340000e+01 \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN 3.200610e+01 NaN \n", - "United States 1.000000e+02 1.088326e+02 1.094325e+02 1.101092e+02 \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "\n", - " 2014 2015 2016 Unnamed: 61 \n", - "Country Name \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States 9.358380e+01 NaN NaN NaN \n", - "United States 9.479771e+01 NaN NaN NaN \n", - "United States 8.711619e+01 NaN NaN NaN \n", - "United States 9.790414e+01 NaN NaN NaN \n", - "United States 9.236126e+01 NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States 9.443206e+01 NaN NaN NaN \n", - "United States 9.365279e+01 NaN NaN NaN \n", - "United States 9.403453e+01 NaN NaN NaN \n", - "United States 2.769931e+00 NaN NaN NaN \n", - "United States 1.390491e+13 NaN NaN NaN \n", - "United States 1.494105e+13 NaN NaN NaN \n", - "United States 1.970734e+00 NaN NaN NaN \n", - "United States 4.360171e+04 NaN NaN NaN \n", - "United States 4.685075e+04 NaN NaN NaN \n", - "United States 6.560417e+00 NaN NaN NaN \n", - "United States 1.169276e+12 NaN NaN NaN \n", - "United States 6.418385e+00 NaN NaN NaN \n", - "United States 1.143962e+12 NaN NaN NaN \n", - "... ... ... ... ... \n", - "United States NaN NaN NaN NaN \n", - "United States 2.597405e+08 2.623324e+08 NaN NaN \n", - "United States 8.144700e+01 8.161700e+01 NaN NaN \n", - "United States 9.896394e-01 9.929296e-01 NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States 3.331436e+01 NaN NaN NaN \n", - "United States 1.111422e+02 1.030900e+02 NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "United States NaN NaN NaN NaN \n", - "\n", - "[1452 rows x 61 columns]" - ] - }, - "execution_count": 22, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "wb.loc[\"United States\"]" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "collapsed": true - }, - "outputs": [], - "source": [] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.5.3" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} diff --git a/content/07-pandas/pandas_solutions.txt b/content/07-pandas/pandas_solutions.txt deleted file mode 100644 index 1db8c26b..00000000 --- a/content/07-pandas/pandas_solutions.txt +++ /dev/null @@ -1,37 +0,0 @@ -Q1: - -np.allclose(names.groupby(["year", "sex"]).prop.sum(), 1.0) - - -Q2: - -boys = top[top.sex == "M"] -girls = top[top.sex == "F"] - -Q3: - -all_names = top["name"].unique() -all_names.dtype - -len(all_names) - - -Q4: - -what are all the names that appear for both boys and girls? - -boy_names = top[top["sex"] == "M"]["name"].unique() -girl_names = top[top["sex"] == "F"]["name"].unique() -joint = np.intersect1d(boy_names, girl_names) - - -Q5: - -def get_count(group, q=0.5): - group = group.sort_values(by="prop", ascending=False) - return group["prop"].cumsum().searchsorted(0.5)[0] + 1 - -diversity = top.groupby(["year", "sex"]).apply(get_count) -diversity = diversity.unstack("sex") -diversity.plot() - diff --git a/content/07-pandas/sample.csv b/content/07-pandas/sample.csv deleted file mode 100644 index 65ee2acc..00000000 --- a/content/07-pandas/sample.csv +++ /dev/null @@ -1,20 +0,0 @@ -"student", "hw 1", "hw 2", "hw 3", "hw 4", "exam" -"A", 10 , 9 , 10 , 7 , 97 -"B", 8 , 7 , 9 , 9 , 82 -"C", , 9 , 6 , 5 , 75 -"D", 8 , 9 , 9 , 9 , 90 -"E", , 10 , 10 , 10 , 95 -"F", 8 , 2 , 6 , 7 , 66 -"G", 6 , , 4 , 5 , 60 -"H", 8 , 8 , 9 , 8 , 84 -"I", 10 , 7 , 10 , 10 , 92 -"J", 10 , 6 , 9 , 9 , 91 -"K", 8 , 7 , 6 , 8 , 87 -"L", 3 , 8 , 5 , 7 , 71 -"M", 9 , 9 , 8 , 9 , 94 -"N", 8 , 10 , 9 , 9 , 90 -"O", 10 , 10 , 10 , 9 , 99 -"P", 8 , 9 , 8 , 10 , 94 -"Q", 5 , 7 , 6 , 5 , 78 - -