Webscrapping---IMDB-website

Introduction:

IMDB is an online database of information on films, television series and video games founded by Col needham in 1990. It os now a subsidiary of Amazon.
They have currenty 8.7 million titles, 11.4 million person records and 83 million registered users

Goals:

Webscrape movie data from https://www.imdb.com/
Perform exploratory data analysis on the data collected

Tools used:

• Beautiful Soup, Selenium (data collection) • Pandas (data processing) • Matplotlib, Seaborn

Data:

Data Collection:

Collected 10,000 movie title using function inputMovieData(), data was saved to Moviedataframe (shape :(10049, 11))
94 Bestpicture data was collected using function InputSearchResultpage() and saving them into dataframe BestPictureadatframe (shape :(94,11))

Data Cleanning:

Used regular expression to extract Year, Gross from respective columns.
Converted columns Year, Runtime, Rating, Votes,Gross from String to numeric.
Removed null values

Exploratory Data analysis:

Summary:

Drama movies have won maximum Oscar Awards for Best Picture.
Action movies tend to make high revenues.
Average ratings for top gross movies is 7.4
Gross margin looks to plummet steeply in 2020 which may be an affect due to Covid.

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
FinalBestPicture_Movie_List.csv		FinalBestPicture_Movie_List.csv
Final_Top10000_Movie_List.csv		Final_Top10000_Movie_List.csv
ImdbProject.ipynb		ImdbProject.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Webscrapping---IMDB-website

Introduction:

Goals:

Tools used:

Data:

Data Collection:

Data Cleanning:

Exploratory Data analysis:

Summary:

About

Uh oh!

Releases

Packages

Languages

nnvij/Webscrapping---IMDB-website

Folders and files

Latest commit

History

Repository files navigation

Webscrapping---IMDB-website

Introduction:

Goals:

Tools used:

Data:

Data Collection:

Data Cleanning:

Exploratory Data analysis:

Summary:

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages