A comprehensive, modern toolkit for data scientists featuring Python utilities, machine learning algorithms, data visualization tools, and industry best practices. Perfect for beginners starting their journey and professionals optimizing their workflow!
Um kit de ferramentas abrangente e moderno para cientistas de dados, apresentando utilitários Python, algoritmos de aprendizado de máquina, ferramentas de visualização de dados e as melhores práticas da indústria. Perfeito para iniciantes em sua jornada e profissionais que buscam otimizar seu fluxo de trabalho!
- 🎯 Ready-to-use ML algorithms with clean, documented code
- 🎯 Algoritmos de ML prontos para uso com código limpo e documentado
- 📊 Advanced visualization tools for exploratory data analysis
- 📊 Ferramentas avançadas de visualização para análise exploratória de dados
- 🛠️ Utility functions for data preprocessing and cleaning
- 🛠️ Funções utilitárias para pré-processamento e limpeza de dados
- 📚 Best practices guide for data science workflows
- 📚 Guia de melhores práticas para fluxos de trabalho de ciência de dados
- 🧪 Jupyter notebooks with practical examples
- 🧪 Notebooks Jupyter com exemplos práticos
- 🔄 Automated pipelines for model training and evaluation
- 🔄 Pipelines automatizados para treinamento e avaliação de modelos
- 📈 Performance metrics and model comparison tools
- 📈 Métricas de desempenho e ferramentas de comparação de modelos
# Clone the repository / Clone o repositório
git clone https://github.com/galafis/awesome-data-science-toolkit.git
cd awesome-data-science-toolkit
# Install dependencies / Instale as dependências
pip install -r requirements.txt
# Run your first example / Execute seu primeiro exemplo
python examples/quick_start.py
# Run tests / Execute os testes
pytest tests/
- Classification / Classificação: Implementações de Regressão Logística, Random Forest, SVM, MLPClassifier.
- Regression / Regressão: Implementações de Regressão Linear, Ridge, Lasso, Random Forest Regressor.
- Clustering / Agrupamento: (Em desenvolvimento) Implementações de K-Means, DBSCAN, Hierarchical.
- Deep Learning / Aprendizado Profundo: (Em desenvolvimento) Implementações de CNN, RNN, LSTM.
- Automated data cleaning functions / Funções automatizadas de limpeza de dados
- Feature engineering utilities / Utilitários de engenharia de features
- Missing data handlers / Manipuladores de dados ausentes
- Outlier detection and treatment / Detecção e tratamento de outliers
- Interactive plotly dashboards / Dashboards interativos com Plotly
- Statistical plots with seaborn / Gráficos estatísticos com Seaborn
- Custom matplotlib themes / Temas personalizados Matplotlib
- Real-time data monitoring / Monitoramento de dados em tempo real
- Basic Plots / Gráficos Básicos: Funções para histogramas, gráficos de dispersão e box plots.
- Tutorials / Tutoriais: Step-by-step guides for beginners / Guias passo a passo para iniciantes
- Case Studies / Estudos de Caso: Real-world data science projects / Projetos de ciência de dados do mundo real
- Cheat Sheets / Folhas de Consulta: Quick reference for common tasks / Referência rápida para tarefas comuns
- Video Walkthroughs / Demonstrações em Vídeo: Visual learning materials / Materiais de aprendizagem visual
We love contributions! Here's how you can help: Adoramos contribuições! Veja como você pode ajudar:
- 🍴 Fork the repository / Faça um fork do repositório
- 🌟 Create your feature branch (
git checkout -b feature/AmazingFeature
) / Crie sua branch de feature (git checkout -b feature/AmazingFeature
) - 💾 Commit your changes (
git commit -m 'Add some AmazingFeature'
) / Confirme suas alterações (git commit -m 'Adicione alguma Feature Incrível'
) - 📤 Push to the branch (
git push origin feature/AmazingFeature
) / Envie para a branch (git push origin feature/AmazingFeature
) - 🔀 Open a Pull Request / Abra um Pull Request
- 📈 Active Development: Regular updates and new features / Desenvolvimento Ativo: Atualizações regulares e novas funcionalidades
- 🧪 Tested: Comprehensive test suite with >90% coverage / Testado: Suíte de testes abrangente com >90% de cobertura
- 📚 Documented: Detailed documentation and examples / Documentado: Documentação e exemplos detalhados
- 🌍 Community: Growing community of data science enthusiasts / Comunidade: Comunidade crescente de entusiastas de ciência de dados
- ⭐ Star this repo if you find it useful! / Dê uma estrela neste repositório se você o achar útil!
- 🔄 Fork to contribute or customize for your needs / Faça um Fork para contribuir ou personalizar para suas necessidades
- 📢 Share with fellow data scientists / Compartilhe com outros cientistas de dados
- Python 3.8+
- NumPy
- Pandas
- Scikit-learn
- Matplotlib
- Seaborn
- Plotly
- Jupyter
- Pytest (para testes)
- Add AutoML capabilities / Adicionar capacidades de AutoML
- Implement MLOps best practices / Implementar melhores práticas de MLOps
- Create web dashboard / Criar dashboard web
- Add more deep learning models / Adicionar mais modelos de aprendizado profundo
- Support for big data processing / Suporte para processamento de big data
- 📧 Email: [email protected]
- 💬 Issues: GitHub Issues
- 📖 Documentation: Wiki
This project is licensed under the MIT License - see the LICENSE file for details. Este projeto está licenciado sob a Licença MIT - veja o arquivo LICENSE para detalhes.
- Thanks to the amazing Python data science community / Agradecimentos à incrível comunidade Python de ciência de dados
- Inspired by best practices from industry leaders / Inspirado pelas melhores práticas de líderes da indústria
- Built with ❤️ by Gabriel Demetrios Lafis / Construído com ❤️ por Gabriel Demetrios Lafis
⭐ Star this repository if it helped you learn or build something amazing! ⭐ Dê uma estrela neste repositório se ele te ajudou a aprender ou construir algo incrível!