Esta colección contiene scripts de Python diseñados para automatizar y simplificar tareas comunes de procesamiento de datos. Cada script está optimizado para resolver un problema específico de manera eficiente y fácil de usar.
Divide archivos CSV grandes en partes más pequeñas y manejables.
Características:
- División inteligente que mantiene la integridad de los datos
- Nombrado automático de archivos resultantes
- Mensajes de confirmación para seguimiento del proceso
Uso:
python separar_csv.py <archivo.csv> <numero_de_partes>
Ejemplo:
python separar_csv.py datos_ventas_2024.csv 5
Este comando dividirá el archivo datos_ventas_2024.csv
en 5 partes iguales, generando:
- datos_ventas_2024_parte_1.csv
- datos_ventas_2024_parte_2.csv
- ...
- datos_ventas_2024_parte_5.csv
Requisitos:
- Python 3.6+
- pandas
- math (biblioteca estándar)
- sys (biblioteca estándar)
- os (biblioteca estándar)
Para instalar las dependencias necesarias:
pnpm install pandas
Cuando necesites trabajar con archivos CSV demasiado grandes para ser procesados en memoria:
- Divide el archivo en partes manejables con
separar_csv.py
- Procesa cada parte individualmente
- Combina los resultados si es necesario
Para distribuir tareas de procesamiento entre varios sistemas:
- Divide el archivo de datos con
separar_csv.py
- Asigna cada parte a un sistema o proceso diferente
- Procesa en paralelo para mayor eficiencia
¿Tienes ideas para nuevos scripts o mejoras? ¡Las contribuciones son bienvenidas!
Este proyecto está disponible como código abierto bajo la licencia MIT.