Pandas es una biblioteca de software de código abierto que manipula y analiza datos de lenguaje Python.
Además, gracias a esta biblioteca se puede trabajar con formatos como CSV, Excel, SQL, y HDF5, entre otros más; también, facilita filtrar tablas y fusionar datos.
De acuerdo con Avi Chawla, de LinkedIn, hay alrededor de 3 millones de descargas diarias de la marca.
Sin embargo, considera que los usuarios no sacan el provecho total a su potencial como biblioteca de software.
Chawla promovió estas 26 links con código abierto para potenciar flujos laborales de las personas.
Links de Pandas:
1) Jupyter-Datatables: Enriquece la vista previa predeterminada de un DataFrame.
Enlace: https://bit.ly/jupy-dtable
2) SummaryTools: Potencie el método describe().
Enlace: https://bit.ly/summ-tools
3) Tabla lateral: Sobrealimente el método value_counts().
Enlace: https://lnkd.in/dSqfbg-5
4) Boceto: Genere código / información haciendo preguntas en lenguaje natural.
Enlace: https://bit.ly/py-sketch
5) Deepchecks: Genere un informe completo de validación de datos.
Enlace: https://bit.ly/deepchks
6) Sabor de Pandas: Extienda los pandas para adjuntar métodos al objeto de marco de datos.
Enlace: https://bit.ly/py-pdflavor
7) Pandarallel: paraleliza en todos los núcleos de CPU.
Enlace: https://bit.ly/pd-parallel
8) PandasML: Incluye sklearn y matplotlib integrados.
Enlace: https://bit.ly/pandasml
9) Geopandas: Trabajar con datos geoespaciales en pandas.
Enlace: https://bit.ly/geo-pd
10) DuckDB: Ejecutar consultas SQL en marcos de datos.
Enlace: https://bit.ly/pd-sql
11) Modin: Aumenta el rendimiento hasta 70 veces modificando la importación.
Enlace: https://bit.ly/py-modin
12) PivotTableJS: crea tablas dinámicas mediante la funcionalidad de arrastrar y soltar.
Enlace: https://bit.ly/PivotJS
13) Missingno: Visualice los valores que faltan en su conjunto de datos.
Enlace: https://bit.ly/py-missing
14) Pandas Alive: Crea gráficos animados para los dataframes de pandas.
Enlace: https://bit.ly/pd-alive
15) Skimpy: Sobrealimenta el método describe().
Enlace: https://bit.ly/py-skim
16) Pandas-log: Depurar la tubería con registro paso a paso.
Enlace: https://bit.ly/py-log
Aprovechar mejor la experiencia
17) tsflex: Procese series temporales y realice la extracción de características.
Enlace: https://bit.ly/tsflex
18) pandas-profiling: Generar informe EDA de datos en una línea.
Enlace: https://lnkd.in/dQrS8KTA
19) Marte: Un marco basado en tensores para escalar numpy, scikit-learn, etc.
Enlace: https://bit.ly/py-mars
20) nptyping: Aplique sugerencias de tipo para los marcos de datos.
Enlace: https://bit.ly/nptyping
21) popmon: Perfila tus datos para determinar su estabilidad.
Enlace: https://bit.ly/py-popmon
22) Gspread-pandas: Interactúa con las hojas de Google usando marcos de datos.
Enlace: https://bit.ly/pd-gsheets
23) pdpipe: Crea pandas pipeline de forma fácil e intuitiva.
Enlace: https://bit.ly/py-pdpipe
24) PrettyPandas: Embellece el marco de datos cuando se imprime.
Enlace: https://lnkd.in/deGXBryJ
25) Dora: Una API intuitiva para la limpieza de datos, procesamiento, selección de características, visualización, etc.
Enlace: https://bit.ly/py-dora
26) Pandapy: La velocidad de NumPy combinada con la elegancia de los pandas.
Enlace: https://bit.ly/pandapy
Fórmate en un rol del mundo de datos
En caso de querer avanzar con todo, para formarte en un rol en el mundo de los datos, como puede ser Data Scientist o Data Analytics, te comentamos que tienes muchas opciones, entre ellas aprender de manera autodidacta, bootcamps e instituciones tradicionales.
En caso que te interese avanzar de manera eficiente, con bootcamps de calidad, para así contar con apoyo y guía, desde el inicio hasta encontrar empleo, te recomiendo revises el listado de bootcamps y en caso de decidirte por Desafío Latam, puedes consultar direco a su Whatsapp, ¡Tú éxito es nuestro éxito!