Librerías y Herramientas Populares. En este capítulo haremos una pequeña introducción a las librerías más utilizadas en el ecosistema Python, herramientas que extienden las capacidades del lenguaje y facilitan la resolución de problemas complejos en diversos ámbitos. Estas librerías son fundamentales para tareas como análisis de datos, visualización, cálculos numéricos, comunicación con servidores web, etc. A través de este capítulo obtendrás unas nociones básicas de estas librerías para que puedas conocer su uso. En la sección de Frameworks y Librerías podrás profundizar en su uso y aprenderlas con mayor detalle.
¿Qué librerías vamos a ver?
- NumPy: Una librería esencial para el cálculo numérico en Python, que proporciona estructuras como arrays multidimensionales y una variedad de funciones matemáticas para operaciones rápidas y eficientes. Es especialmente útil para ciencia de datos y computación científica.
- Pandas: Una herramienta poderosa para manipulación y análisis de datos estructurados, que utiliza estructuras como
DataFrame
para trabajar con datos tabulares. Aprenderás a cargar, procesar y analizar conjuntos de datos de manera eficiente. - Matplotlib: La base para la visualización de datos en Python. Con esta librería podrás crear gráficos desde los más simples hasta los más complejos, ideal para representar datos de manera visualmente atractiva y comprensible.
- Requests: Una librería que permite realizar peticiones HTTP de manera sencilla, como acceder a APIs, descargar recursos o interactuar con servicios web.
¿Por qué son importantes estas herramientas?
Como ya hemos comentado en capítulos anteriores, utilizar librerías existentes agiliza y facilita la labor de programación. Además, estas librerías representan una combinación perfecta entre eficiencia, simplicidad y versatilidad. Se utilizan en una variedad de campos como análisis de datos, desarrollo web, aprendizaje automático y ciencia de datos. Conocer estas herramientas te permitirá abordar problemas complejos con mayor facilidad y optimizar tus proyectos de programación.
¡Comencemos!
Disco Duro Externo 500GB - 2.5" USB 3.0 Ultrafino Diseño Metálico HDD Portátil para Mac, PC, Laptop, Ordenador, Xbox One, PS4, Smart TV, Chromebook - Grey
27% FueraNumPy
NumPy (Numerical Python) es una biblioteca fundamental para el cálculo numérico en Python. Proporciona soporte para arrays multidimensionales y una colección de funciones matemáticas para operar sobre estos arrays.
Características Clave:
- Arreglos (ndarray): Estructura de datos principal que permite manejar grandes cantidades de datos de forma eficiente.
- Funciones matemáticas: Funciones para realizar operaciones matemáticas elementales y avanzadas.
- Indexación avanzada: Permite seleccionar y manipular subarreglos de manera intuitiva.
Ejemplo de uso:
import numpy as np
# Crear un arreglo unidimensional
arreglo = np.array([1, 2, 3, 4, 5])
print(arreglo) # Salida: [1 2 3 4 5]
# Realizar operaciones matemáticas
suma = np.sum(arreglo)
print(suma) # Salida: 15
# Crear una matriz 2D
matriz = np.array([[1, 2], [3, 4]])
print(matriz)
# Salida:
# [[1 2]
# [3 4]]
# Calcular la transpuesta de la matriz
transpuesta = np.transpose(matriz)
print(transpuesta)
# Salida:
# [[1 3]
# [2 4]]
@Tip. Recuerda que para hacer uso de librerías de terceros debes haberlas instalado previamente en el sistema. En el ejemplo que acabamos de ver la instalaríamos con el comando: pyhton3 -m pip install numpy
Pandas
Pandas es una biblioteca diseñada para el análisis y manipulación de datos. Proporciona estructuras de datos flexibles (Series y DataFrames) que permiten trabajar con datos tabulares de forma eficiente.
Características Clave:
- DataFrames: Estructura bidimensional similar a una tabla que permite almacenar datos heterogéneos.
- Manejo de datos faltantes: Funciones para manejar y limpiar datos faltantes.
- Operaciones de agrupamiento y filtrado: Métodos para agrupar datos, realizar estadísticas descriptivas y aplicar funciones personalizadas.
Ejemplo de uso:
import pandas as pd
# Crear un DataFrame a partir de un diccionario
data = {
'Nombre': ['Ana', 'Luis', 'Pedro'],
'Edad': [28, 34, 29],
'Ciudad': ['Madrid', 'Barcelona', 'Valencia']
}
df = pd.DataFrame(data)
print(df)
# Salida:
# Nombre Edad Ciudad
# 0 Ana 28 Madrid
# 1 Luis 34 Barcelona
# 2 Pedro 29 Valencia
# Filtrar datos
df_mayores = df[df['Edad'] > 30]
print(df_mayores)
# Salida:
# Nombre Edad Ciudad
# 1 Luis 34 Barcelona
# Calcular estadísticas descriptivas
estadisticas = df['Edad'].describe()
print(estadisticas)
# Salida:
# count 3.000000
# mean 30.333333
# std 3.785405
# min 28.000000
# 25% 28.500000
# 50% 29.000000
# 75% 31.000000
# max 34.000000
Matplotlib
Matplotlib es una biblioteca de visualización de datos en Python que permite crear gráficos estáticos, animados e interactivos. Es muy versátil y se utiliza ampliamente en ciencia de datos para representar visualmente los datos y los resultados de análisis.
Características Clave:
- Gráficos de líneas, barras, dispersión, histogramas, etc.: Soporta una amplia variedad de tipos de gráficos.
- Personalización: Permite personalizar colores, estilos de línea, etiquetas y títulos.
- Integración con Jupyter Notebooks: Ideal para visualizaciones interactivas en notebooks.
Ejemplo de uso:
import matplotlib.pyplot as plt
# Datos para graficar
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# Crear un gráfico de líneas
plt.plot(x, y, marker='o', linestyle='-', color='b')
plt.title('Gráfico de Líneas')
plt.xlabel('X')
plt.ylabel('Y')
plt.grid(True)
plt.show()
Este código crea un gráfico de líneas simple mostrando la relación entre las listas x
e y
.

Request
La biblioteca Requests es una herramienta poderosa para hacer peticiones HTTP de forma sencilla. Se utiliza comúnmente para interactuar con APIs y obtener datos desde servidores u otras aplicaciones.
Características Clave:
- Fácil de usar: Simplifica la realización de solicitudes GET, POST y otros métodos HTTP.
- Manejo de sesiones: Permite mantener una sesión de usuario para realizar múltiples solicitudes.
- Manejo de respuestas: Proporciona métodos para manejar respuestas, incluyendo encabezados y contenido.
Ejemplo de uso:
import requests
# Realizar una solicitud GET a una API
respuesta = requests.get('https://api.github.com')
# Verificar el código de estado de la respuesta
if respuesta.status_code == 200:
print("Éxito:", respuesta.json()) # Mostrar contenido JSON
else:
print("Error:", respuesta.status_code)
Este código realiza una solicitud a la API de GitHub y muestra el contenido JSON si la solicitud es exitosa.
Resumen
Las librerías y herramientas mencionadas son fundamentales para el desarrollo en Python, especialmente en el ámbito de la ciencia de datos y la visualización. NumPy y Pandas facilitan el manejo y análisis de datos numéricos y tabulares, mientras que Matplotlib permite visualizar estos datos de manera efectiva. Además, Requests simplifica la interacción con servicios web, haciendo que trabajar con APIs sea más accesible. El dominio de estas herramientas es esencial para cualquier desarrollador que trabaje con datos en Python.
Bibliografía de Python de interés.
- Curso de Programación Python. Autor: Arturo Montejo Ráez y Salud María Jiménez Zafra (Editorial Anaya)
- Aprende Python desde cero hasta avanzado. Autor: Xavier Reyes Ochoa (Editorial Book Shelter GmbH)
- Aprende la Programación Orientada a Objetos con el lenguaje Python. Autor: Vincent Boucheny (Editorial Ediciones ENI)
- 100 Ejercicios Python para praticar. Autor: Laurentine K.Masson (Editorial: Publicación Independiente).