Skip to main content

Command Palette

Search for a command to run...

Explorando el Desarrollo Regional con Datos Abiertos del BCIE

Updated
6 min read
Explorando el Desarrollo Regional con Datos Abiertos del BCIE
N

Soy un consultor de Business Intelligence con más de 7 años de experiencia transformando datos en decisiones estratégicas con Power BI y Tableau. He capacitado a más de 500 profesionales, pero mi curiosidad me llevó al siguiente nivel: no solo reportar el pasado, sino predecir el futuro. Actualmente, estoy cursando una maestría en Big Data y especializándome como Ingeniero de Machine Learning. Este blog es mi bitácora y mi guía para profesionales de datos que, como yo, buscan cruzar el puente del análisis de negocios al aprendizaje automático. ¡Vamos a construir el futuro de los datos juntos!

Bienvenidos a "El Puente al Machine Learning" y al inicio de nuestra primera serie de casos de estudio: Proyectos de ML con Datos Abiertos.

A la fecha de hoy (15 de noviembre de 2025), el portal de datos abiertos del BCIE reporta un total de 609 registros históricos. Solo este año, ya se han aprobado $2,328,087,479.00 en solo 16 operaciones.

Esta es la filosofía de este blog: en lugar de datasets de juguete, usaremos estos datos vivos para construir modelos de Machine Learning funcionales y listos para producción.


Resumen Rápido

  • Qué: Iniciamos una serie de ML para pronosticar las aprobaciones financieras del BCIE (2026-2030).
  • Datos: Usamos el portal oficial de Datos Abiertos del BCIE (Dataset: "Aprobaciones (General)", 609 registros, 1961-2025).
  • Cómo: Comparamos Prophet vs. XGBoost, implementamos MLOps (v2.1) y construimos un dashboard en Power BI para explorar los datos.

¿Qué es el BCIE y por qué sus datos?

El Banco Centroamericano de Integración Económica (BCIE) es la institución financiera multilateral de desarrollo más relevante para la región centroamericana. Fundado en 1960, su misión es promover la integración y el desarrollo económico y social de sus países miembros.

En resumen, sus decisiones tienen un impacto directo en la infraestructura, la energía, la competitividad y la salud en la región.

Recientemente, el banco ha hecho un esfuerzo ejemplar por la transparencia a través de su Portal de Datos Abiertos. Este portal nos da acceso sin precedentes a sus operaciones, y para un científico de datos, es una mina de oro.

Visitar el Portal de Datos Abiertos

¿A quién va dirigida esta serie?

Este es "El Puente al Machine Learning", por lo que no necesitas ser un experto para cruzarlo.

  • Si vienes de Finanzas o Economía: Entenderás el contexto de negocio perfectamente. Te guiaremos, paso a paso, sobre cómo Prophet y XGBoost "piensan" para modelar la realidad.
  • Si vienes de Datos o Tecnología: Entenderás los modelos. Te daremos el contexto de negocio suficiente para que sepas por qué una "aprobación" no es lo mismo que una "venta" y por qué la estructura de "socios" es una feature tan importante.

Entendiendo los Datos: Socios y Aprobaciones

Antes de poder modelar, debemos entender el negocio. La estructura del BCIE es clave. Sus países miembros (socios) no se agrupan geográficamente, sino por su rol histórico y estratégico. Esta clasificación es nuestra primera feature fundamental:

  • Socios Fundadores: Los cinco países que dieron origen al banco (Guatemala, El Salvador, Honduras, Nicaragua y Costa Rica).
  • Socios Regionales No Fundadores: Países que se han incorporado posteriormente (como Panamá, República Dominicana y Belice).
  • Socios Extraregionales: Países de fuera de la región que proveen capital y fortalecen los lazos financieros (como México, Argentina, Colombia, España, República de Corea y Taiwán).

Esta estructura define las prioridades de inversión y las líneas de financiamiento.

De todos los datasets disponibles, para este primer análisis nos enfocaremos en el más crítico para entender la estrategia del banco: las Aprobaciones. Una "Aprobación" es el compromiso formal del Directorio para financiar un proyecto. Es la "luz verde" que pone en marcha millones de dólares.


Exploración Visual: El Dashboard Interactivo

Antes de saltar al código de Python, es fundamental "sentir" los datos. He conectado el script de Python que creamos (veremos el código en el próximo capítulo) directamente a Power BI y he publicado este dashboard interactivo.

Aquí puedes explorar los datos históricos tú mismo. Filtra por país, sector o tipo de socio para ver cómo han cambiado las tendencias a lo largo del tiempo.


El Objetivo: Un Hallazgo Clave y Dos Metas

Al explorar los datos en el dashboard de arriba (específicamente filtrando desde 2010 a la fecha), emerge un hallazgo fascinante que define nuestro proyecto:

El número de aprobaciones ha venido disminuyendo desde 2010 (con un mínimo en 2024 de solo 12 operaciones), pero el valor de cada aprobación ha crecido exponencialmente.

Vemos un efecto inverso: menos proyectos, pero mucho más grandes, alcanzando un pico histórico de monto aprobado en 2022.

Este no es un dataset estático; es un reflejo de una estrategia institucional viva. Con esto en mente, tenemos dos objetivos:

  1. El Objetivo de Negocio (Valor Cuantificado): ¿Podemos pronosticar esta nueva dinámica para los próximos 5 años? Un modelo preciso (ej. con un error < 15%) permitiría al banco anticipar las necesidades de liquidez por país o informar al equipo de riesgo soberano sobre la cartera de crédito proyectada.

  2. El Objetivo de Aprendizaje (El "Puente al ML"): Este es el corazón de nuestro blog. Ver la utilidad real de nuestras herramientas. ¿Cómo modelamos esta relación inversa? ¿Es una "tendencia" (Prophet) o un "comportamiento aprendido" (XGBoost)? Usaremos estos datos "vivos" para practicar, comparar modelos y ver cuál funciona mejor.

Transparencia: Limitaciones y Métricas

Seremos transparentes. Los datos del mundo real son complicados.

  • Limitaciones: Estamos viendo "Aprobaciones", no "Desembolsos". Puede haber un rezago significativo entre que un proyecto se aprueba y el dinero se entrega. Además, al modelar decisiones institucionales, debemos ser conscientes de que los patrones históricos pueden reflejar sesgos políticos o estructurales. Nuestro modelo busca entender tendencias, no justificarlas.
  • Métrica de Éxito: Para saber qué modelo "gana", no usaremos la intuición. Nos basaremos en métricas clave como el Error Absoluto Medio (MAE) y el Error Porcentual Absoluto Medio (MAPE).

Próximos Pasos: El Desafío de Modelos

Tenemos los datos históricos y un hallazgo clave. Ahora, comienza el verdadero desafío:

¿Cuál es el mejor modelo para pronosticar esta nueva realidad de "menos proyectos, pero más grandes"?

En los próximos capítulos de esta serie, pondremos a competir a dos de los modelos más poderosos de la industria:

  • Capítulo 2: El Especialista en Tendencias (Prophet de Meta)
  • Capítulo 3: El Maestro de las Features (XGBoost)
  • Capítulo 4: El Veredicto (Prophet vs. XGBoost)

Spoiler: Ya hay un claro ganador en estos datos que captura mucho mejor la dinámica y entrega un mejor pronóstico. El BCIE es un organismo con mucho crecimiento y uno de los modelos hace el pronóstico a disminuir las aprobaciones, algo muy improbable y que revela una falla clave en su lógica.

Gracias por acompañarme. ¿Tú qué modelo usarías? ¿Crees que un enfoque de series temporales o uno basado en características capturará mejor esta nueva dinámica del BCIE?

¡Déjanos tu opinión en los comentarios!

Caso de Estudio: BCIE y Datos Abiertos

Part 1 of 2

Serie de "El Puente al ML": Caso de Estudio: BCIE y Datos Abiertos. Aplicamos diversas técnicas de Machine Learning (Forecasting, NLP, Detección de Anomalías) a los datasets públicos del banco para extraer valor real.

Up next

El Especialista en Tendencias (Prophet de Meta)

Bienvenidos de nuevo a "El Puente al Machine Learning". En el Capítulo 1, hicimos algo fundamental: conectamos los cables. Descargamos 609 registros históricos del Portal de Datos Abiertos del BCIE, los limpiamos y descubrimos una verdad contraintuit...