El reto
Los agregadores de noticias tradicionales homogenizan el mundo: ves los mismos 10 titulares globales sin importar dónde estés. MiPais nació de una observación simple — la realidad de cada país es local primero, global después, y un agregador honesto debería respetar esa jerarquía sin perder de vista las historias que sí cruzan fronteras.
Eso requería un pipeline serio: ingesta multi-fuente, deduplicación semántica, clustering de historias cross-country y una capa visual que comunicara la geografía de la información.
La solución
MiPais es una plataforma que agrega, deduplica y cura noticias de 13 países en tiempo real, las presenta sobre un globo terráqueo 3D interactivo y construye feeds personalizados que respetan el balance entre local e internacional.
Pipeline de ingesta y curación
- Multi-fuente — Perplexity, Hacker News, tendencias de X/Twitter, YouTube y RSS, orquestado en Python.
- Resúmenes en español generados por LLM (OpenAI gpt-4o / gpt-4o-mini).
- Anti-alucinación de URLs y filtros heurísticos para descartar páginas índice/sección.
- Deduplicación semántica con embeddings 1536D almacenados en PostgreSQL.
- Clustering con UMAP + HDBSCAN para identificar historias cross-country y computar un score de “importancia global” por cluster.
Visualización geográfica
- Globo 3D con capa GDELT de eventos geopolíticos.
- Marcadores sísmicos USGS en tiempo casi real.
- Ciclo día/noche sobre el globo.
- Arcos entre países con cobertura compartida — visualmente comunica qué historias están viajando.
Feed por país
- Mezcla 65 / 35 entre noticias locales e internacionales por feed.
- Badge “Internacional” para historias con cobertura confirmada en 3+ países.
Resultados
- Cobertura diaria de 13 países y ~40 noticias únicas curadas por corrida tras filtros de calidad.
- Pipeline cost-aware — arquitectura de fallback (Perplexity primario, OpenAI gpt-4o secundario) que resuelve el 100 % de los casos de cero resultados manteniendo costo promedio en ~$0.55 por corrida.
Por qué importa
MiPais es nuestro propio caso de estudio en producto con IA bien hecho: la inteligencia no está en un wrapper de ChatGPT — está en la deduplicación semántica, el clustering geo-temporal, la arquitectura de fallback entre proveedores y la decisión consciente de diseñar el costo de cada capa del pipeline. Es exactamente el nivel de ingeniería que aplicamos a las custom apps de nuestros clientes.



