← Volver a proyectos

G.A.B.R.I.E.L.

Plataforma de análisis con Inteligencia Artificial para analizar comentarios de YouTube.

2026-03-01
#JS#Serverless#React#Pipeline#Data

Resumen

¿Qué es G.A.B.R.I.E.L.? A nivel de usuario, es una plataforma de análisis instantáneo. El cliente (creador de contenido o productora) simplemente pega el enlace de su último video. En segundo plano, el sistema descarga el volumen total de comentarios, los procesa con Inteligencia Artificial, y despliega un dashboard detallado.

G.A.B.R.I.E.L. nace para resolver el colapso operativo al intentar analizar audiencias masivas. Antes de este pipeline, entender la percepción de una fanbase hiperactiva era estadísticamente inviable. La libertad del lenguaje orgánico (uso de jerga, repetición de vocales, múltiples alias) y la barrera multilingüe saturaban cualquier análisis, exponiendo al creador al caos.

Inteligencia Accionable (Dashboard)

A continuación, gráficas y visualizaciones obtenidas directamente de la interfaz de G.A.B.R.I.E.L., mostrando la distribución de sentimientos, entidades detectadas y el Share of Voice de la audiencia:


Arquitectura de Procesamiento

Estrategia de Orquestación Serverless

¿Por qué esta arquitectura?

El diseño de G.A.B.R.I.E.L. no es lineal por tres razones críticas de ingeniería que garantizan la resiliencia del sistema:

  1. Gestión de Cuotas (Rate Limits): Las APIs de Natural Language y Translation tienen límites estrictos de peticiones por minuto. Al utilizar Cloud Tasks con una concurrencia limitada a 5 workers simultáneos, el sistema garantiza un flujo constante de datos sin exceder las cuotas de Google Cloud, evitando errores de saturación (HTTP 429).
  2. Aislamiento de Fallos y Reintentos: En un proceso de 10,000 comentarios, un fallo en el comentario número 5,001 colapsaría un script tradicional. En esta arquitectura, si un lote (chunk) falla por latencia o red, Cloud Tasks reintenta únicamente ese fragmento específico, asegurando que el análisis final siempre se complete sin duplicar costos ni tiempo.
  3. Superación de Timeouts: Las Cloud Functions tienen un límite de tiempo de ejecución. Procesar miles de llamadas a APIs de IA en una sola función es una apuesta arriesgada. Dividir la carga en micro-tareas permite que cada función trabaje de forma ligera y rápida, escalando horizontalmente según la demanda del video.

Solución Heurística

  • Interfaz React de un solo paso (One-Click Analysis) para abstraer la complejidad del backend al usuario final.
  • Orquestación asíncrona para procesar volúmenes masivos sin colapsar las cuotas (rate limits) de Google Cloud.
  • Traducción automática previa al análisis para unificar las métricas de audiencias multilingües globales.
  • Normalización heurística mediante diccionario de alias para unificar a una misma entidad independientemente de sus variaciones al escribir.
function normalizarEntidad(texto, diccionarioAlias) {
  // Trunca la multiplicidad emocional: "Aleeeee" -> "Alee"
  const textoNormalizado = texto.replace(/([aeiou])\1{2,}/gi, '$1$1');
  
  // Busca coincidencias cruzando contra un diccionario de alias predefinido
  const aliasEncontrado = Object.keys(diccionarioAlias).find(clave => 
    diccionarioAlias[clave].includes(textoNormalizado.toLowerCase())
  );

  return aliasEncontrado ? aliasEncontrado : textoNormalizado;
}

El Resultado

El sistema otorgó visión periférica y soberanía sobre los datos. Un creador de contenido o marca hoy puede observar su Share of Voice, descubrir factores exactos de éxito comparando episodios, y analizar el sentimiento general sin invertir energía manual ni exponer su salud mental al leer comentarios destructivos directamente. El caos se transmutó en una métrica escalable.

Siguientes Pasos

  • Integración de modelos fundacionales para reemplazar las APIs estándar y personalizar el contexto semántico por nicho de creador.
  • Expansión de los nodos de ingesta para procesar comentarios de otras plataformas.
  • Implementación de un motor de alertas para detectar picos anómalos de viralidad en tiempo real.