Disponible para proyectos Available for work
Fabián M.

Fabián
Muñoz

Site Reliability Engineer| Site Reliability Engineer|
|
🇨🇱 Santiago, Chile

Especialista en observabilidad, golden signals monitoring y optimización de confiabilidad en infraestructuras críticas. Specialist in observability, golden signals monitoring and reliability optimization in critical infrastructures.

AWS AWS
Datadog Datadog
Grafana Grafana
Prometheus Prometheus
Docker Docker
Kubernetes Kubernetes
Terraform Terraform
Python Python

Experiencia Experience

Actual Current

Site Reliability Engineer Site Reliability Engineer

Banco Falabella | Oct 2025 - Presente Banco Falabella | Oct 2025 - Present

Santiago, Chile · Híbrido Santiago, Chile · Hybrid

SRE especializado en observabilidad y monitoreo para infraestructura bancaria crítica. Trabajando con colas de mensajes Kafka, sistemas de procesamiento de transacciones e implementando monitoreo de golden signals. Construyendo dashboards de monitoreo, sistemas de alertas y contribuyendo a la respuesta de incidentes para servicios financieros 24/7. SRE specializing in observability and monitoring for critical banking infrastructure. Working with Kafka message queues, transaction processing systems, and implementing golden signals monitoring. Building monitoring dashboards, alert systems, and contributing to incident response for 24/7 financial services reliability.

Apache Kafka Datadog Grafana Prometheus Kubernetes Terraform Splunk ELK Stack

Site Reliability Engineer (SRE) Site Reliability Engineer (SRE)

Innfinit SpA | Nov 2022 - Oct 2025 · 3 años Innfinit SpA | Nov 2022 - Oct 2025 · 3 yrs

SRE con 3 años en observabilidad y monitoreo de sistemas críticos para empresas Fortune 500. Especializado en golden signals monitoring, análisis de incidentes y prácticas SRE para servicios financieros de alta disponibilidad. SRE with 3 years in observability and monitoring of critical systems for Fortune 500 enterprises. Specialized in golden signals monitoring, incident analysis, and SRE practices for high-availability financial services.

Liberty Mutual US Oct 2024 - Sep 2025

Monitoring Optimization & Incident Correlation - BigPanda, Splunk, Datadog

Sovos Aug 2024 - Aug 2025

Delta Compliance Monitoring - K8s, Grafana Cloud, RabbitMQ, Redis

Red Salud Feb 2024 - Mar 2025

HA Observability Platform - Grafana, Prometheus, Loki

Liberty Andes Nov 2022 - Dec 2024

Multi-Region Observability (Colombia, Chile, Ecuador) - AWS, Datadog, Terraform

Grafana Prometheus BigPanda AWS GCP Kubernetes Terraform Datadog Splunk

Technical Support Technical Support

Recomin SM | Mar 2019 - Nov 2022 · 3 años 9 meses Recomin SM | Mar 2019 - Nov 2022 · 3 yrs 9 mos

Soporte integral para el Proyecto Integrado Los Bronces, colaborando con los departamentos administrativos, RRHH con Nubox, prevención de riesgos, maquinaria, adquisiciones y operaciones. Resolución de problemas técnicos con computadoras, impresoras, configuración de Windows OS, Microsoft Office y routers. Comprehensive support for the Los Bronces Integrated Project, collaborating with administrative and HR departments with Nubox, risk prevention, machinery, procurement and operations. Troubleshooting technical problems with computers, printers, Windows OS configuration, Microsoft Office and routers.

Windows OS Microsoft Office Hardware Support Network Support Nubox

🏗️ Proyectos SRE Clave 🏗️ Key SRE Projects

Arquitecturas de observabilidad enterprise implementadas Enterprise observability architectures implemented

🔭

Enterprise K8s Observability Enterprise K8s Observability

Kubernetes Grafana Cloud Prometheus

Arquitectura de observabilidad con dashboards para K8s, RabbitMQ, Redis, AWS RDS & S3 Observability architecture with dashboards for K8s, RabbitMQ, Redis, AWS RDS & S3

🔥

Motor de Correlación de Incidentes Incident Correlation Engine

BigPanda Datadog Splunk

Análisis de causa raíz, framework SLI/SLO y sistemas de reducción de ruido Root cause analysis, SLI/SLO framework & noise reduction systems

📊

Plataforma de Monitoreo HA HA Monitoring Platform

Grafana Prometheus Loki

Arquitectura de alta disponibilidad con logging centralizado y monitores sintéticos High-availability architecture with centralized logging & synthetic monitors

🌎

Observabilidad Multi-Región Multi-Region Observability

AWS Datadog Terraform

Monitoreo de infraestructura en múltiples regiones con despliegue IaC Infrastructure monitoring across multiple regions with IaC deployment

3+
Años Years
en SRE in SRE
Golden
Signals
Latency • Traffic • Errors • Saturation
SLI/SLO
Expert
MTTR Optimization
24/7
Monitoring
Alta Disponibilidad High Availability

💻 Proyectos Personales 💻 Personal Projects

YouTube Music Playlist Creator

Herramienta de automatización para crear listas de reproducción en YouTube Music a partir de listas de canciones de conciertos declaradas en un archivo .txt. Automation tool to create YouTube Music playlists from concert setlists declared in a .txt file.

Python YouTube API Automation

NutriCombat

Progressive Web App especializada para atletas de deportes de combate. Manejo de corte de peso, nutrición personalizada con IA (Gemini), y planes específicos para competencias. Specialized Progressive Web App for combat sports athletes. Weight cutting management, AI-powered nutrition (Gemini), and specific plans for official competitions.

PWA Gemini AI Nutrition React Native
Ver Proyecto View Project

Dashboard Chile - Datos Oficiales Chile Dashboard - Official Data

Dashboard interactivo de Grafana con datos oficiales de Chile en tiempo real. Integra APIs públicas para mostrar clima, sismos, indicadores económicos y métricas ambientales. Interactive Grafana dashboard with official Chilean real-time data. Integrates public APIs to display weather, earthquakes, economic indicators and environmental metrics.

Grafana Data Visualization API Integration
Ver Dashboard View Dashboard

True Q

Plataforma de intercambios desarrollada como proyecto final para Duoc UC. Nota: 60/70 Exchange platform developed as final project for Duoc UC. Grade: 60/70

React Bootstrap Web Development
Ver Demo View Demo

Ferremás

Aplicación web para gestión de inventario de ferreterías locales. Proyecto académico. Web application for local hardware store inventory management. Academic project.

React Bootstrap Full Stack
Ver Demo View Demo

Psicóloga Valeria Améstica Psychologist Valeria Améstica

Sitio web profesional para servicios de psicología. Proyecto freelance real. Professional website for psychology services. Real freelance project.

HTML CSS JavaScript
Visitar Sitio Visit Site

BYF

Sitio web para local de comida rápida. Proyecto personal de práctica. Website for a fast food restaurant. Personal practice project.

React Bootstrap Web Development
Ver Demo View Demo

Habilidades Técnicas Technical Skills

Observabilidad & Monitoreo Observability & Monitoring

  • Datadog Datadog APM
  • Grafana Grafana Cloud
  • Prometheus Prometheus
  • BigPanda
  • Splunk
  • ServiceNow

Cloud & Infrastructure

  • AWS AWS
  • Terraform Terraform
  • Kubernetes Kubernetes
  • Docker Docker
  • Jenkins Jenkins

Desarrollo & Herramientas Development & Tools

  • Python Python
  • JavaScript JavaScript
  • React React
  • Node.js Node.js
  • Git Git

💬 Conectemos 💬 Let's Connect

¡Construyamos sistemas observables juntos! 🚀 Let's build observable systems together! 🚀