Fabián M.

¡Hola! Soy Hi! I'm
Fabián

Site Reliability Engineer Site Reliability Engineer

Desarrollando expertise en golden signals monitoring, gestión SLI/SLO, y optimización de confiabilidad de servicios en infraestructuras empresariales críticas. Developing expertise in golden signals monitoring, SLO management, and service reliability optimization in critical enterprise infrastructures.

AWS Kubernetes Docker Terraform Grafana Prometheus Python Jenkins

Sobre mí About me

Site Reliability Engineer con experiencia sólida en observabilidad y monitoreo de sistemas críticos para entornos empresariales de alta disponibilidad. Desarrollando expertise en prácticas SRE incluyendo monitoreo de golden signals (latencia, tráfico, errores, saturación), gestión colaborativa de SLOs, y optimización de MTTR a través de análisis de incidentes y correlación de eventos. Site Reliability Engineer with solid experience in observability and monitoring of critical systems for high-availability enterprise environments. Developing expertise in SRE practices including golden signals monitoring (latency, traffic, errors, saturation), collaborative SLO management, and MTTR optimization through incident analysis and event correlation.

Transparencia profesional Professional transparency

Con 2.9 años de experiencia, actualmente liderando mi primer proyecto crítico. Mi enfoque está en el crecimiento continuo y el aprendizaje constante en el ecosistema SRE. With 2.9 years of experience, currently leading my first critical project. My focus is on continuous growth and constant learning in the SRE ecosystem.

Actualmente trabajando en: Currently working on:

  • Análisis de incidentes y correlación usando BigPanda Incident analysis and correlation using BigPanda
  • Optimización de dashboards de observabilidad con Grafana Optimizing observability dashboards with Grafana
  • Implementación de monitoring-as-code con Terraform Implementing monitoring-as-code with Terraform
  • Finalizando Ingeniería en Informática (4to año) Completing Computer Engineering degree (4th year)
  • Contribuyendo a implementación de golden signals (latencia, tráfico, errores, saturación) Contributing to golden signals implementation (latency, traffic, errors, saturation)
  • Apoyando desarrollo de framework SLI/SLO bajo guía senior Supporting SLI/SLO framework development under senior guidance

Experiencia Profesional Professional Experience

Site Reliability Engineer (SRE)

Innfinit
Noviembre 2022 - Presente

PROYECTO: Monitoreo CN/Delta (Liderazgo) PROJECT: CN/Delta Monitoring (Leadership) Actual Current

  • Liderando implementación de arquitectura de observabilidad para infraestructura empresarial con servicios críticos Leading implementation of observability architecture for enterprise infrastructure with critical services
  • Configurando monitoreo para entornos Kubernetes usando Prometheus Operator (entornos test/lab) Configuring monitoring for Kubernetes environments using Prometheus Operator (test/lab environments)
  • Desarrollando dashboards en Grafana Cloud para componentes: Kubernetes, RabbitMQ, Redis, AWS RDS y S3 Developing dashboards in Grafana Cloud for components: Kubernetes, RabbitMQ, Redis, AWS RDS, and S3
  • Gestionando proyecto con equipo reducido, entregando resultados de calidad en tiempo y forma Managing project with reduced team, delivering quality results on time and as specified

PROYECTO: Análisis y Correlación SRE PROJECT: SRE Analysis & Correlation

  • Conduciendo análisis de causa raíz e investigaciones post-mortem usando plataforma correlación BigPanda Conducting root cause analysis and post-mortem investigations using BigPanda correlation platform
  • Contribuyendo a monitoreo golden signals (latencia, tráfico, errores, saturación) para servicios financieros empresariales Contributing to golden signals monitoring (latency, traffic, errors, saturation) for enterprise financial services
  • Apoyando desarrollo framework SLI/SLO bajo guía senior Supporting SLI/SLO framework development under senior guidance
  • Analizando monitoreo Splunk y apoyando migración Datadog para mejorar visibilidad confiabilidad servicios Analyzing Splunk monitoring and supporting Datadog migration to enhance service reliability visibility
  • Creando documentación estandarizada Confluence para agilizar resolución y mejorar MTTR Creating standardized documentation in Confluence to expedite resolution and improve MTTR

PROYECTO: Implementación de Plataforma de Observabilidad PROJECT: Observability Platform Implementation

  • Construyendo arquitectura HA con Grafana y Prometheus para monitoreo de producción Building HA architecture with Grafana and Prometheus for production monitoring
  • Configurando monitores para validar disponibilidad en aplicaciones críticas Configuring monitors to validate availability in critical applications
  • Implementando sistema centralizado de logs con Loki para correlación de eventos Implementing centralized log system with Loki for event correlation

Stack Tecnológico Tech Stack

Observabilidad & Monitoreo Observability & Monitoring

  • Datadog APM
    Sólido Solid
  • Grafana Cloud
    Sólido Solid
  • Prometheus
    Sólido Solid
  • BigPanda
    Actual Current
  • Splunk
    Básico Basic
  • ServiceNow
    Básico Basic

Cloud & Infrastructure

  • AWS
    Sólido Solid
  • Terraform
    Sólido Solid
  • Kubernetes
    Test/Lab Test/Lab
  • Docker
    Test/Lab Test/Lab
  • Jenkins
    Sólido Solid

Desarrollo & Herramientas Development & Tools

  • Python
    Sólido Solid
  • Bash
    Sólido Solid
  • Git/GitHub
    Sólido Solid
  • Jira/Confluence
    Sólido Solid
  • SQL
    Sólido Solid

Proyectos Projects

Monitoreo CN/Delta CN/Delta Monitoring En curso Ongoing

Proyecto de observabilidad empresarial que lidero actualmente, implementando arquitectura con Grafana, Prometheus y Kubernetes. Enterprise observability project I'm currently leading, implementing architecture with Grafana, Prometheus, and Kubernetes.

Grafana Prometheus K8s
True Q Project

True Q

Plataforma de intercambios desarrollada como proyecto final para Duoc UC. Nota: 60/70 Exchange platform developed as final project for Duoc UC. Grade: 60/70

React Bootstrap
Ver proyecto
Ferremás Project

Ferremás

Aplicación web para gestión de inventario de ferreterías locales. Proyecto académico. Web application for local hardware store inventory management. Academic project.

React Bootstrap
Ver proyecto
Psicóloga Valeria Améstica Project

Psicóloga Valeria Amestica

Sitio web profesional para servicios de psicología. Proyecto freelance real. Professional website for psychology services. Real freelance project.

HTML CSS JavaScript
Ver proyecto
BYF Project

BYF

Sitio web para local de comida rápida. Proyecto personal de práctica. Website for a fast food restaurant. Personal practice project.

React Bootstrap
Ver proyecto

Portfolio Personal Personal Portfolio

Este mismo sitio web, desarrollado con enfoque en honestidad y transparencia profesional. This very website, developed with a focus on honesty and professional transparency.

HTML5 Tailwind Alpine.js

Contacto Contact

Situación Actual Current Status

Ubicación Location
Santiago, Chile
Estado Status
Empleado actualmente en Innfinit Currently employed at Innfinit
Estudios Education
Finalizando Ingeniería en Informática (4to año) Completing Computer Engineering (4th year)
Interés Interest
Abierto a nuevas oportunidades SRE Open to new SRE opportunities
Compromiso con la honestidad Commitment to honesty

Este portafolio refleja mi experiencia real y actual. Creo que la transparencia construye mejores relaciones profesionales y permite encontrar oportunidades que realmente se alineen con mis habilidades y objetivos de crecimiento. This portfolio reflects my real and current experience. I believe transparency builds better professional relationships and allows finding opportunities that truly align with my skills and growth objectives.