Fabián M.

¡Hola! Soy Hi! I'm
Fabián

Ingeniero SRE • Monitoring • Observability SRE Engineer • Monitoring • Observability

Especialista en sistemas de monitoreo, observabilidad y automatización para infraestructuras críticas. Specialist in monitoring systems, observability, and automation for critical infrastructures.

AWS Google Cloud Kubernetes Docker Terraform Grafana Prometheus Python Jenkins

Sobre mí About me

Ingeniero SRE con experiencia sólida en observabilidad y monitoreo de sistemas críticos para entornos empresariales de alta disponibilidad. Especialista en detección temprana de problemas y mejora de cobertura de monitoreo en infraestructuras complejas. SRE Engineer with solid experience in observability and monitoring of critical systems for high-availability enterprise environments. Specialist in early problem detection and improving monitoring coverage in complex infrastructures.

Actualmente enfocado en: Currently focused on:

  • Creación y optimización de dashboards de observabilidad Creating and optimizing observability dashboards
  • Automatización de despliegues con CI/CD Automating deployments with CI/CD
  • Implementación de monitoring-as-code con Terraform Implementing monitoring-as-code with Terraform
  • Monitoreo y mejora continua de sistemas críticos Monitoring and continuous improvement of critical systems
  • Gestión de infraestructura cloud en AWS y Kubernetes Cloud infrastructure management in AWS and Kubernetes

Educación Education

  • Ingeniería en Informática
    Instituto Profesional Duoc UC, 2022-2026
    Cursando 4to año Currently in 4th year
  • Analista Programador Computacional
    Instituto Profesional Duoc UC, 2022-2024
    Proyecto final: Aplicación de Intercambios "True Q" Final project: Exchange Application "True Q"

Idiomas & Herramientas Languages & Tools

Español Spanish
Nativo Native
Inglés English
B2 - Intermedio avanzado
Herramientas principales Main tools
Datadog Grafana Prometheus Terraform AWS Jenkins

Experiencia Profesional Professional Experience

Ingeniero Site Reliability Engineer (SRE)

Innfinit
Noviembre 2022 - Presente

PROYECTO: Monitoreo CN/Delta (Liderazgo) PROJECT: CN/Delta Monitoring (Leadership)

  • Lidero implementación de arquitectura de observabilidad para infraestructura empresarial con múltiples servicios críticos. Leading the implementation of observability architecture for enterprise infrastructure with multiple critical services.
  • Aumento cobertura de métricas mediante configuración de Kubernetes con Prometheus Operator y kube-state-metrics. Increasing metrics coverage through Kubernetes configuration with Prometheus Operator and kube-state-metrics.
  • Desarrollo dashboards en Grafana Cloud para monitoreo de componentes clave: Kubernetes, RabbitMQ, Redis, AWS RDS y S3. Developing dashboards in Grafana Cloud for monitoring key components: Kubernetes, RabbitMQ, Redis, AWS RDS, and S3.
  • Implemento sistema de alertas con umbrales optimizados y runbooks detallados para minimizar falsos positivos. Implementing alert system with optimized thresholds and detailed runbooks to minimize false positives.

PROYECTO: Implementación y Escalamiento de Plataforma de Observabilidad Integral PROJECT: Implementation and Scaling of Comprehensive Observability Platform

  • Diseño arquitectura de alta disponibilidad con Grafana y Prometheus, migrando soluciones de monitoreo desde Datadog. Designing high-availability architecture with Grafana and Prometheus, migrating monitoring solutions from Datadog.
  • Configuro monitores sintéticos para validar disponibilidad y experiencia de usuario en aplicaciones críticas. Configuring synthetic monitors to validate availability and user experience in critical applications.
  • Implemento sistema centralizado de logs con Loki y Network Logs Concentrator para correlación de eventos. Implementing centralized log system with Loki and Network Logs Concentrator for event correlation.

PROYECTO: SRE Service Analysis PROJECT: SRE Service Analysis

  • Implemento sistema de monitoreo para detección temprana de incidentes utilizando Datadog APM y trazas distribuidas. Implementing monitoring system for early incident detection using Datadog APM and distributed traces.
  • Desarrollo framework de investigación técnica para identificar causas raíz en microservicios críticos. Developing technical investigation framework to identify root causes in critical microservices.
  • Creo y mantengo documentación técnica estandarizada en Confluence para agilizar resolución de incidentes recurrentes. Creating and maintaining standardized technical documentation in Confluence to streamline resolution of recurring incidents.

Técnico de Soporte Integral

Recontti SM
Marzo 2019 - Noviembre 2022

Apoyo integral al Proyecto Los Bronces Integrado, colaborando con departamentos administrativos y de RRHH con Nubox, prevención de riesgos, maquinaria, adquisiciones y operaciones. Comprehensive support to the Los Bronces Integrado Project, collaborating with administrative and HR departments with Nubox, risk prevention, machinery, procurement, and operations.

Stack Tecnológico Tech Stack

Cloud & SRE

  • Cloud Platforms
  • AWS (EC2, RDS, S3, VPC, Lambda)
  • Google Cloud Platform (GCP)
  • Microsoft Azure
  • SRE Tools
  • Docker
  • Kubernetes
  • Terraform
  • Jenkins
  • Monitoring & Observability
  • Grafana
  • Prometheus
  • Blackbox Exporter
  • Loki
  • Datadog APM

Desarrollo y Colaboración Development & Collaboration

  • Languages & Frameworks
  • Python
  • Bash
  • YAML/HCL
  • SQL
  • Version Control
  • Git
  • GitHub
  • GitHub Actions
  • Project Management
  • Jira
  • Confluence
  • Scrum

Sistemas y Administración Systems & Administration

  • Operating Systems
  • Linux (Ubuntu, RHEL, CentOS)
  • Windows Server
  • macOS
  • Tools & Virtualization
  • VMware
  • SNMP
  • PagerDuty
  • Big Panda
  • Data Management
  • Oracle Database
  • PostgreSQL
  • MySQL

Proyectos Projects

Observability Platform

Plataforma de observabilidad completa con Grafana, Prometheus y Loki para monitoreo de servicios críticos. Complete observability platform with Grafana, Prometheus, and Loki for critical service monitoring.

Grafana Prometheus Loki
Ferremás Project

Ferremás

Aplicación web para gestión de inventario de ferreterías locales. Web application for local hardware store inventory management.

React Bootstrap
Ver proyecto
True Q Project

True Q

Plataforma de intercambios desarrollada como proyecto final para Duoc UC. Exchange platform developed as a final project for Duoc UC.

React Bootstrap
Ver proyecto
Psicóloga Valeria Améstica Project

Psicóloga Valeria Amestica

Sitio web profesional para servicios de psicología con sistema de agenda. Professional website for psychology services with appointment system.

HTML CSS JavaScript
Ver proyecto
BYF Project

BYF

Pagina web para local de comida rápida. Website for a fast food restaurant.

React Bootstrap
Ver proyecto

Terraform Monitoring as Code

Implementación de monitoreo como código utilizando Terraform para despliegues automatizados. Implementation of monitoring as code using Terraform for automated deployments.

Terraform AWS Prometheus

Certificaciones Certifications

Cloud

  • Oracle Cloud Infrastructure Foundations Associate
    Oracle
  • Microsoft Certified: Azure AI Fundamentals
    Microsoft
  • AWS Educate
    Serverless, Machine Learning, Cloud Ops
  • Google Cloud Skill Badges
    Multiple badges in Cloud Technologies
  • Getting Started with OpenTofu
    The Linux Foundation

Metodologías Methodologies

  • Scrum Foundation Professional
    CertiProf
  • Data Science
    FCFM, Universidad de Chile
  • Google Cloud Network Skill Badge
    Google Cloud
  • DevOps Essentials
    Duoc UC

¿Por qué Contratarme? Why Hire Me?

Pasión por Aprender Passion for Learning

Me mantengo constantemente actualizado con las últimas tecnologías a través de cursos online, documentación técnica y proyectos personales. Mi curiosidad me impulsa a buscar nuevos desafíos. I stay constantly updated with the latest technologies through online courses, technical documentation, and personal projects. My curiosity drives me to seek new challenges.

Mentalidad de Solución Solution Mindset

Cada problema es una oportunidad para aprender. Me destaco por encontrar soluciones creativas y estar dispuesto a investigar hasta encontrar la mejor respuesta. Every problem is an opportunity to learn. I excel at finding creative solutions and am willing to research until I find the best answer.

Proyectos Reales Real Projects

De ideas que surgen en mi mente, creo y desarrollo proyectos completos que cobran vida en la web. Mi portafolio es testimonio de cómo transformo inspiraciones espontáneas en aplicaciones reales y funcionales. From ideas that spark in my mind, I create and develop complete projects that come to life on the web. My portfolio stands as testimony to how I transform spontaneous inspirations into real, functional applications.

"Estoy cimentando las bases de una carrera profesional sólida, donde mi compromiso con la excelencia y mi capacidad de aprendizaje rápido me convierten en un candidato valioso que aportará crecimiento e innovación a tu equipo." "I am building the foundations of a solid professional career, where my commitment to excellence and quick learning ability make me a valuable candidate who will bring growth and innovation to your team."

Comprometido con el aprendizaje continuo Committed to continuous learning
Enfocado en objetivos y resultados Focused on goals and results
Apasionado por la tecnología y la innovación Passionate about technology and innovation

Contacto Contact

Ubicación Location

Ubicación Location
Santiago, Chile
Disponibilidad Availability
Disponible para nuevas oportunidades Available for new opportunities
Modalidad de trabajo Work mode
Remoto / Híbrido / Presencial Remote / Hybrid / On-site