Skills:- Опыт работы 3+ (Middle) / 7+ лет (Senior) в DevOps/SRE/Platform Engineering.
- Глубокие знания Linux, сетей.
- Опыт построения гео-распределенных инфраструктур в облаках (AWS/AliCloud/GCP).
- Опыт построения и эксплуатации высоконагруженных Kubernetes кластеров.
- Опыт работы с Pulumi / Terraform / Ansible.
- Опыт работы с Kafka, Clickhouse.
- Опыт работы с реляционными и NoSQL СУБД.
- Опыт разработки и автоматизации на Golang / Python (сервисы, CLI-инструменты, SDK/боты, интеграции).
Responsibilities:- Проектирование и развитие облачной и on-prem инфраструктуры с высокими требованиями к отказоустойчивости и производительности.
- Эксплуатация и оптимизация Kubernetes-кластеров (HA, multi-region, производительность, безопасность).
- Разработка и поддержка IaC решений (Pulumi, Terraform, Ansible).
- Поддержка кластеров брокеров сообщений (Kafka) и аналитических платформ (ClickHouse).
- Управление базами данных (SQL/NoSQL), настройка репликаций, масштабирование, performance tuning.
- Разработка автоматизаций и сервисов на Go/Python для инфраструктурных и внутренних нужд.
- Построение мониторинга, алертинга и observability (Prometheus, VMetrics, Zabbix).
- Участие в инцидент-менеджменте и построении процессов SRE.
- Взаимодействие со смежными командами в рамках развития инфраструктуры компании.
Ты будешь проектировать и внедрять современные системы управления инфраструктурой компании, где важны и стабильность, и скорость развития. Это постоянный поиск путей сделать платформу масштабируемой, предсказуемой и отказоустойчивой — от оптимизации пайплайнов доставки и автоматизации инфраструктуры до построения комплексного мониторинга и архитектуры для высоконагруженных сервисов. Наша инфраструктура — это распределенные системы, работающие 24/7/365, которые напрямую влияют на результаты работы компании. Любая ошибка чувствительна, а правильно выстроенная архитектура и автоматизация экономят время и деньги. Ты будешь отвечать за развитие гео-распределённых систем, размещённых в разных точках мира, и обеспечивать их бесшовную работу под высокой нагрузкой.
Задача — не просто «чтобы работало», а «чтобы работало правильно, быстро и масштабировалось».
Тебе предстоит:- автоматизировать всё, что можно автоматизировать,
- проектировать решения, ускоряющие работу команд и платформы,
- сохранять при этом надёжность и доступность продакшена.
Ты будешь постоянно искать баланс между инновациями и стабильностью. Любое изменение в инфраструктуре — это компромисс, и именно от тебя зависит, как он повлияет на работу критически важных систем.
В отличие от IT в энтерпрайзе, где приоритет — соблюдение процедур и политика “лучше не трогать”, здесь приветствуется инициативность и постоянный поиск улучшений.
У нас не экономят на железе и решениях, если это дает конкурентное преимущество. Ты будешь работать с топовым железом, сетевыми картами, инструментами.
Мы строим горизонтальные команды, где ценится экспертиза, ответственность и скорость принятия решений, а не “менеджмент ради менеджмента”.