Актуальные заказы по Bash

Monitoring and Observability Engineer

Full-time
Удаленно

This role involves designing, implementing, and managing comprehensive monitoring solutions using Prometheus, Grafana, SNMP-Exporter, Streaming Telemetry, OpenTelemetry, and other related technologies.


Responsibilities

- Design, implement, and manage Prometheus-based monitoring solutions, including configurations and alert rules.

- Develop and maintain interactive and visually appealing Grafana dashboards.

- Configure SNMP modules/jobs to scrape SNMP metrics for different network technologies in a very optimized way.

- Strong knowledge of Git to be able to clone working branches, develop, and commit to the main branch. Or other approaches, but show a strong hold on Git usage.

- Identify and onboard new metrics from various systems and applications, developing data pipelines for metrics collection and storage.

- Optimize and scale monitoring environments to handle large volumes of metrics and ensure comprehensive monitoring coverage.

- Implement and manage Streaming Telemetry solutions for real-time data collection and monitoring.

- Integrate and manage OpenTelemetry for comprehensive tracing and observability across services.

- Troubleshoot and resolve issues related to data collection, monitoring configurations, and dashboard performance.

- Ensure proper instrumentation of applications and infrastructure with DevOps, development, and operations teams.

- Document configurations, procedures, and provide training to team members and stakeholders.

 

Skills

- Familiarity with network monitoring tools and practices.

- Extensive experience with Prometheus and related technologies (Alertmanager, Pushgateway, etc.).

- Strong knowledge of time-series databases and monitoring concepts.

- Proficiency in writing Prometheus queries (PromQL).

- Strong experience with Grafana and its ecosystem.

- Proficiency in creating and managing Grafana dashboards and panels.

- Knowledge of data visualization principles and best practices.

- Familiarity with monitoring and observability tools and practices.

- Strong knowledge of SNMP protocols and network device management.

- Experience with SNMP-Exporter and its integration with Prometheus.

- Strong in SNMP module creation and scrape congas for various network technologies.

- Strong Git experience.

- Strong understanding of metrics and monitoring concepts.

- Experience with metrics collection tools (Prometheus, Telegraf, Collectd, etc.).

- Experience with Streaming Telemetry solutions for real-time monitoring.

- Experience with OpenTelemetry for tracing and observability.

- Familiarity with Linux/Unix systems and scripting languages (Bash, Python).

- Experience with containerization and orchestration tools (Docker, Kubernetes).

 

Qualification 

- Bachelor’s degree in Computer Science, Engineering, or related. 

- 5+ years of experience in monitoring and observability roles.

- Proficiency in tools like Prometheus, Grafana, PromQL, Alertmanager, Alert Framework, GitHub, SNMP-exporter, Streaming-Telemetry, Otel.

- Strong coding and scripting skills.

- Excellent problem-solving abilities and attention to detail.

- Strong communication and teamwork skills.

 

Senior DevOps engineer

Удаленно
Full-time

Обязанности:

- Развёртывание и сопровождение инфраструктуры в Yandex Cloud с использованием Terraform и CLI.

- Работа в рамках PCI DSS-контура: соблюдение требований, взаимодействие с кураторами и службами ИБ.

- Поддержка Kubernetes-кластеров (managed): Helm, ingress, autoscaling, probes. Управление жизненном циклом приложений. 

- Настройка и эксплуатация CI/CD пайплайнов на базе ArgoCD, GitHub Actions и Jenkins.

- Внедрение и поддержка мониторинга и алертинга: Prometheus, VictoriaMetrics, Grafana, Alertmanager.

- Автоматизация конфигураций и процессов с использованием Ansible, Bash, Python.

- Управление секретами через HashiCorp Vault.

- Сопровождение приложений на Ruby и Java.


Требования:

- Опыт работы с Yandex Cloud: compute, VPC, IAM, KMS, object storage и др.

- Уверенные знания Kubernetes: Helm, ingress, сетевые политики, RBAC.

- Опыт с Terraform и Ansible в продакшене.

- Практический опыт построения и сопровождения CI/CD-процессов.

- Уверенные навыки работы в Linux-среде: администрирование, отладка, автоматизация.

- Понимание принципов работы WAF.

- Навыки работы с Vault или другими системами управления секретами.

- Опыт написания скриптов на Bash / Python.

- Хорошее понимание сетевого стека: TCP/IP, DNS, NAT, балансировка, TLS


Будет плюсом:

- Опыт работы с приложениями на Ruby on Rails и Java.

- Знакомство с observability-стеком: OpenTelemetry, Fluent Bit.

- Понимание аудиторских требований и опыт прохождения проверок на соответствие PCI DSS, ISO 27001 и др.

- Опыт управления инфраструктурой в многоаккаунтной / мультиклаудной среде.


Условия:

- Удалённая работа, гибкий график.

- Прямая коммуникация с разработкой, ИБ и архитектурой.

- Отсутствие избыточной бюрократии.

- Конкурентная зарплата, обсуждается на основе опыта.

Build Engineer DevOps (Middle+/Senior)

Удаленно
Full-time

На проект в направлении DataOps требуется уверенный специалист в области Build Engineering DevOps.


Задачи:

•  документировать и наполнять базы знаний

•  решать типовые задачи, обрабатывать инциденты совместно с архитекторами/экспертами

•  осуществлять подготовку deplоyment-приложений для установки их в кластер

•  автоматизировать рутинные процессы

•  поддерживать пользователей и помогать им в выполнении шаблонных задач

•  разработка автоматизации и средств мониторинга на Python и Golang


Требования:

·   Опыт администрирования Linux

·   Понимание принципов работы DevOps, процессов CI/CD

·   Опыт работы с системой управления конфигурацией (Ansible)

·   Опыт работы с оркестраторами

·   Автоматизация на Python, Bash

·   Навыки работы с Docker

·   Умение работать c Git

·   Опыт написания веб сервисов (API) на Python

·   Написание скриптов по автоматизации на Python

·   Опыт работы с реляционными БД на уровне администратора


Условия:

Ожидаемая дата начала работы: 28 июля 2025

Локация: РФ

Удаленная работа, рабочий день с 9:00 до 18:00 по МСК

Часовой пояс: не более чем ±3 часа от московского времени (UTC+3).

Software Engineer

Удаленно

Task: Test SDK (software development kit) by documentation, run examples, write a report on what was hard/normal/easy, give recommendations for improvement.


Requirements:

- Proficiency in Python, with a solid understanding of object-oriented programming principles.

- Experience working with Linux operating systems, advanced CLI user.

- Proficiency in Bash scripting for automation and task management.

- Experience with Git for version control and collaborative development.

- Experience with Docker for containerization and deployment of applications.

- Hands-on experience running Large Language Models (LLMs) on-premise.

- Proficiency in utilizing NVIDIA GPUs to accelerate model inference and training processes.


Preferred Qualifications:

- Experience with NVIDIA’s TensorRT-LLM or similar frameworks to optimize and deploy LLMs efficiently.

- Familiarity with Kubernetes for orchestrating containerized applications in a clustered environment.


Additional Technical Skills:

- Familiarity with machine learning frameworks such as PyTorch.

- Understanding basic modern ML and DL concepts and Neural Networks architectures.