Оптимізація доступу до даних Kubernetes з EBS Node-Local Volumes

Новий підхід до локального зберігання даних у Kubernetes на AWS

Сучасні контейнеризовані застосунки, що працюють на Kubernetes, дозволяють організаціям розгортати робочі навантаження з інтенсивним читанням даних, такі як машинне навчання, аналітика даних та високопродуктивні обчислення (HPC), у безпрецедентних масштабах. Однак, коли кілька Pod-ів на одному вузлі потребують доступу до ідентичних наборів даних, виникає проблема продуктивності.

Виклики традиційного доступу до даних

Зазвичай кожен Pod отримує файли із зовнішнього сховища незалежно через мережу. Це призводить до надлишкових передач даних, що споживають пропускну здатність і збільшують затримку, особливо коли десятки Pod-ів на одному вузлі потребують доступу до однакових файлів. Максимальна кількість Pod-ів на вузлі Kubernetes за замовчуванням становить 110, і при такому масштабі надмірність може суттєво впливати на продуктивність.

Існуючі механізми Kubernetes для реалізації кешування на рівні вузла мають операційні складнощі. Наприклад, тип тому hostPath дозволяє контейнерам отримувати доступ до каталогів файлової системи хоста, але створює серйозні ризики безпеки. Документація Kubernetes рекомендує уникати hostPath та використовувати альтернативи, такі як local PersistentVolume (PV). Проте підхід local PV вимагає створення окремих PersistentVolume для кожного вузла, реалізації власної логіки планування та ручного керування життєвим циклом томів, що стає операційно нездійсненним у масштабі.

Рішення: Amazon EBS Node-Local Volumes

Amazon Elastic Block Store (Amazon EBS) надає надійне, високопродуктивне блокове сховище для інстансів Amazon EC2. Драйвер Amazon EBS Container Storage Interface (CSI) керує життєвим циклом томів EBS як сховища для томів Kubernetes.

Amazon EBS Node-Local Volumes пропонують безпечне спільне локальне сховище для співрозміщених Pod-ів Kubernetes (кількох Pod-ів, що працюють на одному вузлі). Це рішення усуває операційну складність, зберігаючи при цьому продуктивність та безпеку.

Як працюють Node-Local Volumes

Node-Local Volumes забезпечують безпечне спільне сховище на рівні вузла, дозволяючи єдиному кластерному PersistentVolume (PV) та PersistentVolumeClaim (PVC) монтувати попередньо приєднані, специфічні для вузла томи EBS. Коли Pod-и посилаються на цей PV, кожен вузол незалежно монтує власний локальний пристрій EBS, і всі Pod-и на цьому вузлі спільно використовують це монтування. Це усуває необхідність у наданні PV для кожного вузла та складній логіці планування Pod-ів, зберігаючи при цьому переваги безпеки та операційної простоти хмарного сховища.

Сценарії використання

Ця функція особливо корисна для сценаріїв, де:

Кілька співрозміщених Pod-ів потребують доступу до спільного набору даних (наприклад, кешованих файлів з Amazon S3).
Необхідно уникнути використання томів hostPath з міркувань безпеки.
Потрібно масштабувати робочі навантаження між вузлами, зберігаючи кешування на рівні вузла зі спрощеними операціями.

Приклади використання включають машинне навчання з кешами спільних моделей, конвеєри аналізу даних, робочі навантаження HPC та системи доставки контенту з кешуванням на рівні вузла.

Впровадження та доступність

Для використання Amazon EBS Node-Local Volumes потрібен кластер Amazon EKS, де кожен робочий вузол має додатковий том EBS, попередньо приєднаний з послідовним ім'ям пристрою (наприклад, /dev/xvdbz). Кореневий пристрій не може бути використаний як локальний том вузла. Впровадження включає налаштування кластера EKS, активацію постачальника IAM OIDC, створення ролі IAM для драйвера EBS CSI та встановлення доповнення драйвера Amazon EBS CSI з увімкненою функцією node-local volumes (controller.enableNodeLocalVolumes=true). Потім створюється єдиний кластерний PV та PVC, що посилаються на локальні томи EBS вузла.

Ця функція доступна у драйвері EBS CSI версії v1.53.0 та новіших, дозволяючи оптимізувати контейнеризовані робочі навантаження для продуктивності та економічної ефективності.

Що це означає для розробників

Ця функція дозволяє розробникам спростити доступ до спільних даних для співрозміщених Pod-ів Kubernetes, усуваючи необхідність у складній логіці планування та ручному керуванні томами. Вони можуть використовувати єдиний кластерний PV/PVC для доступу до локального сховища на вузлі, підвищуючи продуктивність та безпеку для інтенсивних робочих навантажень.

Ключові факти

Amazon EBS Node-Local Volumes вирішують проблему надлишкового доступу до даних для співрозміщених Pod-ів Kubernetes.
Вони забезпечують безпечне спільне локальне сховище на рівні вузла.
Рішення використовує єдиний кластерний PV/PVC для монтування попередньо приєднаних, специфічних для вузла томів EBS.
Усуває операційну складність, пов'язану з hostPath та local PersistentVolume підходами.
Підвищує продуктивність та безпеку для робочих навантажень, таких як машинне навчання, аналітика даних та HPC.