
Новий підхід до локального зберігання даних у Kubernetes на AWS
Сучасні контейнеризовані застосунки, що працюють на Kubernetes, дозволяють організаціям розгортати робочі навантаження з інтенсивним читанням даних, такі як машинне навчання, аналітика даних та високопродуктивні обчислення (HPC), у безпрецедентних масштабах. Однак, коли кілька Pod-ів на одному вузлі потребують доступу до ідентичних наборів даних, виникає проблема продуктивності.
Виклики традиційного доступу до даних
Зазвичай кожен Pod отримує файли із зовнішнього сховища незалежно через мережу. Це призводить до надлишкових передач даних, що споживають пропускну здатність і збільшують затримку, особливо коли десятки Pod-ів на одному вузлі потребують доступу до однакових файлів. Максимальна кількість Pod-ів на вузлі Kubernetes за замовчуванням становить 110, і при такому масштабі надмірність може суттєво впливати на продуктивність.
Існуючі механізми Kubernetes для реалізації кешування на рівні вузла мають операційні складнощі. Наприклад, тип тому hostPath дозволяє контейнерам отримувати доступ до каталогів файлової системи хоста, але створює серйозні ризики безпеки. Документація Kubernetes рекомендує уникати hostPath та використовувати альтернативи, такі як local PersistentVolume (PV). Проте підхід local PV вимагає створення окремих PersistentVolume для кожного вузла, реалізації власної логіки планування та ручного керування життєвим циклом томів, що стає операційно нездійсненним у масштабі.
Рішення: Amazon EBS Node-Local Volumes
Amazon Elastic Block Store (Amazon EBS) надає надійне, високопродуктивне блокове сховище для інстансів Amazon EC2. Драйвер Amazon EBS Container Storage Interface (CSI) керує життєвим циклом томів EBS як сховища для томів Kubernetes.
Amazon EBS Node-Local Volumes пропонують безпечне спільне локальне сховище для співрозміщених Pod-ів Kubernetes (кількох Pod-ів, що працюють на одному вузлі). Це рішення усуває операційну складність, зберігаючи при цьому продуктивність та безпеку.
Як працюють Node-Local Volumes
Node-Local Volumes забезпечують безпечне спільне сховище на рівні вузла, дозволяючи єдиному кластерному PersistentVolume (PV) та PersistentVolumeClaim (PVC) монтувати попередньо приєднані, специфічні для вузла томи EBS. Коли Pod-и посилаються на цей PV, кожен вузол незалежно монтує власний локальний пристрій EBS, і всі Pod-и на цьому вузлі спільно використовують це монтування. Це усуває необхідність у наданні PV для кожного вузла та складній логіці планування Pod-ів, зберігаючи при цьому переваги безпеки та операційної простоти хмарного сховища.
Сценарії використання
Ця функція особливо корисна для сценаріїв, де:
- Кілька співрозміщених Pod-ів потребують доступу до спільного набору даних (наприклад, кешованих файлів з Amazon S3).
- Необхідно уникнути використання томів
hostPathз міркувань безпеки. - Потрібно масштабувати робочі навантаження між вузлами, зберігаючи кешування на рівні вузла зі спрощеними операціями.
Приклади використання включають машинне навчання з кешами спільних моделей, конвеєри аналізу даних, робочі навантаження HPC та системи доставки контенту з кешуванням на рівні вузла.
Впровадження та доступність
Для використання Amazon EBS Node-Local Volumes потрібен кластер Amazon EKS, де кожен робочий вузол має додатковий том EBS, попередньо приєднаний з послідовним ім'ям пристрою (наприклад, /dev/xvdbz). Кореневий пристрій не може бути використаний як локальний том вузла. Впровадження включає налаштування кластера EKS, активацію постачальника IAM OIDC, створення ролі IAM для драйвера EBS CSI та встановлення доповнення драйвера Amazon EBS CSI з увімкненою функцією node-local volumes (controller.enableNodeLocalVolumes=true). Потім створюється єдиний кластерний PV та PVC, що посилаються на локальні томи EBS вузла.
Ця функція доступна у драйвері EBS CSI версії v1.53.0 та новіших, дозволяючи оптимізувати контейнеризовані робочі навантаження для продуктивності та економічної ефективності.
Що це означає для розробників
Ця функція дозволяє розробникам спростити доступ до спільних даних для співрозміщених Pod-ів Kubernetes, усуваючи необхідність у складній логіці планування та ручному керуванні томами. Вони можуть використовувати єдиний кластерний PV/PVC для доступу до локального сховища на вузлі, підвищуючи продуктивність та безпеку для інтенсивних робочих навантажень.
Ключові факти
-
Amazon EBS Node-Local Volumes вирішують проблему надлишкового доступу до даних для співрозміщених Pod-ів Kubernetes.
-
Вони забезпечують безпечне спільне локальне сховище на рівні вузла.
-
Рішення використовує єдиний кластерний PV/PVC для монтування попередньо приєднаних, специфічних для вузла томів EBS.
-
Усуває операційну складність, пов'язану з
hostPathтаlocal PersistentVolumeпідходами. -
Підвищує продуктивність та безпеку для робочих навантажень, таких як машинне навчання, аналітика даних та HPC.
Джерела
Джерело
Amazon Web Services
Enhancing co-located Kubernetes Pod data access with Amazon EBS Node-Local volumes | Amazon Web Services17 лютого 2026 · оновлено 17 лютого 2026
Попередні статті

NASA уклала контракт на підтримку даних та інформатики
NASA обрала Development Seed для надання послуг з досліджень та розробок Офісу науки про дані та інформатики (ODSI) у Космічному центрі Маршалла. Контракт вартістю до 76 мільйонів доларів передбачає підтримку до червня 2031 року.

Комп'ютерні науки проти аналізу даних: порівняння дисциплін
Технічні навички користуються високим попитом, що зумовлено розвитком штучного інтелекту, хмарних обчислень та науки про дані. Цей матеріал порівнює комп'ютерні науки та аналіз даних, розглядаючи їхні основні напрямки, необхідні навички, кар'єрні шляхи та відмінності, попри значне перетинання.

Інженерія даних та DataOps: Основи для розуміння
Інженерія даних є ключовою галуззю, що забезпечує збір, зберігання, обробку та аналіз великих наборів даних. Цей матеріал розкриває її важливість, роль у сучасних бізнес-моделях, типи баз даних, процеси ETL, відмінності між OLTP та OLAP, а також вплив хмарних технологій та сучасного стека даних.
Наступні статті

Наступне Покоління Інженерії Даних: Динамічні Таблиці та Ще 5 Функцій, Що Змінять Ваш Підхід до Розробки
Snowflake представляє шість нових функцій, які трансформують інженерію даних, переходячи до декларативного програмування та автоматизуючи складні робочі процеси. Ці інструменти, від Cortex Code до Динамічних Таблиць, покликані скоротити час розробки з днів до хвилин та розширити можливості інженерів.

Нова програма UTC відкриває шлях до аналітики даних без кодування
Університет Теннессі в Чаттанузі запустив програму Engineering Analytics, що дозволяє студентам вивчати аналітику даних без необхідності кодування, зосереджуючись на практичному застосуванні та міждисциплінарному підході.

Стохастичне програмування: Як оптимізувати рішення в умовах невизначеності
Стохастичне програмування дозволяє моделювати невизначеність безпосередньо в оптимізаційних моделях, пропонуючи чотири основні підходи для прийняття рішень, які витримують мінливість реального світу.