Дані та аналітика

Оптимізація доступу до даних для співрозміщених Pod-ів Kubernetes за допомогою Amazon EBS Node-Local Volumes

Д

Джерело: Amazon Web Services

3 хв читання

Ілюстрація кластера Kubernetes з кількома вузлами. На кожному вузлі розташовані Pod-и, які спільно використовують дані з локального тому Amazon EBS, приєднаного до цього вузла. Зображено, як дані ізольовані між різними вузлами.

Новий підхід до локального зберігання даних у Kubernetes на AWS

Сучасні контейнеризовані застосунки, що працюють на Kubernetes, дозволяють організаціям розгортати робочі навантаження з інтенсивним читанням даних, такі як машинне навчання, аналітика даних та високопродуктивні обчислення (HPC), у безпрецедентних масштабах. Однак, коли кілька Pod-ів на одному вузлі потребують доступу до ідентичних наборів даних, виникає проблема продуктивності.

Виклики традиційного доступу до даних

Зазвичай кожен Pod отримує файли із зовнішнього сховища незалежно через мережу. Це призводить до надлишкових передач даних, що споживають пропускну здатність і збільшують затримку, особливо коли десятки Pod-ів на одному вузлі потребують доступу до однакових файлів. Максимальна кількість Pod-ів на вузлі Kubernetes за замовчуванням становить 110, і при такому масштабі надмірність може суттєво впливати на продуктивність.

Існуючі механізми Kubernetes для реалізації кешування на рівні вузла мають операційні складнощі. Наприклад, тип тому hostPath дозволяє контейнерам отримувати доступ до каталогів файлової системи хоста, але створює серйозні ризики безпеки. Документація Kubernetes рекомендує уникати hostPath та використовувати альтернативи, такі як local PersistentVolume (PV). Проте підхід local PV вимагає створення окремих PersistentVolume для кожного вузла, реалізації власної логіки планування та ручного керування життєвим циклом томів, що стає операційно нездійсненним у масштабі.

Рішення: Amazon EBS Node-Local Volumes

Amazon Elastic Block Store (Amazon EBS) надає надійне, високопродуктивне блокове сховище для інстансів Amazon EC2. Драйвер Amazon EBS Container Storage Interface (CSI) керує життєвим циклом томів EBS як сховища для томів Kubernetes.

Amazon EBS Node-Local Volumes пропонують безпечне спільне локальне сховище для співрозміщених Pod-ів Kubernetes (кількох Pod-ів, що працюють на одному вузлі). Це рішення усуває операційну складність, зберігаючи при цьому продуктивність та безпеку.

Як працюють Node-Local Volumes

Node-Local Volumes забезпечують безпечне спільне сховище на рівні вузла, дозволяючи єдиному кластерному PersistentVolume (PV) та PersistentVolumeClaim (PVC) монтувати попередньо приєднані, специфічні для вузла томи EBS. Коли Pod-и посилаються на цей PV, кожен вузол незалежно монтує власний локальний пристрій EBS, і всі Pod-и на цьому вузлі спільно використовують це монтування. Це усуває необхідність у наданні PV для кожного вузла та складній логіці планування Pod-ів, зберігаючи при цьому переваги безпеки та операційної простоти хмарного сховища.

Сценарії використання

Ця функція особливо корисна для сценаріїв, де:

  • Кілька співрозміщених Pod-ів потребують доступу до спільного набору даних (наприклад, кешованих файлів з Amazon S3).
  • Необхідно уникнути використання томів hostPath з міркувань безпеки.
  • Потрібно масштабувати робочі навантаження між вузлами, зберігаючи кешування на рівні вузла зі спрощеними операціями.

Приклади використання включають машинне навчання з кешами спільних моделей, конвеєри аналізу даних, робочі навантаження HPC та системи доставки контенту з кешуванням на рівні вузла.

Впровадження та доступність

Для використання Amazon EBS Node-Local Volumes потрібен кластер Amazon EKS, де кожен робочий вузол має додатковий том EBS, попередньо приєднаний з послідовним ім'ям пристрою (наприклад, /dev/xvdbz). Кореневий пристрій не може бути використаний як локальний том вузла. Впровадження включає налаштування кластера EKS, активацію постачальника IAM OIDC, створення ролі IAM для драйвера EBS CSI та встановлення доповнення драйвера Amazon EBS CSI з увімкненою функцією node-local volumes (controller.enableNodeLocalVolumes=true). Потім створюється єдиний кластерний PV та PVC, що посилаються на локальні томи EBS вузла.

Ця функція доступна у драйвері EBS CSI версії v1.53.0 та новіших, дозволяючи оптимізувати контейнеризовані робочі навантаження для продуктивності та економічної ефективності.

Що це означає для розробників

Ця функція дозволяє розробникам спростити доступ до спільних даних для співрозміщених Pod-ів Kubernetes, усуваючи необхідність у складній логіці планування та ручному керуванні томами. Вони можуть використовувати єдиний кластерний PV/PVC для доступу до локального сховища на вузлі, підвищуючи продуктивність та безпеку для інтенсивних робочих навантажень.

Ключові факти

  • Amazon EBS Node-Local Volumes вирішують проблему надлишкового доступу до даних для співрозміщених Pod-ів Kubernetes.

  • Вони забезпечують безпечне спільне локальне сховище на рівні вузла.

  • Рішення використовує єдиний кластерний PV/PVC для монтування попередньо приєднаних, специфічних для вузла томів EBS.

  • Усуває операційну складність, пов'язану з hostPath та local PersistentVolume підходами.

  • Підвищує продуктивність та безпеку для робочих навантажень, таких як машинне навчання, аналітика даних та HPC.

Джерела

Джерело

Amazon Web Services

Enhancing co-located Kubernetes Pod data access with Amazon EBS Node-Local volumes | Amazon Web Services

17 лютого 2026 · оновлено 17 лютого 2026

Оригінал

Попередні статті

Ілюстрація, що зображує потік даних у центрі обробки даних NASA, з елементами штучного інтелекту та машинного навчання.
21 травня 2026Штучний інтелект

NASA уклала контракт на підтримку даних та інформатики

NASA обрала Development Seed для надання послуг з досліджень та розробок Офісу науки про дані та інформатики (ODSI) у Космічному центрі Маршалла. Контракт вартістю до 76 мільйонів доларів передбачає підтримку до червня 2031 року.

Комп'ютерні науки проти аналізу даних: порівняння дисциплін
21 травня 2026Дані та аналітика

Комп'ютерні науки проти аналізу даних: порівняння дисциплін

Технічні навички користуються високим попитом, що зумовлено розвитком штучного інтелекту, хмарних обчислень та науки про дані. Цей матеріал порівнює комп'ютерні науки та аналіз даних, розглядаючи їхні основні напрямки, необхідні навички, кар'єрні шляхи та відмінності, попри значне перетинання.

Абстрактна ілюстрація, що показує потік даних через етапи збору, зберігання, обробки та аналізу, з елементами хмарної інфраструктури на задньому плані.
21 травня 2026Дані та аналітика

Інженерія даних та DataOps: Основи для розуміння

Інженерія даних є ключовою галуззю, що забезпечує збір, зберігання, обробку та аналіз великих наборів даних. Цей матеріал розкриває її важливість, роль у сучасних бізнес-моделях, типи баз даних, процеси ETL, відмінності між OLTP та OLAP, а також вплив хмарних технологій та сучасного стека даних.

Наступні статті

Інженер даних працює з візуалізованими потоками даних та елементами штучного інтелекту на екрані, що символізує автоматизацію та ефективність.
21 травня 2026Дані та аналітика

Наступне Покоління Інженерії Даних: Динамічні Таблиці та Ще 5 Функцій, Що Змінять Ваш Підхід до Розробки

Snowflake представляє шість нових функцій, які трансформують інженерію даних, переходячи до декларативного програмування та автоматизуючи складні робочі процеси. Ці інструменти, від Cortex Code до Динамічних Таблиць, покликані скоротити час розробки з днів до хвилин та розширити можливості інженерів.

Ілюстрація, що зображує людину, яка аналізує дані на екрані без коду, з елементами, що символізують психологію, інженерію та бізнес.
21 травня 2026Дані та аналітика

Нова програма UTC відкриває шлях до аналітики даних без кодування

Університет Теннессі в Чаттанузі запустив програму Engineering Analytics, що дозволяє студентам вивчати аналітику даних без необхідності кодування, зосереджуючись на практичному застосуванні та міждисциплінарному підході.

Ілюстрація, що показує оптимізаційну модель, оточену елементами невизначеності, що символізують випадкові дані, та чітке рішення в центрі.
21 травня 2026Розробка ПЗ

Стохастичне програмування: Як оптимізувати рішення в умовах невизначеності

Стохастичне програмування дозволяє моделювати невизначеність безпосередньо в оптимізаційних моделях, пропонуючи чотири основні підходи для прийняття рішень, які витримують мінливість реального світу.