
Проєкт та його мета
Національне опитування з демографії та охорони здоров'я Філіппін (NDHS) 2025 року є важливим звітом, що містить дані про фертильність, материнський догляд, контрацепцію, дитячу смертність, вакцинацію та інші показники. Незважаючи на його випуск у березні, більшість новин висвітлювали лише один показник — загальний коефіцієнт народжуваності. Журналіст поставив собі за мету зробити ці дані доступнішими для аудиторії через карти, діаграми та ШІ-генеровані висновки, створивши дашборд за один тиждень за допомогою «вайб-кодування» — описуючи бажаний результат великій мовній моделі (LLM), яка генерувала код.
Створення інтерактивних карт
Початковою метою було створення інтерактивних карт Філіппін. Використовуючи репозиторій GitHub з адміністративними кордонами Філіппін, журналіст звернувся до Claude Code з описом бажаної поведінки: завантаження карти Філіппін, розділеної на регіони, з можливістю деталізації до провінцій, міст та муніципалітетів, а також панеллю даних на кожному рівні. Хоча початковий результат був отриманий швидко, виникли складнощі з коректним відображенням Високоурбанізованих Міст (HUCs), які географічно є частиною провінцій, але політично незалежні. Це вимагало значних ітерацій та налагодження, що нагадувало про правило «перші 90% коду займають 90% часу розробки, а решта 10% коду — інші 90% часу». Зрештою, карти були доведені до прийнятного вигляду.
Очищення та вилучення даних
Після створення шаблону карти, журналіст почав тестувати його з різними наборами даних. Використання кодуючих агентів для вилучення та очищення даних з Excel-таблиць виявилося «магічним». Наприклад, при роботі з даними про рівень бідності, Claude Code зміг точно витягти дані та інтегрувати їх у карту, навіть розпізнавши ієрархію в таблиці. Це дозволило уникнути трудомісткого ручного очищення та конвертації даних.
Гнучкість у розробці та нові ідеї
Кодуючі агенти дозволили легко змінювати напрямок проєкту та впроваджувати нові ідеї. Коли журналіст натрапив на складний набір даних NDHS, він зміг попросити Claude Code витягти географічні дані для карти народжуваності. Згодом, усвідомивши багатство даних, проєкт був перетворений на повноцінний дашборд, що включає негеографічні показники, представлені у вигляді діаграм через систему вкладок. Зміни у дизайні, наприклад, перетворення стовпчастих діаграм на «льодяникові», виконувалися за однією інструкцією.
Редакційні та дизайнерські рішення
Робота з даними вимагала постійних редакційних та дизайнерських рішень. Журналіст перевіряв точність імпортованих даних та приймав рішення щодо їх представлення. Наприклад, дані про переваги контрацепції, що містили 16 вимірів, були розділені на три окремі розділи для покращення користувацького досвіду. Також експериментували з різними типами діаграм, такими як «вафельні» діаграми, що вимагало ітерацій для досягнення бажаного результату. Подібні рішення приймалися для даних про вакцинацію. Кодуючий агент також потребував перевірки точності та стилю описів сторінок, а також забезпечення коректного відображення на мобільних пристроях.
Важливість архітектури
Через інтенсивне використання та ліміти, а також виявлені «безладні» рішення в коді, виникла потреба у серйозному архітектурному плануванні. Була впроваджена стандартизована архітектура з трьома шарами:
- Шар презентації: Стандартні шаблони для карт, діаграм, таблиць та ШІ-генерованих висновків, що дозволяють швидко перевіряти точність даних та забезпечують прозорість.
- Шар вилучення: Скрипти для вилучення даних з оригінальних таблиць та збереження їх у форматі JSON, що спрощує оновлення даних при виявленні помилок.
- Шар даних: JSON-файл для кожної сторінки, що містить структурований контент, забезпечуючи розділення даних від інтерфейсу користувача. Це дозволило зменшити використання токенів, спростити оновлення та налагодження. Для більшої частини проєкту використовувалася старіша, менш дорога модель GPT-5.3-codex medium.
ШІ-генеровані висновки
Журналіст експериментував з використанням ШІ для генерації висновків з даних. Був створений робочий процес, де агент генерував підказку, яка потім переглядалася та редагувалася вручну перед запуском. Це дозволило уникнути «перенавчання» та забезпечити цінність висновків. Наприклад, ШІ спочатку виявив, що 19-річні частіше вагітніють, ніж 15-річні, що, хоч і точно, не було проривним висновком, тому підказка потребувала доопрацювання.
Робочий процес перевірки фактів
Для забезпечення точності ШІ-генерованих висновків був розроблений робочий процес перевірки фактів. Спочатку агент перевіряв окремі твердження, але це призводило до втрати контексту. Потім перейшли до перевірки блоків висновків, оцінюючи їх як «підтверджені», «здебільшого підтверджені», «частково підтверджені» або «непідтверджені». Були додані «сильніші запобіжники»: кожен рядок доказів мав вказувати на точний покажчик даних та значення, а валідатори перевіряли структурну валідність та якість доказів. Це перетворило процес на суворіший аудит. Звіт про перевірку фактів включав оцінки та дані, на яких вони базувалися. З 273 перевірених блоків 258 були підтверджені.
Реальні застосування та майбутні можливості
Ранні тестувальники дашборду одразу побачили його потенційну цінність. Лікар та експерт з інновацій у сфері охорони здоров'я зазначила, що дашборд буде корисним для медичних працівників на місцях. Соціолог підкреслила, що проєкт робить дані зрозумілими без необхідності заглиблюватися в цифри. Співзасновниця медіакомпанії відзначила, що дашборд спрощує аналіз даних та пошук закономірностей.
Серед можливих наступних кроків — інтеграція чат-бота, який дозволить користувачам ставити запитання та отримувати відповіді, ґрунтовані на даних, а також додавання інших наборів даних для перехресного аналізу. Весь дашборд, включаючи карти, діаграми, ШІ-генеровані висновки та систему перевірки фактів, був створений однією людиною за тиждень завдяки «вайб-кодуванню», але, як показав проєкт, одних лише «вайбів» недостатньо.
Що це означає для розробників
Цей досвід демонструє, що кодуючі агенти можуть значно прискорити розробку, але вимагають від розробників глибокого розуміння архітектури, здатності до налагодження та критичного мислення для перевірки згенерованого коду та даних. Впровадження стандартизованих шарів (презентації, вилучення, даних) є ключовим для масштабованості та підтримки проєктів, створених за допомогою ШІ.
Ключові факти
-
Журналіст створив дашборд для аналізу даних NDHS Філіппін за один тиждень, використовуючи «вайб-кодування» з LLM.
-
Проєкт виявив ефективність ШІ-агентів у генерації коду та очищенні даних, але також показав складнощі з точністю та необхідність ітерацій.
-
Для успішної роботи з кодуючими агентами потрібні редакційні рішення, перевірка даних та архітектурне планування.
-
Була розроблена трирівнева архітектура (Presentation, Extraction, Data) для підвищення ефективності та спрощення налагодження.
-
Впроваджено робочий процес перевірки фактів для ШІ-генерованих висновків, що включає строгі валідатори та звітність.
Джерела
Джерело
Reuters Institute for the Study of JournalismJaemark Tordecilla 12 May 2026
I vibe coded a complex data visualisation and analysis dashboard. Here’s what I learned12 травня 2026
Попередні статті

Snowflake представляє CoCo та Datastream для прискорення розробки корпоративного ШІ
Snowflake анонсувала значні оновлення для свого агента кодування CoCo (раніше Cortex Code) та представила нову потокову службу Datastream. Ці інструменти покликані спростити та прискорити розробку корпоративних ШІ-додатків, автоматизуючи робочі процеси та забезпечуючи доступ до даних у реальному часі.

Rotate придбала Data Build Company для посилення послуг з обробки даних в авіаперевезеннях
Компанія Rotate, що спеціалізується на програмному забезпеченні та консалтингу для авіаперевезень, придбала нідерландську консалтингову фірму Data Build Company (DBC). Це придбання має прискорити запуск Rotate Data Services, яка допомагатиме компаніям вирішувати проблеми з даними та впроваджувати ШІ.

Витік даних через «Vibe Coding»: 380 000 корпоративних застосунків були публічно доступними
Нове дослідження RedAccess виявило 380 000 публічно доступних корпоративних застосунків, створених за допомогою «vibe coding» інструментів. Близько 5 000 з них містили конфіденційну інформацію, що підкреслює зростаючу проблему «тіньового ШІ» та безпеки.
Наступні статті

Шлях від аналітика даних до інженера даних: 12-місячний план самонавчання
IT-системний аналітик ділиться своїм 12-місячним планом самостійного навчання для переходу в інженерію даних. Цей шлях зумовлений зростанням ШІ в аналітиці, бажанням глибших викликів та інтересом до створення інфраструктури даних.

7 ключових GitHub-репозиторіїв для сучасних баз даних та інженерії даних
GitHub пропонує низку відкритих проєктів, що підтримують розробників у роботі з базами даних, SQL-інструментами та інженерією даних. Ці репозиторії охоплюють рішення для аналітики, моніторингу та масштабування.

Vibe Analytics: Новий підхід до аналізу даних, що розкриває інсайти
Vibe analytics, натхненний «vibe coding», перетворює аналіз даних на імпровізаційний діалог за допомогою генеративного ШІ, дозволяючи лідерам швидше отримувати інсайти та демократизуючи аналітичні можливості.