Claude Code: AI-агенти для точних журналістських розслідувань

AI-агенти та журналістика: Нові можливості

Агенти зі штучним інтелектом, що вміють кодувати, демонструють потенціал далеко за межами розробки програмного забезпечення. Зокрема, Claude Code від Anthropic, інтерфейс командного рядка для моделі Claude, використовується для управління базами знань, автоматизації досліджень, збору даних про події та організації робочих процесів. Для цих завдань характерним є надання агенту доступу до робочої директорії, підтримка контексту між сесіями та виконання багатоетапних завдань.

Журналістика є природним середовищем для такого роду роботи. Замість того, щоб розглядати модель як чат-бот, їй надається робочий простір з матеріалами (джерела, стенограми, нотатки) та завдання, такі як аналіз матеріалів, відстеження змін або підготовка меморандумів. Асистент підтримує контекст без постійного перезавантаження та повторних пояснень.

Кейс-стаді: Відтворення розслідування MuckRock

Це дослідження зосереджене на застосуванні AI-агентів для аналізу даних у розслідувальній журналістиці. Було відтворено розслідування MuckRock/WHRO щодо десертифікації поліцейських у Вірджинії, використовуючи Claude Code з моделлю Opus 4.5. Модель Opus 4.5 мала обмеження знань до травня 2025 року і не проводила веб-пошуків під час аналізу. Весь процес зайняв менше години, з приблизно 20 хвилинами ручної перевірки та людського контролю.

Метою було перевірити, чи може AI-агент відтворити такий аналіз, використовуючи ті ж публічні дані, таким чином, щоб результати були прийнятними для редактора. Розслідувальна журналістика даних має специфічні вимоги: дані часто є неструктурованими, з непослідовними форматами та дублікатами. Прозорість та походження даних є невід'ємними, а кожне аналітичне рішення має бути обґрунтованим.

Сила «навичок» у Claude Code

Claude Code має функцію під назвою «навички» (skills) — файли Markdown, які надають Claude інструкції та робочі процеси для конкретних завдань. Замість того, щоб пояснювати вимоги щоразу, їх кодують у файлах, які Claude автоматично завантажує, коли виникають відповідні завдання. Ці навички можуть бути упаковані як модулі для журналістських робочих процесів (наприклад, верифікація, запити FOIA, журналістика даних).

Навичка — це директорія, що містить файл SKILL.md з YAML-фронтматером та Markdown-вмістом, таким як покрокові інструкції, приклади, граничні випадки та інший контекст. Claude Code завантажує назву та опис кожної навички при запуску, а потім активує повні інструкції, коли виявляє відповідне завдання.

Для цього кейс-стаді було створено три навички, орієнтовані на вимоги розслідувальної роботи з даними:

Python Runner: Усуває складнощі налаштування середовища коду, навчаючи Claude використовувати uv для автоматичного вирішення залежностей програмного забезпечення.
Structured Data Preprocessing: Кодує принцип, що очищення даних у журналістиці має бути прозорим, відтворюваним та керованим журналістом. Ця навичка вимагає стовпців походження, що відстежують кожен рядок до вихідного файлу та номера рядка. Вона передбачає п'ятифазний робочий процес: завантаження, аудит, звіт, трансформація (лише після людського схвалення) та валідація. Перед будь-якими трансформаціями Claude має створити звіт про якість даних.
Structured Data Analysis: Втілює ідею, що результати розслідування мають бути обґрунтованими. Навичка вимагає формальної пропозиції перед виконанням будь-якого аналізу, з документованими припущеннями, щоб журналіст міг їх переглянути. Після виконання результати включають приклади верифікації для перевірки журналістом.

Ці навички суттєво змінюють поведінку Claude. Той самий початковий запит призводить до кардинально різних робочих процесів залежно від того, чи активні навички.

Порівняння: З навичками та без

Для тестування було проведено два варіанти вправи з тими ж вихідними даними та початковими запитами. Єдина відмінність полягала в тому, що в одній директорії були встановлені журналістські навички, а в іншій використовувався Claude Code «з коробки».

Без навичок: Claude одразу переходив до дії. Він конвертував файли Excel у CSV, мовчазно обробляв аномалії форматування (наприклад, один аркуш мав 16 377 стовпців, і Claude брав «перші 8 стовпців» без пояснень) та створював очищені файли без документації змін. Модель поставила лише два питання під час фази попередньої обробки, приймаючи всі інші рішення автономно.

З навичками: Робочий процес виглядав зовсім інакше. Перед тим, як торкнутися даних, Claude створив 307-рядковий звіт про якість даних, документуючи кожну знайдену проблему: варіанти написання назв агентств, непослідовні мітки, проблеми форматування дат та значення, що виглядали як друкарські помилки. Кожна проблема супроводжувалася рівнем серйозності, конкретними прикладами та пропонованими виправленнями. Claude зупинявся і чекав схвалення перед застосуванням будь-яких трансформацій.

Наприклад, в обох випадках зустрічалася друкарська помилка в даті «10/04/0222». Без навичок Claude мовчазно перетворив її на недійсну дату. З навичками звіт про якість даних чітко позначив її, Claude відстежив її до точного вихідного рядка та зафіксував виправлення.

Важливо, що запуск без навичок призвів до помилкових чисел. Він повідомив про 80 завершених десертифікацій у 2022 році замість 81, а рейтинги агентств відрізнялися від опублікованого розслідування, оскільки він мовчазно змішував завершені та незавершені справи. Жодна з цих помилок не витримала б редакційної перевірки. Запуск з навичками, навпаки, відтворив висновки MuckRock.

Суть змін: Звичайний текст

Вражаючим у цьому дослідженні є те, що зробило різницю: приблизно 800 рядків Markdown у трьох файлах навичок. Жодних змін у коді Claude, жодного тонкого налаштування моделі, жодних спеціалізованих навчальних даних. Лише інструкції, написані природною мовою, що кодують вимоги конкретної галузі.

Це представляє зміну у підході до конфігурації інструментів ШІ. Звичайний підхід включає або промпт-інжиніринг, або тонке налаштування. Навички знаходяться посередині: постійні інструкції, які формують поведінку між сесіями без необхідності технічної інфраструктури. Для журналістики це важливо, оскільки вимоги є відомими та чітко сформульованими. Експертиза домену стає портативною, оскільки навички можна контролювати версіями, ділитися ними та покращувати.

Застереження та обмеження

Це дослідження не доводить, що ШІ може займатися розслідувальною журналістикою повністю. Було відтворено аналіз, який вже виконали професійні журналісти. Важка робота з отримання записів, розуміння політичного контексту, виявлення історії та її висвітлення була виконана MuckRock та WHRO. Дослідження показало, що AI-агент може обробляти частину робочого процесу, пов'язану з даними, та надавати обґрунтовані результати.

Людина залишалася важливою протягом усього процесу. Навіть з навичками, що забезпечують структурований робочий процес, було прийнято десятки рішень: як об'єднати аркуші, як обробляти неоднозначні збіги назв агентств та які аналізи пріоритезувати. Запуск з навичками все ще вимагав корекції. Навички роблять робочий процес більш систематичним, але не усувають потреби в людській увазі.

Експертизу домену не можна повністю автоматизувати. Модель могла б позначити, що «Hampton Police Department» та «Hampton Police Division» можуть бути одним і тим же агентством, але не могла б перевірити це без зовнішніх джерел. Чи є знахідка справді важливою, який контекст потрібен читачам і як відповідально сформулювати історію — все це залишається людськими судженнями. Жодна кількість інструкцій у Markdown не замінить їх.

Погляд у майбутнє

Агенти з кодуванням обіцяють багато для робочих процесів у редакціях, окрім аналізу даних — перегляд документів, організація джерел, перевірка фактів, відстеження запитів FOIA. Екосистема журналістських навичок є новою, але проекти, такі як репозиторій навичок Джо Амдітіса, свідчать про можливість її розбудови.

Якщо ви журналіст, що працює з даними та розглядає інструменти ШІ, конфігурація має таке ж значення, як і можливості. Потужна модель без належних обмежень буде діяти швидко і робитиме помилки. Та ж модель з відповідними до домену навичками буде діяти більш обережно — і створюватиме роботу, яку можна буде захистити.

Що це означає для розробників

Розробники можуть використовувати концепцію «навичок» (skills) у Claude Code для створення спеціалізованих, прозорих та відтворюваних робочих процесів. Це дозволяє кодувати вимоги домену в Markdown, роблячи експертизу портативною та контрольованою версіями, що є альтернативою промпт-інжинірингу чи тонкому налаштуванню.

Ключові факти

AI-агенти з кодуванням, такі як Claude Code, можуть використовуватися для завдань поза розробкою ПЗ, включаючи журналістику.
Кейс-стаді відтворило розслідування MuckRock/WHRO щодо десертифікації поліцейських, використовуючи Claude Code з моделлю Opus 4.5.
Claude Code має функцію «навичок» (skills) — файлів Markdown, що надають моделі інструкції та робочі процеси для конкретних завдань.
Використання навичок (наприклад, Structured Data Preprocessing, Structured Data Analysis) забезпечило прозорість, відтворюваність та точність аналізу, запобігаючи помилкам.
Без навичок Claude Code робив помилки та приймав рішення автономно без документації, що призводило до неточних результатів.