
Новий підхід до аналізу генетичних даних
Доцентка Шарлі Клаймер зі студентами свого курсу з біологічних наук про дані працює над аналізом наборів генетичних даних, пов'язаних із захворюваннями. Метою є побудова мережевих моделей для виявлення кореляційних закономірностей та їх тестування на зв'язок з певними ознаками, такими як наявність хвороби. Цей курс надає студентам практичний досвід обробки та аналізу генетичних даних.
Студент Сіддхартха Пулланнагарі, який раніше цікавився розробкою додатків, приєднався до курсу, зацікавившись застосуванням штучного інтелекту в охороні здоров'я. Разом з іншими студентами він завантажував набори даних, пов'язані з обраними захворюваннями, з публічного репозиторію Gene Expression Omnibus. Вони вчилися очищати та обробляти дані, будувати мережеві моделі, що відображають кореляційні закономірності, та перевіряти ці закономірності на зв'язок з ознаками, такими як наявність хвороби. Результати валідувалися за допомогою незалежних даних.
Виявлення біомаркерів для різних захворювань
Студенти використовували підхід, який Клаймер застосовує у своїх дослідженнях, часто зосереджених на генетичних даних, пов'язаних з хворобою Альцгеймера. Вони досліджували набори даних, пов'язані з різними станами, і змогли ідентифікувати та валідувати значні асоціації, що стосуються:
- Рівнів експресії генів у клітинах, що вистилають товсту кишку, для пацієнтів з раком товстої кишки.
- Зразків крові для пацієнтів з ревматоїдним артритом.
- Біопсій шкіри для пацієнтів з псоріазом.
- Рівнів експресії генів у зразках крові для пацієнтів з вовчаком.
- Рівнів мікроРНК у зразках крові для пацієнтів з раком.
Деякі студенти продовжують аналіз, досліджуючи рівні метилювання ДНК для COVID-19, гепатоцелюлярної карциноми та рівні експресії генів для БАС. За словами Клаймер, кожен валідований патерн є сигнатурою біомаркера, що має потенціал для ідентифікації осіб, які демонструють підтип певної ознаки.
Важливість підтипів у точній медицині
Термін "підтип" є ключовим, оскільки багато захворювань, включаючи рак, діабет, ревматоїдний артрит, вовчак та хворобу Альцгеймера, є гетерогенними. Це означає, що вони мають множинні форми, які часто виникають через різні генетичні, молекулярні або екологічні фактори. Точна медицина прагне враховувати ці відмінності, створюючи індивідуальний підхід до профілактики та лікування захворювань на основі унікального генетичного профілю, середовища та способу життя кожного пацієнта.
Клаймер зазначає, що поширені тести часто не враховують ці відмінності. Методи, які вона розробила, дозволяють розпізнавати комбінації біомаркерів, пов'язаних із захворюванням, і аналізувати, наскільки тісно ці біомаркери корелюють з конкретними підтипами, які виявляються як кластери в мережевих моделях.
Ідентифікація різних підтипів є важливою для розвитку науки, оскільки вона надає уявлення для формулювання гіпотез щодо патогенезу, виявляє потенційні цілі для розробки ліків, є критично важливою для категоризації осіб у клінічних випробуваннях ліків та є основою для успішної точної медицини.
Розробка нових інструментів та майбутні публікації
Клаймер розробила алгоритм, який дозволяє оцінювати мережі взаємодіючих або асоційованих елементів, що значно перевершує попередні методи аналізу генетичних даних. Вона представила свої методи у 2024 році, стверджуючи, що "ми використовуємо неправильну статистику для точної медицини", і продемонструвала, як її інструменти можуть захоплювати підтипи за допомогою розподілу даних для тестування асоціацій та метрик кореляції.
Сіддхартха Пулланнагарі продовжує працювати з Клаймер, створюючи візуалізації для валідованих результатів. Він розробить рукопис, який продемонструє ефективність методів Клаймер у різних умовах та захворюваннях. Клаймер має намір подати цю роботу до публікації в журналі, де студенти будуть співавторами. Вона вважає, що результати є "дуже сильними", оскільки виявлені закономірності в наборі відкриття майже ідентичні тим, що отримані під час валідації з незалежними даними.
Що це означає для розробників
Розробники, які працюють з даними, можуть використовувати ці методи мережевого моделювання для аналізу генетичних даних та виявлення кореляційних закономірностей, що є критично важливим для точної медицини. Це відкриває нові можливості для створення обчислювальних інструментів, які розпізнають комбінації біомаркерів та їх зв'язок з підтипами захворювань.
Ключові факти
-
Курс Шарлі Клаймер з біологічних наук про дані навчає студентів обробляти та аналізувати генетичні дані.
-
Студенти будують мережеві моделі для виявлення кореляційних закономірностей, пов'язаних із захворюваннями.
-
Сіддхартха Пулланнагарі та інші студенти валідували асоціації біомаркерів для раку товстої кишки, ревматоїдного артриту, псоріазу, вовчака та раку.
-
Виявлені патерни є сигнатурами біомаркерів, що потенційно ідентифікують підтипи захворювань.
-
Точна медицина вимагає врахування гетерогенності захворювань та їх підтипів.
Джерела
Джерело
UMSL DailySteve Walentik
Sharlee Climer and computer science students unlock clues in genetic data to improve precision medicine29 травня 2026
Попередні статті

HEC Montréal запускає магістерську програму з Data Science та Business Analytics
HEC Montréal пропонує магістерську програму з Data Science та Business Analytics, що готує фахівців до розробки моделей, аналізу даних та оптимізації бізнес-процесів. Програма включає практичні проєкти, тісні зв'язки з дослідницькими центрами та високі показники працевлаштування.

Система раннього попередження про апокаліпсис Кайла Макдональда: як приватні літаки можуть сигналізувати про надзвичайні ситуації
Програміст та художник Кайл Макдональд створив систему, що відстежує приватні літаки та присвоює їхнім переміщенням «рівень надзвичайної ситуації», досліджуючи, хто отримує інформацію та кому ми довіряємо.

Огляд найкращих AI-інструментів для кодування у 2026 році
У 2026 році ринок AI-інструментів для розробників пропонує широкий вибір рішень: від автономних інженерів до помічників для «вайбкодингу». Цей матеріал представляє огляд 12 провідних інструментів, їхні особливості та сфери застосування.
Наступні статті

Ера "вайб-кодингу": Як ШІ змінює розробку програмного забезпечення та ринок праці
Штучний інтелект кардинально змінює розробку програмного забезпечення, дозволяючи створювати складні додатки за допомогою простих запитів. Це викликає обвал на ринку акцій та ставить під сумнів майбутнє традиційних IT-професій, але відкриває нові можливості для мільярдів людей.

Snowflake розширює доступність та можливості Cortex Code
Snowflake оголосила про значні оновлення для свого AI-агента Cortex Code, розширюючи його доступність у Snowsight, додаючи нативну підтримку Windows для CLI, впроваджуючи Agent Teams для паралельної роботи та нові спеціалізовані навички для роботи з даними.

EDB представляє CloudNativePG 1.29 та попередній перегляд Kubernetes-нативного захисту даних
На KubeCon + CloudNativeCon Europe 2026 компанія EDB анонсувала випуск CloudNativePG 1.29 та представила попередній перегляд нової можливості Kubernetes-нативного захисту даних для свого комерційного оператора.