Нещодавнє дослідження, опубліковане в журналі Nature, ставить під сумнів надійність використання ChatGPT для отримання медичних рекомендацій, незважаючи на його широке поширення. Понад 230 мільйонів людей щотижня звертаються до цього ІІ-чату з питаннями, що стосуються здоров’я, від простих перевірок на алергію до керування симптомами. Однак дослідники виявили, що ChatGPT Health систематично недооцінює невідкладність серйозних медичних ситуацій, іноді радячи пацієнтам почекати, замість негайного звернення за допомогою.
Неправильна Діагностика у Випадках Екстреної Допомоги
Дослідження, очолюване Ешвіном Рамасуамі з Маунт-Сінай у Нью-Йорку, оцінило здатність ChatGPT Health правильно визначати невідкладні стани у 60 клінічних сценаріях за 21 медичною спеціальністю. Хоча ІІ добре справлявся з очевидними випадками, такими як інсульт або важкі алергічні реакції, він не рекомендував екстрену допомогу більш ніж у половині дійсно критичних ситуацій.
Один із прикладів, виділений у дослідженні, стосувався сценарію з астмою, де ChatGPT правильно визначив ранні ознаки дихальної недостатності, але все одно рекомендував почекати, перш ніж звертатися за лікуванням. Це демонструє небезпечний недолік: інструмент має труднощі, коли медична небезпека не очевидна відразу.
Суїцидальні Наміри та Непослідовні Заходи Безпеки
Дослідження також проаналізувало реакцію ChatGPT Health на повідомлення про суїцидальні думки. Незважаючи на те, що він запрограмований на заохочення звернення за допомогою у таких випадках, “мережа безпеки” ІІ працювала непослідовно. Банер служби підтримки та кризової допомоги з’являвся спорадично, і модель була більш надійною у відповідях користувачам, які не вказали спосіб заподіяння собі шкоди, ніж тим, хто вказав – контрінтуїтивне та тривожне відкриття.
Технології, що розвиваються, і Непередбачувана Ефективність
Дослідники підкреслюють, що мовні моделі ІІ постійно змінюються з частими оновленнями, які можуть непередбачено впливати на продуктивність. Хоча вони не виступають за повну відмову від ІІ-інструментів у охороні здоров’я, вони наполегливо застерігають від покладення на них при ухваленні критичних медичних рішень. Пацієнтам з симптомами, що погіршуються (біль у грудях, задишка, важка алергія, зміни психічного стану) слід негайно звернутися за медичною допомогою безпосередньо, а не покладатися виключно на поради чобота.
“Як майбутній лікар, який працює з цими інструментами, я бачу, що ІІ має бути інтегрований у практику продумано, а не як заміну клінічного судження”, – пояснює Альвіра Тьягі, співавтор дослідження.
Дослідження наголошує, що сьогоднішні результати не є остаточними; постійний аналіз та тестування необхідні для забезпечення того, щоб покращення в ІІ призводили до більш безпечної допомоги. У швидко змінюваному світі ІІ довіряти своє здоров’я чоботу залишається значним ризиком.
