3 C
Kyiv
Четвер, 19 Березня, 2026

ChatGPT не зміг пройти тест на наукові гіпотези

Нещодавно американські науковці провели великий експеримент, щоб оцінити можливості сучасних систем штучного інтелекту у виявленні правдивості наукових тверджень. В рамках дослідження ChatGPT було запропоновано проаналізувати понад 700 наукових гіпотез і визначити їхню істинність чи хибність.

На перший погляд, результати виглядали досить обнадійливо: у 2024 році точність відповідей становила 76,5%, а в 2025 — досягла 80%. Проте, з урахуванням випадкового вгадування, реальна ефективність системи знизилася приблизно до 60%.

Слабкою ланкою у роботі штучного інтелекту стала здатність виявляти неправдиві твердження, адже правильні відповіді у цій категорії склали лише 16,4%. Дослідники також зазначили, що ШІ демонструє непослідовність в своїх відповідях: при повторних запитаннях система може видавати різні результати, що ставить під сумнів її надійність у ситуаціях, де важлива точність.

Вчені звертають увагу, що сучасні моделі штучного інтелекту не сприймають інформацію так, як це роблять люди. Вони функціонують на основі статистичних закономірностей та великих обсягів даних, не володіючи справжнім логічним мисленням. Таким чином, відповіді ШІ можуть звучати переконливо, але часто виявляються хибними.

Автори дослідження вважають, що розробка штучного інтелекту, здатного до повноцінного логічного мислення, може зайняти більше часу, ніж передбачалося раніше. Вони рекомендують користувачам критично ставитися до інформації, отримуваної від ШІ, особливо в таких сферах, як наука і медицина.

У ЦЕНТРІ УВАГИ
АКТУАЛЬНЕ ЗА ТЕМОЮ