ChatGPT не зміг пройти тест на наукові гіпотези

Нещодавно американські науковці провели великий експеримент, щоб оцінити можливості сучасних систем штучного інтелекту у виявленні правдивості наукових тверджень. В рамках дослідження ChatGPT було запропоновано проаналізувати понад 700 наукових гіпотез і визначити їхню істинність чи хибність.

На перший погляд, результати виглядали досить обнадійливо: у 2024 році точність відповідей становила 76,5%, а в 2025 — досягла 80%. Проте, з урахуванням випадкового вгадування, реальна ефективність системи знизилася приблизно до 60%.

Слабкою ланкою у роботі штучного інтелекту стала здатність виявляти неправдиві твердження, адже правильні відповіді у цій категорії склали лише 16,4%. Дослідники також зазначили, що ШІ демонструє непослідовність в своїх відповідях: при повторних запитаннях система може видавати різні результати, що ставить під сумнів її надійність у ситуаціях, де важлива точність.

Вчені звертають увагу, що сучасні моделі штучного інтелекту не сприймають інформацію так, як це роблять люди. Вони функціонують на основі статистичних закономірностей та великих обсягів даних, не володіючи справжнім логічним мисленням. Таким чином, відповіді ШІ можуть звучати переконливо, але часто виявляються хибними.

Автори дослідження вважають, що розробка штучного інтелекту, здатного до повноцінного логічного мислення, може зайняти більше часу, ніж передбачалося раніше. Вони рекомендують користувачам критично ставитися до інформації, отримуваної від ШІ, особливо в таких сферах, як наука і медицина.

ChatGPT не зміг пройти тест на наукові гіпотези

Іран зробив заяву щодо можливого статусу України як “законної цілі” через її підтримку Ізраїлю

Новий алюміній може революціонізувати водневу енергетику

В Києві підняли ціни на проїзд у маршрутках

Зміна клімату продовжує впливати на тривалість доби на Землі

Трамп висловився про російську нафту та війну в Україні

Шон Пенн пропустив церемонію “Оскар” через візит до України

Зеленський визначив пріоритети після нових атак РФ

Вибори в КНДР: формальність чи реальність?

Компанія “Нова пошта” оперативно відновлює роботу терміналу в Запоріжжі після обстрілу

Похолодання в Україні: весна робить паузу

США оголосили про термінове вивільнення нафти зі стратегічних резервів

Pussycat Dolls анонсують повернення з новою піснею та світовим турне

Кризова ситуація у Верховній Раді: десятки депутатів можуть скласти мандати

Київ встановив рекорд за тривалістю снігового покриву

Схема розкрадання на Дніпропетровщині: державні кошти на оборонні замовлення втрачені на 19 мільйонів

Протести на Кубі: енергетичні проблеми викликали масові акції

В Україні стартувало велике дослідження про рівень бідності та доходи населення

Київ отримає новий пішохідний міст за підтримки Литви