ChatGPT здатний складати іспити краще, ніж студенти

ChatGPT здатний складати іспити краще, ніж студенти
29.08.2023

Компанія Scientific Reports провела цікаве дослідження, яке стосувалося роботи штучного інтелекту та студентів Нью-Йоркського вищого навчального закладу в Абу-Дабі.

Результати продемонстрували, що ChatGPT може складати іспити точно так само, чи навіть краще, ніж студенти. Однак це здебільшого стосується компʼютерних наук, політики, інженерії та психології.

Як проводили дослідження?

Науковці Талал Рахван та Ясір Закі запросили викладачів різних дисциплін, аби вони склали тест із 10 запитань, що стосувалися їхнього фаху.

На кожне завдання екзамену вчені пропонували по 3 варіанти розвʼязання здобувачів освіти. Разом з тим ChatGPT згенерував по одній відповіді на аналогічні питання. 

Після цього викладачі перевіряли результати іспиту, не знаючи, де відповідав штучний інтелект, а де — студенти.

Так от, виявилось, що у 9-ти з 32-х іспитів різних дисциплін ChatGPT набрав таку саму кількість балів, що й студенти. А подекуди результати штучного інтелекту оцінили набагато вище.

Лише в математиці та економіці відповіді людей показували значно кращі результати. Найвищі бали штучний інтелект отримав за іспит з предмета «Вступ до державної політики».

Там його відповіді оцінили у 9.56 балів проти 4.39 у здобувачів освіти.

Терміни, які повинен знати кожен айтівець!

Дізнатись

Скільки студентів готові використовувати ШІ у своїх роботах?

Організація Scientific Reports опитала понад півтори тисячі людей в Японії, Британії, Бразилії, Індії, та США про готовність застосування ChatGPT.

У підсумку, опитування виявило, що понад 74% здобувачів освіти налаштовані залучати штучний інтелект до написання власних праць.

Цікаво, що викладачі очікували на менший показник. Вони вважають використання ШІ плагіатом.

Нагадаємо, нещодавнє дослідження вчених зі Стенфордського університету показало, що чат-боти дискримінують неангломовних користувачів. Науковці за допомогою детекторів GPT перевірили 91 есе англійською мовою, написане не носіями.

Власне, ці детектори показали, що більшість текстів нібито створив штучний інтелект.