AI може допомогти вченим швидко генерувати гіпотези

Майже скрізь, де б ви не були в Інтернеті, здається майже неможливим уникнути статей про ШІ. Навіть тут, в UT, ми опублікували кілька. Зазвичай вони зосереджені на тому, як конкретна дослідницька група використала технологію, щоб зрозуміти масиви даних. Але такий вид розпізнавання образів — це не все, для чого корисний ШІ. Фактично, він стає досить здатним до абстрактного мислення. І одне місце, де абстрактне мислення може бути корисним, це розробка нових наукових теорій. Пам’ятаючи про це, команда дослідників з Європейського космічного агентства, Колумбії та Австралійського національного університету (ANU) використала штучний інтелект, щоб висунути наукові гіпотези в астрономії.

Зокрема, вони зробили це в підгалузі «Галактична астрономія», яка спеціалізується на дослідженнях навколо формування та фізики галактик. У нещодавно опублікованій статті на arXiv згадується, що вони вибрали цю підсферу через її «інтегративну природу», яка вимагає «знань з різних підполей».

Це схоже на те, у чому ШІ вже добре вміє. Але стандартна велика мовна модель (LLM), подібна до тих, що стали найвідомішими останнім часом (ChatGPT, Bard тощо), не матиме достатньо предметних знань для розробки обґрунтованих гіпотез у цій галузі. Він навіть може стати жертвою «галюцинацій», про які деякі дослідники (і журналісти) попереджають, що вони є одним із недоліків взаємодії з моделями.

Ця версія шоу запитань Фрейзера частково стосується ШІ.

Щоб уникнути цієї проблеми, дослідники під керівництвом Іоани Чук? і Юань-Сен Тінг з ANU використовували фрагмент коду, відомий як інтерфейс прикладного програмування (API), який був написаний на Python, відомий як Langchain. Цей API дозволяє більш досвідченим користувачам маніпулювати LLM-ами, такими як GPT-4, який є найновішою основою для ChatGPT. У випадку дослідників вони завантажили понад 1000 наукових статей, що стосуються галактичної астрономії, у GPT-4 після завантаження їх із системи астрофізичних даних NASA.

Один з експериментів дослідників полягав у тому, щоб перевірити, як кількість документів, до яких модель мала доступ, вплинула на висунуті гіпотези. Вони помітили суттєву різницю між запропонованими гіпотезами, які він розробив, маючи доступ лише до десяти документів, і доступом до повної тисячі.

Але як вони судили про вірогідність самих гіпотез? Вони зробили те, що зробив би будь-який поважаючий себе вчений, і залучили експертів у цій галузі. Їх двоє, якщо бути точним. І вони просили їх просто висунути гіпотези, засновані на оригінальності думки, доцільності перевірки гіпотез і наукової точності її основи. Експерти виявили, що навіть з обмеженим набором даних лише з десяти робіт гіпотези, висунуті «Astro-GPT», як вони назвали свою модель, отримали лише трохи нижчу оцінку, ніж компетентний доктор філософії. студент. Маючи доступ до всіх 1000 статей, Astro-GPT отримав «майже експертний рівень».

Ось коротке пояснення вченого NASA про те, як штучний інтелект виведе астрономію на новий рівень. Авторство – Музей науки, Бостонський канал YouTube

Критичним фактором у визначенні остаточних гіпотез, які були представлені експертам, було те, що гіпотези були уточнені за допомогою «змагальної підказки». Хоча це звучить агресивно, це просто означає, що окрім програми, яка розробляла гіпотези, інша програма була навчена на тому ж наборі даних, а потім надала першій програмі зворотний зв’язок щодо своїх гіпотез, тим самим змусивши оригінальну програму вдосконалити свої логічні помилки та загалом створюють значно кращі ідеї.

Навіть зважаючи на суперечливі відгуки, немає жодних причин для кандидата астрономії. студентам відмовитися від висування власних унікальних ідей у ​​своїй галузі. Але це дослідження вказує на недостатнє використання можливостей цих LLM. У міру того, як вони набувають більшого поширення, науковці та неспеціалісти можуть використовувати їх все більше і більше, щоб придумати нові та кращі ідеї для перевірки. Джерело


[ оригинал ]