Искусственный интеллект обучили извлекать из старых исследований знания, которые остались незамеченными человеком, и делать на их основе научные открытия, пишет Vice.
Для поиска в научных работах связей, которые могли упустить учёные, специалисты Национальной лаборатории им. Лоуренса в Беркли разработали алгоритм Word2Vec. Опираясь только на словесные связи, он генерировал прогнозы возможных термоэлектрических материалов (применяются в системах нагрева и охлаждения), которые используются сегодня. При этом алгоритм не имел определения «термоэлектричества» и каких-либо знаний в науке о материалах.
Для тренировки Word2vec на основе 3,3 млн рефератов научных работ по материаловедению был составлен глоссарий из 500 тысяч слов. Рефераты «скормили» алгоритму, который только по этим словам смог разобраться с такими понятиями, как периодическая таблица и химическая структура молекул. Алгоритм связывал слова, стоящие рядом, и создавал векторы родственных слов, что помогало ему составить определения понятий. Иногда слова были связаны с термоэлектрическими понятиями, но не упоминались как таковые ни в одном из рефератов. Этот пробел сложно заметить человеку, но для алгоритма он очевиден.
В одном из экспериментов прогнозные возможности алгоритма решили проверить на старых научных работах, вышедших до 2009 года. Word2Vec смог предсказать один из лучших современных материалов, который был изобретён лишь в 2012 году.
По словам исследователей, алгоритм может «читать» любые работы по материаловедению и благодаря этому устанавливать связи, до которых не додумался бы ни один учёный, а также выстраивать междисциплинарные ассоциации. Отмечается, что алгоритм не тренируют на каком-то конкретном датасете, то есть он применим в самых различных предметах и отраслях знания — даже в литературе или медицине. Разработкой уже заинтересовались другие учёные.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.