Возвращаемся к теме космоса, но уже с ИИ. Новый "ИИ-учёный" PhyE2E разработан специалистами из университетов Цинхуа и Пекинского при поддержке различных научных институтов. Основная цель проекта — превратить ИИ из инструмента для подгонки кривых в средство для осмысленного открытия закономерностей. В отличие от обычных алгоритмов, PhyE2E не просто строит статистические модели, а формулирует компактные и понятные математические выражения, согласованные по физическим единицам и дает им понятное обьяснение. Таким образом, на выходе получается не абстрактная теория, а уравнение, которое можно проверить и использовать в научных исследованиях.
Во время обучения система анализировала реальные физические данные различных космических объектов и известные уравнения. Постепенно PhyE2E определил, как выглядят правдоподобные формулы, и научилась комбинировать их так, чтобы сохранялась размерность величин. В основе нового ИИ лежит архитектура трансформера от нейросети Llama2-3B, которая переводит данные непосредственно в символьные выражения и соответствующие единицы измерения.
Для решения сложных задач модель использует стратегию разделения на подпроблемы. Она сначала анализирует вторые производные в вспомогательной нейросети, затем разлагает задачу на несколько простых уравнений и оптимизирует их с помощью методов поиска по дереву Монте-Карло и генетического программирования. В результате PhyE2E выдаёт уравнение, которое не только описывает данные, но и имеет физический смысл.
Разработчики проверили систему на синтетических данных и реальных проектах NASA. В пяти задачах, связанных с космической физикой, PhyE2E вывела уравнения, совпадающие с формулами, полученными людьми, и в некоторых случаях даже более точно описывающие явления. Например, при анализе архивных данных NASA за 1993 год система предложила уточнённое выражение для описания солнечных циклов, а также выявила взаимосвязи между солнечным излучением, температурой и магнитным полем.
Авторы проекта отмечают, что PhyE2E учится не просто подгонять значения, а искать логические цепочки, сохраняющие физический смысл. Она опирается на уже известные уравнения и предлагает новые комбинации, не нарушая законов размерности. По сути, система объединяет возможности больших языковых моделей и символьной математики, превращая машинное обучение в мощный инструмент научного анализа.
В будущем PhyE2E планируют использовать для обработки экспериментальных и астрофизических данных, где часто встречаются нелинейные связи и шум. Также учёные собираются расширить архитектуру модели, добавив поддержку операций дифференцирования и интегрирования. Это позволит системе выводить уравнения в частных производных, которые лежат в основе большинства физических теорий.
Создатели PhyE2E видят в этом шаг к созданию «предсказуемого ИИ», способного не только делать прогнозы, но и объяснять, как и почему они работают. Такой подход может изменить сам принцип научного поиска: вместо того чтобы подбирать формулы, ИИ будет автоматически открывать закономерности, которые учёные смогут проверить и использовать для великих открытий.