EnvGPT: новая специализированная модель для экологических наук
Разработка адаптирована для анализа климата, водных ресурсов и почвенных систем, результаты подтверждены тестами
1 сентября представлена новая специализированная языковая модель EnvGPT, адаптированная для задач в областях климатологии, водных ресурсов и почвенных наук на основе публикации Newswise. Уникальность разработки заключается в её тонкой настройке с использованием данных, специфичных для этих научных сфер, что позволило достигнуть результатов, сравнимых с крупными языковыми моделями.
В независимом сравнительном тестировании на платформе EnvBench EnvGPT превзошла сопоставимые по размеру модели LLAMA‑3.1‑8B и Vicuna‑1.5‑7B, а по точности и релевантности приблизилась к более крупным системам вроде Qwen2.5‑72B и закрытой GPT‑4‑mini. На тесте EnviroExam, основанном на университетских множественном выборе, модель показала 92,06 % точности — это примерно на 8 пунктов выше аналогов. Кроме того, EnvGPT продемонстрировала высокую пригодность в сценариях реального применения, особенно при междисциплинарных задачах сложного рассуждения, что подтверждено данными из датасета ELLE.
— Эта работа демонстрирует, как целенаправленная точная настройка с использованием данных, относящихся к конкретной предметной области, может повысить эффективность компактных моделей, чтобы они могли конкурировать с гигантами в этой области. EnvGPT устанавливает новый стандарт для приложений искусственного интеллекта в науке об окружающей среде, — прокомментировал д-р Цин Ху, автор исследования и ведущий учёный из Государственной ключевой лаборатории контроля загрязнения почв и безопасности.
Среди предназначений EnvGPT — поддержка исследователей, преподавателей и политиков при работе с комплексными экологическими запросами. Модель способна предоставлять точные, учитывающие специфику отрасли ответы. Кроме того, в открытый доступ выпущены инструменты ChatEnv и EnvBench, что обеспечивает воспроизводимость исследований и стимулирует улучшения от сообщества.
Исследовательская группа планирует дальнейшую интеграцию технологий: использование генерации с поддержкой поиска (retrieval‑augmented generation) и мультимодальных данных для повышения оперативного рассуждения и актуальности модели в меняющемся ландшафте научных знаний. Стоит отметить, что проект финансировался в рамках национальной ключевой программы исследований и разработок Китая, а также специальным фондом для университетов высокого уровня.
Комментарии закрыты.