Reading view

Запущен масштабный проект Trillion Gene Atlas для создания биологических ИИ с новым геномным массивом

Компания Basecamp Research объявила о старте проекта Trillion Gene Atlas — одной из крупнейших инициатив в биологии. Она направлена на сбор и анализ генетических данных от более чем 100 миллионов новых видов, что увеличит известное генетическое разнообразие примерно в 100 раз.

Проект реализуется совместно с Anthropic, разработчиком технологии секвенирования Ultima Genomics, и компанией PacBio, при поддержке вычислительной инфраструктуры Nvidia. По словам организаторов, современные методы и искусственный интеллект позволят выполнить работу, которая раньше заняла бы более 20 лет, менее чем за два года, пишет ixbt.com.

Основная задача — создать новую базу данных для обучения биологических ИИ-моделей. Сейчас такие системы используют ограниченные публичные базы генетических последовательностей. В Basecamp Research считают, что дефицит разнообразных данных замедляет развитие биологических ИИ-систем.

Компания уже представила семейство моделей EDEN, обученное на собственной базе BaseData, включающей свыше 10 миллиардов неранее известных генов из примерно миллиона новых видов. Этот большой объём данных помог выявить новые закономерности: по мере роста разнообразия биологических данных возможности ИИ растут быстрее, чем предполагали ранее.

Среди достижений EDEN — способность создавать терапевтические молекулы по описанию заболевания. Модель проявила активность в человеческих Т-клетках без обучения на клинических данных. Также разработан ряд новых антимикробных пептидов с успешным попаданием в целевые патогены до 97%, а технология AI-Programmable Gene Insertion (aiPGI) позволяет программируемо вставлять гены.

Изображение сгенерировано: Nano Banana

За последние шесть лет Basecamp Research расширила сеть научных партнёров в 31 стране и организовала сбор данных в регионах с недостаточной исследовательской активностью. Новые сотрудничества начинаются в Чили и Аргентине, а также продолжается расширение работ в Антарктиде.

Технологическая основа проекта — системы нового поколения для сверхмассового секвенирования. Ultima Genomics отвечает за высокопроизводительное чтение геномов, а PacBio предоставляет технологии длинных и точных последовательностей, сохраняющих полный генетический контекст. Для анализа данных используются специализированные биоинформатические библиотеки.

Anthropic планирует применить результаты проекта для улучшения возможностей своего ИИ-ассистента Claude. В перспективе Claude сможет обрабатывать большие биологические данные, помогая исследователям интерпретировать эксперименты и ускорять создание новых методов лечения.

Переход на сайт «7 Новостей»Интересные аспекты новых технологий в области взаимодействия с памятью о близких можно найти в статье Цифровой рынок горя: как технологии оживляют память и что с этим не так.

Авторы проводят параллель с проектом «Геном человека», но отмечают масштабность Trillion Gene Atlas: теперь задача — создать крупнейшую карту генетического разнообразия жизни на Земле, что может кардинально изменить методы поиска лекарств, сделав их более системными и быстрыми с помощью ИИ.

Запущен масштабный проект Trillion Gene Atlas для создания биологических ИИ с новым геномным массивом • Опубликовано на FiNE NEWS

  •  
❌