Универсальные требования к переводу

1. Принципы научной коммуникации

* Точность терминологии:
* Использовать принятые в русскоязычной науке термины.
* При первом упоминании сложного термина давать пояснение: «квантовая запутанность (quantum entanglement)».
* Сохранять оригинальные названия организаций и проектов с переводом в скобках: «NASA (Национальное управление по аэронавтике)».

* Работа с данными:
* Числовые значения: «5.3 million light-years» → «5,3 миллиона световых лет».
* Статистика: «p < 0.05» → «p < 0,05» (без изменения формата).
* Химические формулы: оставлять без изменений (H₂O, CO₂).

2. Стилистическая адаптация

* Языковые уровни:
* Научные термины → строгая литературная норма.
* Объяснительные части → элементы разговорного стиля.

* Приёмы популяризации:
* Метафоры: «генетические ножницы CRISPR».
* Аналогии: «размером с футбольное поле».
* Вопросы к читателю: «Что это значит для нас?».

* Ритм текста:
* Сочетать предложения разной длины (8–15 слов).
* Использовать парцелляцию для акцентов: «Это открытие изменило всё. Навсегда».

3. Отраслевые особенности

* Физика/астрономия:
* Сохранение оригинальных обозначений: «звезда класса G2V».
* Перевод единиц: «au → а. е.» (астрономических единиц).

* Биология/медицина:
* Латинские названия видов: «Homo sapiens (человек разумный)».
* Клинические термины: согласно МКБ-11.

* Технологии:
* Торговые марки: «iPhone → iPhone» (без перевода).
* Названия алгоритмов: сохранять оригинальные аббревиатуры (GPT-4).

4. Улучшение визуального отображения текста

* Использовать разметку Markdown.
* Использовать заголовки первого, второго и третьего уровня.
* Выделять текст полужирным или курсивом.
* Использовать нумерованные и маркированные списки.
* Добавить небольшое количество эмодзи для выделения важности и эмоции.

Контроль качества перевода

Этапы проверки:

* Научная точность (сверка с источниками).
* Стилистическая выверенность.
* Соответствие SEO-требованиям.
* Проверка читаемости (Flesch–Kincaid ≥60).

Рекомендуемые ресурсы:

* Академический словарь РАН.
* Отраслевые глоссарии.
* Руководство по научному стилю.

Специальные указания:

* Избегать антропоморфизмов в описании природных процессов.
* Соблюдать корректность при обсуждении спорных теорий.
* Давать альтернативные точки зрения в противоречивых вопросах.
* Указывать источники финансирования исследований при наличии.

Перевод текста

Новый способ повышения возможностей больших языковых моделей

Исследователи разработали «научную песочницу», которая позволяет изучать эволюцию систем зрения.

«Робот, сделай мне стул», — три вопроса: используя вычисления, чтобы изучить лучших одноклеточных химиков в мире.

Работа над устранением барьеров для принятия ядерной энергии.

Модель глубокого обучения предсказывает, как плодовые мушки формируют клетку за клеткой.

Включая небольшие языковые модели для решения сложных задач логического мышления.

Новая программа MIT для обучения военных лидеров в эпоху искусственного интеллекта.

Новый метод повышает надёжность статистических оценок.

Новые материалы могут повысить энергоэффективность микроэлектроники.

Большинство языков используют положение слов и структуру предложений для извлечения смысла. Например, «Кот сидел на коробке» — это не то же самое, что «Коробка была на коте». В длинном тексте, например, в финансовом документе или романе, синтаксис этих слов, скорее всего, будет меняться.

Аналогично человек может отслеживать переменные в куске кода или следовать инструкциям с условными действиями. Это примеры изменений состояния и последовательного рассуждения, в которых мы ожидаем, что современные системы искусственного интеллекта будут преуспевать; однако существующий передовой механизм внимания в трансформерах — основная архитектура, используемая в больших языковых моделях (LLM) для определения важности слов — имеет теоретические и эмпирические ограничения, когда дело доходит до таких возможностей.

Механизм внимания позволяет LLM оглядываться на более ранние части запроса или документа и, основываясь на обучении, определять, какие детали и слова наиболее важны; однако этот механизм сам по себе не понимает порядок слов. Он «видит» все входные слова, называемые токенами, одновременно и обрабатывает их в том порядке, в котором они представлены, поэтому исследователи разработали методы для кодирования информации о положении. Это ключ для областей, которые являются высоко структурированными, например, для языка. Но преобладающий метод кодирования положения, называемый вращающимся кодированием положения (RoPE), учитывает только относительное расстояние между токенами в последовательности и не зависит от входных данных. Это означает, что, например, слова, которые находятся на расстоянии четырёх позиций друг от друга, как «кот» и «коробка» в приведённом выше примере, будут получать одинаковое фиксированное математическое вращение, специфичное для этого относительного расстояния.

Теперь исследования, проведённые Массачусетским технологическим институтом (MIT) и лабораторией MIT-IBM Watson AI, привели к созданию метода кодирования, известного как «PaTH Attention», который делает позиционную информацию адаптивной и контекстно-зависимой, а не статичной, как RoPE.

«Трансформеры позволяют точно и масштабируемо моделировать многие области, но у них есть эти ограничения в отношении отслеживания состояния, класса явлений, которые, как считается, лежат в основе важных возможностей, которые мы хотим видеть в наших системах искусственного интеллекта. Итак, важный вопрос заключается в следующем: как мы можем сохранить масштабируемость и эффективность трансформеров, одновременно обеспечивая отслеживание состояния?» — говорит старший автор статьи Юн Ким, доцент кафедры электротехники и информатики (EECS), член Лаборатории компьютерных наук и искусственного интеллекта (CSAIL) и исследователь в лаборатории MIT-IBM Watson AI.

Путь к пониманию

Вместо того чтобы присваивать каждому слову фиксированный поворот, основанный на относительном расстоянии между токенами, как это делает RoPE, PaTH Attention является гибким, рассматривая промежуточные слова как путь, состоящий из небольших, зависящих от данных преобразований. Каждое преобразование, основанное на математической операции, называемой отражением Хаузехолдера, действует как крошечное зеркало, которое настраивается в зависимости от содержания каждого токена, который оно передаёт. Каждый шаг в последовательности может влиять на то, как модель интерпретирует информацию позже. Совокупный эффект позволяет системе моделировать, как меняется значение между словами, а не только то, насколько они далеки друг от друга. Этот подход позволяет трансформерам отслеживать, как сущности и отношения меняются со временем, давая им ощущение «позиционной памяти».

Исследователи из MIT-IBM разработали алгоритм для более эффективного вычисления оценок внимания между каждой парой токенов, чтобы совокупное математическое преобразование от PaTH Attention было сжато и разбито на более мелкие вычисления, чтобы оно было совместимо с быстрой обработкой на графических процессорах (GPU).

Команда исследователей из MIT-IBM изучила производительность PaTH Attention в синтетических и реальных задачах, включая рассуждения, тесты на длинных контекстах и обучение LLM в полном объёме, чтобы увидеть, улучшило ли это способность модели отслеживать информацию с течением времени.

«Мы обнаружили, что как в диагностических задачах, разработанных для проверки ограничений трансформеров, так и в реальных задачах языкового моделирования наш новый подход превосходил существующие механизмы внимания, сохраняя при этом их эффективность», — говорит Ким.

Далее исследователи изучили, как механизм PaTH Attention будет работать, если он будет больше похож на человеческое познание, где мы игнорируем старую или менее релевантную информацию при принятии решений. Для этого они объединили PaTH Attention с другой схемой кодирования положения, известной как «Забывающий трансформатор» (FoX), который позволяет моделям выборочно «забывать». Получившаяся система PaTH-FoX добавляет способ снижения веса информации в зависимости от данных, достигая высоких результатов в рассуждениях, понимании длинных контекстов и языковом моделировании.

Ким говорит, что исследования, подобные этому, являются частью более широких усилий по разработке «следующего большого дела» в области искусственного интеллекта. Он объясняет, что главной движущей силой как революций в области глубокого обучения, так и генеративного искусственного интеллекта стало создание «блоков общего назначения, которые можно применять в широких областях», таких как «свёрточные слои, RNN [рекуррентные нейронные сети] слои» и, совсем недавно, трансформеры.

Почему люди развили глаза, которые есть у нас сегодня?

Пока учёные не могут вернуться в прошлое, чтобы изучить факторы окружающей среды, которые сформировали эволюцию разнообразных систем зрения, существующих в природе, новая вычислительная структура, разработанная исследователями MIT, позволяет им изучать эту эволюцию в агентах искусственного интеллекта.

Исследователи разработали структуру, в которой агенты искусственного интеллекта эволюционируют и учатся видеть в течение многих поколений, подобно «научной песочнице», которая позволяет исследователям воссоздавать различные эволюционные деревья.

Это позволяет им изучать, почему одно животное могло развить простые светочувствительные пятна в качестве глаз, в то время как другое имеет сложные глаза типа камеры.

Исследователи экспериментировали с этой структурой, демонстрируя, как задачи приводили к эволюции глаз у агентов. Например, они обнаружили, что задачи по навигации часто приводили к эволюции сложных глаз с множеством отдельных единиц, как у насекомых и ракообразных.

С другой стороны, если агенты фокусировались на распознавании объектов, они с большей вероятностью развивали глаза с камерами, имеющие радужную оболочку и сетчатку.

Эта структура может позволить учёным исследовать «что, если» вопросы о системах зрения, которые трудно изучить экспериментально. Она также может направлять проектирование новых датчиков и камер для роботов, дронов и носимых устройств, которые балансируют производительность с реальными ограничениями, такими как энергоэффективность и технологичность.

«Хотя мы никогда не сможем выяснить все детали того, как произошла эволюция, в этой работе мы создали среду, где мы можем, в некотором смысле, воссоздать эволюцию и исследовать окружающую среду всеми этими различными способами. Этот метод ведения научных исследований открывает множество возможностей», — говорит Кушагра Тивари, аспирант MIT Media Lab и соавтор статьи об этом исследовании.

Построение научной песочницы

Бумага началась с разговора исследователей об открытии новых систем зрения, которые могли бы быть полезны в различных областях, таких как робототехника. Чтобы проверить свои «что, если» вопросы, исследователи решили использовать ИИ для изучения множества эволюционных возможностей.

«Что, если вопросы вдохновляли меня, когда я рос, чтобы изучать науку. С помощью ИИ у нас есть уникальная возможность создать этих воплощённых агентов, которые позволят нам задавать такие вопросы, на которые обычно было бы невозможно ответить», — говорит Тивари.

Чтобы построить эту эволюционную песочницу, исследователи взяли все элементы камеры, такие как датчики, линзы, диафрагмы и процессоры, и преобразовали их в параметры, которые агент искусственного интеллекта мог бы изучить.

Они использовали эти строительные блоки в качестве отправной точки для алгоритмического механизма обучения, который агент будет использовать по мере эволюции глаз с течением времени.

«Мы не могли смоделировать всю вселенную атом за атомом. Было сложно определить, какие ингредиенты нам нужны, какие ингредиенты нам не нужны и как распределять ресурсы между этими элементами», — говорит Ченг.

В их структуре этот эволюционный алгоритм может выбирать, какие элементы развивать, основываясь на ограничениях окружающей среды и задаче агента.

Каждый агент начинает с одного фоторецептора, который смотрит на мир, и связанной с ним модели нейронной сети, которая обрабатывает визуальную информацию. Затем, в течение жизни агента, он обучается с помощью обучения с подкреплением, методом проб и ошибок, когда агент вознаграждается за выполнение задачи.

«Эти ограничения определяют процесс проектирования, так же как физика света определяет физику, которая повлияла на проектирование наших собственных глаз», — говорит Тивари.

Тестирование гипотез

Когда исследователи проводили эксперименты в этой структуре, они обнаружили, что задачи оказывали значительное влияние на системы зрения, которые развивали агенты.

Например, агенты, ориентированные на задачи навигации, развивали глаза, предназначенные для максимизации пространственного восприятия за счёт низкоразрешающего зондирования, в то время как агенты, которым было поручено обнаружение объектов, развивали глаза, ориентированные на фронтальную остроту зрения, а не на периферийное зрение.

Другой эксперимент показал, что больший мозг не всегда лучше, когда дело доходит до обработки визуальной информации. Только определённое количество визуальной информации может поступать в систему за раз, исходя из физических ограничений, таких как количество фоторецепторов в глазах.

«В какой-то момент больший мозг агенту совсем не помогает, и в природе это было бы пустой тратой ресурсов», — говорит Ченг.

В будущем исследователи хотят использовать этот симулятор для изучения лучших систем зрения для конкретных приложений, которые могли бы помочь учёным разработать датчики и камеры для конкретных задач. Они также хотят интегрировать LLM в свою структуру, чтобы упростить пользователям возможность задавать вопросы «что, если» и изучать дополнительные возможности.

«Есть реальная выгода от того, чтобы задавать вопросы более творчески. Я надеюсь, что это вдохновит других на создание более крупных структур, где вместо того, чтобы сосредотачиваться на узких вопросах, охватывающих конкретную область, они будут искать ответы на вопросы с гораздо более широким охватом», — говорит Ченг.

Компьютерное проектирование (CAD) — это проверенные временем инструменты, используемые для проектирования многих физических объектов, которые мы используем каждый день. Но программное обеспечение CAD требует глубоких знаний, а многие инструменты включают такой высокий уровень детализации, что они не подходят для мозгового штурма или быстрого прототипирования.

В попытке ускорить проектирование и сделать его более доступным для неспециалистов исследователи из MIT и других организаций разработали систему роботизированной сборки, управляемую ИИ, которая позволяет людям создавать физические объекты, просто описывая их словами.

Их система использует генеративную модель искусственного интеллекта для создания трёхмерного представления геометрии объекта на основе подсказки пользователя. Затем вторая генеративная модель искусственного интеллекта рассуждает об объекте и выясняет, где должны располагаться различные компоненты в соответствии с функцией и геометрией объекта.

Система может автоматически собирать объект из набора предварительно изготовленных деталей с помощью роботизированной сборки. Она также может вносить изменения в дизайн на основе обратной связи от пользователя.

Исследователи использовали эту систему для изготовления мебели, включая стулья и полки, из двух типов предварительно изготовленных компонентов. Компоненты можно разбирать и собирать заново по желанию, что сокращает количество отходов, образующихся в процессе изготовления.

«Мы хотим, чтобы в будущем мы могли общаться и разговаривать с роботами и системами искусственного интеллекта так же, как мы общаемся друг с другом, чтобы делать вещи вместе. Наша система — это первый шаг к реализации этого будущего», — говорит ведущий автор Алекс Кьяу, аспирант MIT в департаментах электротехники и информатики (EECS) и архитектуры.

Генерация многокомпонентного дизайна

Генеративные модели искусственного интеллекта хорошо справляются с созданием трёхмерных представлений по текстовым подсказкам, но большинство из них не создают однородные представления геометрии объекта, необходимые для роботизированной сборки.

Чтобы решить эти проблемы, исследователи использовали модель зрения и языка (VLM), мощную генеративную модель искусственного интеллекта, которая была предварительно обучена понимать изображения и текст. Они поручили VLM выяснить, как два типа предварительно изготовленных деталей, структурные компоненты и панельные компоненты, должны соединяться вместе, чтобы сформировать объект.

«Есть много способов, которыми мы можем разместить панели на физическом объекте, но роботу нужно увидеть геометрию и разобраться в ней, чтобы принять решение. Благодаря тому, что VLM выступает как глаза и мозг робота, робот может это сделать», — говорит Кьяу.

Пользователь даёт системе текстовую подсказку, например, «сделай мне стул», и получает изображение стула, чтобы начать. Затем VLM рассуждает об этом стуле и определяет, где панельные компоненты должны располагаться поверх структурных компонентов, основываясь на функции множества примеров объектов, которые он видел раньше.

«Мы узнали, что VLM способна понимать некоторые аспекты функциональности стула, такие как возможность опираться и сидеть на стуле, чтобы понять, почему она размещает панели на спинке и сиденье», — говорит Кьяу.

Человеко-ориентированное проектирование

Пользователь остаётся в этом процессе и может уточнить дизайн, дав модели новую подсказку, например, «использовать панели только на спинке, а не на сиденье».

«Пространство проектирования очень велико, поэтому мы сужаем его с помощью обратной связи пользователей. Мы считаем, что это лучший способ сделать это, потому что у людей разные предпочтения, и создание идеализированной модели для всех было бы невозможно», — говорит Кьяу.

«Процесс с участием человека позволяет пользователям управлять дизайном, созданным ИИ, и иметь чувство причастности к конечному результату», — добавляет Гупта.

После того как трёхмерная сетка будет завершена, роботизированная система сборки собирает объект, используя предварительно изготовленные детали. Эти детали можно разбирать и собирать заново в различных конфигурациях.

Исследователи сравнили результаты своего метода с алгоритмом, который размещает панели на всех горизонтальных поверхностях, обращённых вверх, и алгоритмом, который размещает панели случайным образом. В ходе пользовательского исследования более 90 процентов людей предпочли дизайны, созданные их системой.

Они также попросили VLM объяснить, почему он решил разместить панели в этих областях.

«Мы узнали, что языковая модель способна понимать некоторые аспекты функциональности стула, например, возможность опираться и сидеть на нём, чтобы понять, почему она размещает панели на спинке и сиденье. Она не просто случайным образом выдаёт эти назначения», — говорит Кьяу.

В будущем исследователи хотят усовершенствовать свою систему, чтобы она могла обрабатывать более сложные и тонкие подсказки пользователей, такие как стол из стекла и металла. Кроме того, они хотят включить дополнительные предварительно изготовленные компоненты, такие как шестерни, шарниры или другие движущиеся части, чтобы объекты могли иметь больше функций.

«Наша цель — радикально снизить барьер доступа к инструментам проектирования. Мы показали, что можем использовать генеративный ИИ и робототехнику, чтобы превращать идеи в физические объекты быстро, доступно и устойчиво», — говорит Дэвис.

Сегодня из примерно 1 триллиона видов на Земле 99,999 процентов считаются микробами — бактериями, археями, вирусами и одноклеточными эукариотами. Исследователи изучили микробы в экстремальных средах обитания и обнаружили, что они могут жить и процветать в самых экстремальных условиях.

Юнха Хван, новый сотрудник MIT, исследует новую биологию, раскрываемую наиболее разнообразными и многочисленными формами жизни на Земле. Она изучает микробы в экстремальных средах обитания и разрабатывает вычислительные системы, чтобы исследовать организм как можно больше «in silico», используя только данные о последовательностях.

«Геном состоит из миллионов букв. Человек не может всё это понять. Мы можем запрограммировать машину, чтобы сегментировать данные на полезные части. Это похоже на то, как работает биоинформатика с одним геномом. Но если вы посмотрите на грамм почвы, который может содержать тысячи уникальных геномов, это слишком много данных, чтобы с ними мог справиться человек и компьютер вместе взятые», — говорит Хван.

Её исследование может быть применено для использования функционального потенциала микробов. Микробы — возможно, лучшие химики в мире. Использование их метаболизма и биохимии приведёт к более устойчивым и эффективным методам производства новых материалов, новых терапевтических средств и новых типов полимеров.

«Понимание того, как микробы работают, и понимание их геномного состава и функциональных возможностей, будет иметь решающее значение для понимания того, как наш мир и климат меняются», — говорит Хван.

Что, если бы существовал способ преодолеть одно из самых серьёзных препятствий на пути использования ядерной энергии — утилизация высокоуровневых ядерных отходов (HLW)?

Даурен Сарсенбаев, аспирант третьего курса MIT Department of Nuclear Science and Engineering (NSE), решает эту задачу в рамках своего исследования.

Сарсенбаев фокусируется на одной из основных проблем, связанных с HLW: выделении тепла, выделяемого радиоактивными отходами. Основная предпосылка его решения заключается в том, чтобы отводить тепло от отработавшего топлива, что одновременно решает две задачи: получение дополнительной энергии из существующего безуглеродного ресурса и снижение проблем, связанных с хранением и обращением с HLW.

«Значение безуглеродной энергии продолжает расти с каждым годом, и мы хотим извлечь из неё как можно больше», — объясняет Сарсенбаев.

Сарсенбаев изучал ядерные отходы в рамках стажировки в Lawrence Berkeley National Laboratory, будучи младшим студентом бакалавриата.

«Я был действительно очарован тем, как далеко в будущее можно заглянуть. Это как бы предвидение того, с чем столкнутся будущие поколения», — говорит Сарсенбаев.

Реальные механизмы переноса включают множество физических и химических процессов, сложность которых значительно увеличивает размер вычислительной модели.

Чтобы ускорить получение результатов за счёт экономии вычислительного времени, Сарсенбаев разрабатывает систему, которая объединяет ИИ-алгоритмы, которые обучаются на смоделированных данных и аппроксимируют физические системы.

Программа для военных лидеров

Новая программа, предлагаемая совместно департаментами MIT Mechanical Engineering (Course 2, MechE) и Electrical Engineering and Computer Science (Course 6, EECS), предоставит широкие возможности для технических исследований для военно-морских офицеров, а также путь для офицеров, не являющихся военно-морскими, обучающихся в MIT, для развития их понимания прикладного ИИ для военно-морских и военных приложений.

«Потенциал искусственного интеллекта только начинает полностью реализовываться. Это инструмент, который значительно улучшает скорость, эффективность и принятие решений с бесчисленными приложениями», — говорит коммандер Кристофер МакЛин, адъюнкт-профессор MIT в области машиностроения, военно-морского строительства и инженерии.

Программа под названием «2N6: Прикладная программа искусственного интеллекта для военно-морских офицеров» включает в себя двухлетнюю степень магистра наук в области машиностроения с сопутствующим сертификатом ИИ, присуждаемым Колледжем вычислений MIT Schwarzman.

«Офицеры, поступающие в эту программу, будут учиться у мировых экспертов, проводить передовые

1. Какие основные принципы научной коммуникации необходимо учитывать при переводе технических текстов?

Ответ: при переводе технических текстов необходимо учитывать принципы научной коммуникации, такие как точность терминологии, работа с данными (числовые значения, статистика, химические формулы), стилистическая адаптация (языковые уровни, приёмы популяризации, ритм текста) и отраслевые особенности (физика/астрономия, биология/медицина, технологии).

2. Какие методы и подходы используются для улучшения визуального отображения текста при переводе?

Ответ: для улучшения визуального отображения текста при переводе используются методы и подходы, такие как использование разметки Markdown, заголовков первого, второго и третьего уровня, выделение текста полужирным или курсивом, использование нумерованных и маркированных списков, а также добавление небольшого количества эмодзи для выделения важности и эмоции.

3. Какие этапы проверки качества перевода необходимо пройти, чтобы обеспечить его высокое качество?

Ответ: этапы проверки качества перевода включают научную точность (сверка с источниками), стилистическую выверенность, соответствие SEO-требованиям и проверку читаемости (Flesch–Kincaid ≥60).

4. Какие новые методы и подходы в области искусственного интеллекта описаны в статье?

Ответ: в статье описаны новые методы и подходы в области искусственного интеллекта, такие как разработка «научной песочницы» для изучения эволюции систем зрения, создание метода кодирования, известного как «PaTH Attention», который делает позиционную информацию адаптивной и контекстно-зависимой, а также разработка системы роботизированной сборки, управляемой ИИ, которая позволяет людям создавать физические объекты, просто описывая их словами.

5. Какие проблемы и задачи стоят перед исследователями в области искусственного интеллекта, согласно статье?

Ответ: согласно статье, перед исследователями в области искусственного интеллекта стоят проблемы и задачи, такие как разработка новых методов и подходов для улучшения работы больших языковых моделей, изучение эволюции систем зрения с помощью агентов искусственного интеллекта, создание систем роботизированной сборки для ускорения проектирования и разработки новых методов утилизации высокоуровневых ядерных отходов.

Источник