Развитие систем искусственного интеллекта требует всё более мощной вычислительной инфраструктуры. Современные модели ИИ обучаются на огромных массивах данных и используют тысячи ускорителей, объединённых в крупные вычислительные кластеры. Одной из ключевых проблем таких систем становится скорость и эффективность обмена данными между процессорами, графическими ускорителями и сетевыми устройствами.
Именно поэтому ряд крупнейших технологических компаний, включая Microsoft, Meta Platforms, OpenAI, AMD, Nvidia и Broadcom, объявили о совместной инициативе по созданию новой технологии оптического соединения для масштабируемых ИИ-кластеров. Проект направлен на разработку универсальной инфраструктуры передачи данных, которая позволит ускорить работу вычислительных систем следующего поколения.
Совместная инициатива и её цели
Компании договорились о сотрудничестве в рамках соглашения типа Multi-Source Agreement (MSA). Подобные соглашения широко применяются в телекоммуникационной отрасли и служат для разработки совместимых стандартов оборудования, которые могут использоваться различными производителями.
В рамках новой инициативы разрабатывается технология под названием Optical Compute Interconnect (OCI). Её основная задача — создать открытую спецификацию для оптической передачи данных внутри вычислительных систем искусственного интеллекта.
Такая технология должна обеспечить высокоскоростное соединение между ускорителями и сетевыми устройствами внутри серверных стоек и крупных вычислительных кластеров. Использование оптических каналов связи позволит значительно увеличить пропускную способность системы и одновременно снизить энергопотребление.
Почему оптика становится необходимой
Традиционно соединение между вычислительными компонентами осуществляется с помощью медных кабелей. Однако при увеличении количества ускорителей и росте скорости передачи данных такие соединения начинают ограничивать производительность.
Оптические линии связи обладают рядом преимуществ:
- значительно более высокая пропускная способность;
- меньшие потери сигнала на расстоянии;
- более стабильное энергопотребление;
- возможность масштабирования систем до тысяч ускорителей.
Новая архитектура OCI предполагает создание общего физического уровня передачи данных (PHY), который сможет поддерживать разные протоколы взаимодействия ускорителей. Например, речь идёт о технологиях NVLink от Nvidia и UALink, поддерживаемой AMD и Broadcom.
Благодаря этому различные вычислительные платформы смогут использовать одну и ту же оптическую инфраструктуру.
Технические особенности будущего стандарта
Предлагаемая технология ориентирована на использование оптических каналов короткого расстояния, которые применяются внутри серверных стоек и крупных вычислительных систем.
Основой передачи данных станет сочетание нескольких технологий:
- сигнализация NRZ;
- мультиплексирование по длине волны (WDM);
- использование нескольких оптических каналов одновременно.
На первом этапе предполагается использование четырёх длин волн со скоростью передачи 50 Гбит/с каждая. Таким образом, суммарная пропускная способность одного оптического канала может достигать примерно 200 Гбит/с в каждом направлении.
В дальнейшем планируется увеличение количества длин волн и скорости передачи данных. По оценкам разработчиков, в будущем пропускная способность может достигнуть примерно 3,2 Тбит/с на одно оптоволокно.
Кроме того, новая инфраструктура будет поддерживать различные варианты интеграции оптики:
- подключаемые оптические модули;
- встроенную оптику;
- технологию Co-Packaged Optics, при которой оптические компоненты размещаются непосредственно рядом с вычислительными микросхемами.
Особенности подхода OCI
Создаваемая инициатива имеет несколько отличий от традиционных стандартов в области сетевых технологий.
Во-первых, проект активно поддерживается крупнейшими облачными провайдерами. Это отличает его от многих других отраслевых стандартов, которые обычно разрабатываются производителями оборудования.
Во-вторых, технология ориентирована на конкретную задачу — высокоскоростное соединение ускорителей внутри масштабируемых систем искусственного интеллекта. То есть речь идёт не о полном сетевом стандарте, а о специализированной инфраструктуре для ИИ-кластеров.
В-третьих, формат MSA позволяет значительно ускорить разработку и внедрение новых технологий. Участники соглашения могут быстрее согласовывать технические параметры и выпускать совместимые устройства без длительных процедур согласования, характерных для классических организаций по стандартизации.
Мнения представителей компаний
Представители компаний-участников отмечают, что развитие ИИ-систем требует новых подходов к организации вычислительных инфраструктур.
В компании AMD считают, что создание открытой спецификации оптических межсоединений позволит сформировать масштабируемую и устойчивую экосистему оборудования от разных производителей.
В свою очередь представители Broadcom подчеркивают, что новая технология сможет интегрироваться с существующими микросхемами и сетевыми контроллерами, а также обеспечит переход к более тесной интеграции оптических компонентов с вычислительными чипами.
В компании Nvidia также уверены, что внедрение нового оптического стандарта поможет создать инфраструктуру, необходимую для дальнейшего развития глобальных систем искусственного интеллекта.
Современные системы искусственного интеллекта требуют не только мощных вычислительных ускорителей, но и эффективных способов обмена данными между ними. Именно поэтому крупнейшие технологические компании объединяют усилия для разработки новых стандартов высокоскоростных соединений.
Инициатива по созданию технологии Optical Compute Interconnect может стать важным шагом в развитии инфраструктуры ИИ-кластеров. Использование оптических соединений позволит значительно увеличить пропускную способность систем, повысить их энергоэффективность и обеспечить масштабирование вычислительных платформ будущего.
Если проект будет успешно реализован, новая технология может стать основой для следующего поколения дата-центров и сверхмощных систем искусственного интеллекта.
0 Комментарий(я)
Зарегистрируйтесь чтобы оставить комментарий