>_
Москва, Научный проезд, 14А, стр.1, БЦ Smart Park

Сервер для ИИ

Искусственный интеллект (ИИ) — это имитация человеческого интеллекта в машинах, запрограммированных на мышление, обучение и выполнение задач, обычно требующих человеческого познания. Системы ИИ могут анализировать данные, распознавать закономерности, принимать решения и даже совершенствоваться со временем благодаря машинному обучению (МО) и глубокому обучению (ГО).

Типы ИИ

  • Узкий ИИ (слабый ИИ) — разработан для решения конкретных задач (например, Siri, ChatGPT, беспилотные автомобили).

  • Общий ИИ (сильный ИИ) — гипотетический ИИ с человеческим мышлением (еще не создан).

  • Сверхразумный ИИ — ИИ, превосходящий человеческий интеллект (пока в теории). 

Как можно использовать ИИ?

ИИ находит разнообразное применение в различных отраслях:

Повседневные приложения

  • Виртуальные помощники (Siri, Alexa, Google Assistant)

  • Рекомендательные системы (Netflix, Amazon, Spotify)

  • Устройства для умного дома (термостат Nest, Roomba)

Бизнес и промышленность

  • Автоматизированная поддержка клиентов (чат-боты, такие как ChatGPT)

  • Обнаружение мошенничества (банки используют ИИ для выявления необычных транзакций)

  • Оптимизация цепочки поставок (прогнозирование спроса, управление запасами)

Здравоохранение

  • Помощь в диагностике (ИИ анализирует рентгеновские снимки, МРТ)

  • Разработка новых лекарственных препаратов (ИИ ускоряет фармацевтические исследования)

  • Персонализированная медицина (адаптация лечения на основе данных пациентов)

Транспорт

  • Беспилотные автомобили (Tesla, Waymo)

  • Управление дорожным движением (ИИ оптимизирует работу светофоров в умных городах)

Образование

  • Персонализированное обучение (ИИ-репетиторы (адаптация к потребностям учащихся)

  • Автоматизированная оценка (проверка заданий ИИ и предоставление обратной связи)

Творческие направления

  • Искусство и музыка с использованием ИИ (DALL·E, MidJourney, песни, созданные ИИ)

  • Написание контента (ChatGPT, Grammarly для написания статей)

Будущее ИИ

ИИ стремительно развивается благодаря достижениям в робототехнике, обработке естественного языка (NLP) и квантовых вычислениях. Однако необходимо учитывать этические вопросы (вытеснение рабочих мест, предвзятость, конфиденциальность).

Оптимальная конфигурация сервера для рабочих нагрузок ИИ зависит от конкретного типа задач ИИ, которые вы выполняете (например: обучение больших моделей, вывод или тонкая настройка). Ниже приведены некоторые общие рекомендации, основанные на различных вариантах использования:

Сервер обучения ИИ 

(большие модели, например, модели LLM, модели диффузии)

Вариант использования: обучение моделей глубокого обучения с нуля (например, модели в стиле GPT, модели Stable Diffusion и т. д.).

Рекомендуемая конфигурация:

  • Процессор: AMD EPYC 9654 (96 ядер) / Intel Xeon Platinum 8490H (60 ядер)

  • Видеокарта: 8× NVIDIA H100 80 ГБ SXM5 (или A100 80 ГБ для бюджетного варианта)

  • Оперативная память: 1 ТБ+ DDR5 ECC

  • Накопитель: 10 ТБ+ NVMe SSD (для быстрой загрузки данных), 100 ТБ+ HDD (для хранения наборов данных)

  • Сетевое подключение: 400 Гбит/с InfiniBand (для связи между несколькими GPU)

  • Блок питания: 5000 Вт+ (резервные блоки питания)

  • Охлаждение: жидкостное (для конфигураций с высокой плотностью графических процессоров)

Примечания:

Для конфигураций с несколькими графическими процессорами требуется NVLink/Switch для высокоскоростных соединений.

Для распределенного обучения рекомендуется использовать несколько узлов с сетью RDMA.

Решения под данные требования поставляется под заказ со сроком поставки 8-10 недель.

Конфигурации можно собрать на основе баз:  

Huawei xFusion G8600 V7, Lenovo ThinkSystem SR780a V3, Lenovo ThinkSystem SR685a V3, Lenovo ThinkSystem SR680a V3.

Сервер вывода ИИ

(прогнозы в реальном времени)

Пример использования: Развертывание обученных моделей для вывода с низкой задержкой (например, чат-боты, распознавание изображений).

Рекомендуемая конфигурация:

  • Процессор: AMD EPYC 9374F (32 ядра) / Intel Xeon Gold 6430

  • Видеокарта: 2× NVIDIA L40S (48 ГБ) или A10G (24 ГБ)

  • Оперативная память: 256 ГБ DDR5

  • Накопитель: SSD-накопитель NVMe емкостью 2 ТБ

  • Сетевое подключение: Ethernet 10 Гбит/с (25 Гбит/с для большого трафика)

  • Блок питания: 1600 Вт

Примечания:

  • Для периферийных развертываний рассмотрите NVIDIA T4 или Jetson AGX Orin.

  • TensorRT или ONNX Runtime могут оптимизировать скорость вывода.

Из наличия мы можем предложить вариант в следующей конфигурации:

Конфигурация  Цена
Рабочая станция G47R 4U/Tower, MBD-H13SSL-N, EPYC 9374F (32/64, 3.85-4.1GHz, 256MB), 256GB (8x32GB) RDDR5 5600MHz, 2x 2TB SSD Kingston PCIe 5.0 x4, 3xNVIDIA Tesla L4 24Gb, 2000W CPRS(1+1) 1'492'064 руб.

Бюджетная рабочая станция для ИИ 

(исследования/создание прототипов)

Пример использования: обучение ИИ в небольших масштабах, тонкая настройка и эксперименты.

Рекомендуемая конфигурация:

  • Процессор: AMD Ryzen Threadripper 7970X (24 ядра) / Intel i9-14900K

  • Видеокарта: 1× NVIDIA RTX 4090 (24 ГБ) или б/у A6000 (48 ГБ)

  • Оперативная память: 128 ГБ DDR5

  • Накопитель: SSD-накопитель NVMe объёмом 2 ТБ

  • Охлаждение: воздушное/моноблочное жидкостное

Примечания:

  • Подходит для тонкой настройки LLM (например, LLaMA-7B) или небольших сверхточных нейронных сетей.

  • Потребительские графические процессоры Нет памяти ECC, но они экономичны.

Из наличия мы можем предложить вариант в следующей конфигурации:

Конфигурация Цена
Рабочая станция G47R 4U/Tower, ASUS PRIME Z790-P, Intel Core i9-14900K (3.2GHz/36MB/24 cores), 128GB (4x32GB) DDR5 6400MHz XMP, SSD Kingston PCIe 5.0 x4 2TB, GeForce RTX 4090 24Gb, 2000W CPRS(1+1) 763'424 руб.