>_
Москва, Научный проезд, 14А, стр.1, БЦ Smart Park

Сервер для машинного обучения

Что такое машинное обучение (МО) — это подвид искусственного интеллекта (ИИ), позволяющий компьютерам обучаться на основе данных и повышать свою производительность при выполнении конкретной задачи без явного программирования. Вместо следования жёстким инструкциям алгоритмы МО выявляют закономерности в данных, делают прогнозы или выполняют действия на основе опыта.

Ключевые понятия машинного обучения

Обучение на основе данных

Модели МО анализируют большие наборы данных для поиска закономерностей (например, распознавание лиц, прогнозирование цен акций).

Чем больше качественных данных они обрабатывают, тем лучше они работают.

Хорошая модель МО должна хорошо работать на новых, ранее не исследованных данных, а не только на обучающих данных.

Типы машинного обучения

  • Обучение с учителем: обучение на размеченных данных (парах вход-выход). Пример: прогнозирование цен на жилье на основе данных о прошлых продажах (регрессия) или классификация электронных писем как спам/не спам (классификация).

  • Обучение без учителя: поиск скрытых закономерностей в немаркированных данных. Пример: сегментация клиентов в маркетинге (кластеризация), обнаружение аномалий.

  • Обучение с подкреплением (RL): обучение методом проб и ошибок с использованием поощрений/наказаний. Пример: ИИ играет в шахматы или беспилотные автомобили принимают решения.

Распространённые алгоритмы

Линейная регрессия, деревья решений, случайный лес, SVM (машины опорных векторов).

Нейронные сети (глубокое обучение) для сложных задач, таких как распознавание изображений/речи.

Применение машинного обучения

  • Здравоохранение: прогнозирование заболеваний, разработка лекарств.

  • Финансы: выявление мошенничества, анализ фондового рынка.

  • Электронная коммерция: рекомендательные системы (Amazon, Netflix).

  • Автономные автомобили: беспилотные автомобили Tesla.

  • Обработка естественного языка (NLP): ChatGPT, инструменты перевода.

Как работает машинное обучение

1. Сбор данных → 2. Предварительная обработка данных → 3. Обучение модели → 4. Оценка → 5. Развертывание

Разница между ИИ, МО и глубоким обучением:

  • ИИ (широкая область применения, позволяющая сделать машины умными)

  • МО (машины обучаются на основе данных)

  • Глубокое обучение (использует нейронные сети для решения сложных задач)

Конфигурации для машинного обучения

Можно выделить несколько конфигурации для машинного обучения:

Рабочая станция машинного обучения начального уровня 

(для обучения/экспериментов в небольших масштабах)

Пример использования: Прототипирование, небольшие наборы данных (например, MNIST, CIFAR-10) и лёгкие модели (например, scikit-learn, небольшие нейронные сети).

  • Процессор: Intel Core i9 или Ultra 9/ AMD Ryzen 9 (12+ ядер)

  • Видеокарта: NVIDIA RTX 4090 (24 ГБ видеопамяти) или RTX 3090 (24 ГБ видеопамяти)

  • ОЗУ: от 64 ГБ DDR5

  • Накопитель: 1 ТБ NVMe SSD (Gen4) + 2 ТБ HDD (для наборов данных)

  • ОС: Ubuntu Linux (для лучшей поддержки графических процессоров)

Из наличия мы сможем предложить вариант в следующей конфигурации:
 Конфигурация  Цена
Рабочая станция G47R 4U/Tower, ASUS TUF GAMING B850-E, Ryzen 9 9950X (16/32, 4.3-5.7GHz, 1MB/16MB/64MB), 64GB (2x32GB) DDR5 6400MHz XMP, SSD Kingston PCIe 5.0 x4 1TB, Toshiba SATA3 2Tb Enterprise, GeForce RTX 4090 24Gb, 2000W CPRS(1+1) 711'788 руб.   

Сервер машинного обучения среднего уровня 

(обучение среднего масштаба)

Пример использования: обучение моделей среднего размера (например, ResNet50, BERT-base) на более крупных наборах данных.

  • Процессор: AMD EPYC 7B13 (32 ядра) / Intel Xeon Silver 4310

  • Видеокарта: 2× NVIDIA RTX 6000 Ada (48 ГБ видеопамяти) или 2× A5000 (24 ГБ видеопамяти)

  • ОЗУ: 128–256 ГБ DDR4 ECC

  • Хранилище: 2 ТБ NVMe SSD (Gen4) + 8 ТБ HDD (или NAS для наборов данных)

  • Сеть: Ethernet 10 Гбит/с

  • ОС: Ubuntu Server LTS

Из наличия мы сможем предложить вариант в следующей конфигурации:
 Конфигурация  Цена
 Рабочая станция G47R 4U/Tower, Supermicro X12DAI-N6, Intel Silver 4310 (12/24, 2.3-3.3GHz, 18MB), 256GB (8x32GB) DDR4 3200MHz, 2x1920GB PM9A3 M/2, Toshiba SATA3 8Tb Enterprise, 2xNvidia RTX 5000 Ada 32Gb, 2000W CPRS(1+1)     1'613'673 руб.

Высокопроизводительный сервер машинного обучения

(крупномасштабное обучение)

Пример использования: обучение больших моделей (например, LLM, GPT-3, Vision Transformers) или распределенное обучение.

  • Процессор: два процессора AMD EPYC 9654 (по 96 ядер каждый) / Intel Xeon Platinum 8490H

  • Видеокарта: 4–8 видеокарт NVIDIA H100 80 ГБ SXM5 (для ускорения FP8/FP16) или A100 80 ГБ

  • ОЗУ: 512 ГБ–1 ТБ DDR5 ECC

  • Накопитель: 4 ТБ NVMe SSD RAID + 20 ТБ NAS (или Lustre для распределенного хранения)

  • Сетевые технологии: NVLink/NVSwitch (для взаимодействия с видеокартами) + InfiniBand 100 Гбит/с

  • ОС: Ubuntu Server или Rocky Linux.

Решения под данные требования поставляется под заказ со сроком поставки 8-10 недель.

Конфигурации можно собрать на основе баз Huawei xFusion G8600 V7, Lenovo ThinkSystem SR780a V3, Lenovo ThinkSystem SR685a V3, Lenovo ThinkSystem SR680a V3.

Сервер, оптимизированный для вывода 

(развёртывание в рабочей среде)

Пример использования: Обслуживание моделей с низкой задержкой и высокой пропускной способностью (например, развёртывание моделей LLM или CV).

  • Процессор: AMD EPYC 9374F (32 ядра) / Intel Xeon Gold 6430

  • Видеокарта: 2–4× NVIDIA L4 (24 ГБ видеопамяти) или T4 (16 ГБ видеопамяти)

  • ОЗУ:  от 256 ГБ DDR5

  • Хранилище: 1 ТБ NVMe SSD + 4 ТБ HDD

  • Сеть: Ethernet 25 Гбит/с

  • Программное обеспечение: TensorRT, ONNX Runtime, сервер вывода Triton.

    Из наличия мы сможем предложить вариант в следующей конфигурации:

 Конфигурация  Цена
Рабочая станция G47R 4U/Tower, MBD-H13SSL-N, EPYC 9374F (32/64, 3.85-4.1GHz, 256MB), 256GB (8x32GB) RDDR5 5600MHz, SSD Kingston PCIe 5.0 x4 1TB, Toshiba SATA3 4Tb Enterprise,  3xNVIDIA Tesla L4 24Gb, 2000W CPRS(1+1) 1'486'400 руб.