Что такое машинное обучение (МО) — это подвид искусственного интеллекта (ИИ), позволяющий компьютерам обучаться на основе данных и повышать свою производительность при выполнении конкретной задачи без явного программирования. Вместо следования жёстким инструкциям алгоритмы МО выявляют закономерности в данных, делают прогнозы или выполняют действия на основе опыта.
Модели МО анализируют большие наборы данных для поиска закономерностей (например, распознавание лиц, прогнозирование цен акций).
Чем больше качественных данных они обрабатывают, тем лучше они работают.
Хорошая модель МО должна хорошо работать на новых, ранее не исследованных данных, а не только на обучающих данных.
Обучение с учителем: обучение на размеченных данных (парах вход-выход). Пример: прогнозирование цен на жилье на основе данных о прошлых продажах (регрессия) или классификация электронных писем как спам/не спам (классификация).
Обучение без учителя: поиск скрытых закономерностей в немаркированных данных. Пример: сегментация клиентов в маркетинге (кластеризация), обнаружение аномалий.
Обучение с подкреплением (RL): обучение методом проб и ошибок с использованием поощрений/наказаний. Пример: ИИ играет в шахматы или беспилотные автомобили принимают решения.
Линейная регрессия, деревья решений, случайный лес, SVM (машины опорных векторов).
Нейронные сети (глубокое обучение) для сложных задач, таких как распознавание изображений/речи.
Здравоохранение: прогнозирование заболеваний, разработка лекарств.
Финансы: выявление мошенничества, анализ фондового рынка.
Электронная коммерция: рекомендательные системы (Amazon, Netflix).
Автономные автомобили: беспилотные автомобили Tesla.
Обработка естественного языка (NLP): ChatGPT, инструменты перевода.
1. Сбор данных → 2. Предварительная обработка данных → 3. Обучение модели → 4. Оценка → 5. Развертывание
ИИ (широкая область применения, позволяющая сделать машины умными)
МО (машины обучаются на основе данных)
Глубокое обучение (использует нейронные сети для решения сложных задач)
Можно выделить несколько конфигурации для машинного обучения:
(для обучения/экспериментов в небольших масштабах)
Пример использования: Прототипирование, небольшие наборы данных (например, MNIST, CIFAR-10) и лёгкие модели (например, scikit-learn, небольшие нейронные сети).
Процессор: Intel Core i9 или Ultra 9/ AMD Ryzen 9 (12+ ядер)
Видеокарта: NVIDIA RTX 4090 (24 ГБ видеопамяти) или RTX 3090 (24 ГБ видеопамяти)
ОЗУ: от 64 ГБ DDR5
Накопитель: 1 ТБ NVMe SSD (Gen4) + 2 ТБ HDD (для наборов данных)
ОС: Ubuntu Linux (для лучшей поддержки графических процессоров)
Из наличия мы сможем предложить вариант в следующей конфигурации:
| Конфигурация | Цена |
|---|---|
| Рабочая станция G47R 4U/Tower, ASUS TUF GAMING B850-E, Ryzen 9 9950X (16/32, 4.3-5.7GHz, 1MB/16MB/64MB), 64GB (2x32GB) DDR5 6400MHz XMP, SSD Kingston PCIe 5.0 x4 1TB, Toshiba SATA3 2Tb Enterprise, GeForce RTX 4090 24Gb, 2000W CPRS(1+1) | 711'788 руб. |
(обучение среднего масштаба)
Пример использования: обучение моделей среднего размера (например, ResNet50, BERT-base) на более крупных наборах данных.
Процессор: AMD EPYC 7B13 (32 ядра) / Intel Xeon Silver 4310
Видеокарта: 2× NVIDIA RTX 6000 Ada (48 ГБ видеопамяти) или 2× A5000 (24 ГБ видеопамяти)
ОЗУ: 128–256 ГБ DDR4 ECC
Хранилище: 2 ТБ NVMe SSD (Gen4) + 8 ТБ HDD (или NAS для наборов данных)
Сеть: Ethernet 10 Гбит/с
ОС: Ubuntu Server LTS
Из наличия мы сможем предложить вариант в следующей конфигурации:
| Конфигурация | Цена |
|---|---|
| Рабочая станция G47R 4U/Tower, Supermicro X12DAI-N6, Intel Silver 4310 (12/24, 2.3-3.3GHz, 18MB), 256GB (8x32GB) DDR4 3200MHz, 2x1920GB PM9A3 M/2, Toshiba SATA3 8Tb Enterprise, 2xNvidia RTX 5000 Ada 32Gb, 2000W CPRS(1+1) | 1'613'673 руб. |
(крупномасштабное обучение)
Пример использования: обучение больших моделей (например, LLM, GPT-3, Vision Transformers) или распределенное обучение.
Процессор: два процессора AMD EPYC 9654 (по 96 ядер каждый) / Intel Xeon Platinum 8490H
Видеокарта: 4–8 видеокарт NVIDIA H100 80 ГБ SXM5 (для ускорения FP8/FP16) или A100 80 ГБ
ОЗУ: 512 ГБ–1 ТБ DDR5 ECC
Накопитель: 4 ТБ NVMe SSD RAID + 20 ТБ NAS (или Lustre для распределенного хранения)
Сетевые технологии: NVLink/NVSwitch (для взаимодействия с видеокартами) + InfiniBand 100 Гбит/с
ОС: Ubuntu Server или Rocky Linux.
Решения под данные требования поставляется под заказ со сроком поставки 8-10 недель.
Конфигурации можно собрать на основе баз Huawei xFusion G8600 V7, Lenovo ThinkSystem SR780a V3, Lenovo ThinkSystem SR685a V3, Lenovo ThinkSystem SR680a V3.
(развёртывание в рабочей среде)
Пример использования: Обслуживание моделей с низкой задержкой и высокой пропускной способностью (например, развёртывание моделей LLM или CV).
Процессор: AMD EPYC 9374F (32 ядра) / Intel Xeon Gold 6430
Видеокарта: 2–4× NVIDIA L4 (24 ГБ видеопамяти) или T4 (16 ГБ видеопамяти)
ОЗУ: от 256 ГБ DDR5
Хранилище: 1 ТБ NVMe SSD + 4 ТБ HDD
Сеть: Ethernet 25 Гбит/с
Программное обеспечение: TensorRT, ONNX Runtime, сервер вывода Triton.
Из наличия мы сможем предложить вариант в следующей конфигурации:
| Конфигурация | Цена |
|---|---|
| Рабочая станция G47R 4U/Tower, MBD-H13SSL-N, EPYC 9374F (32/64, 3.85-4.1GHz, 256MB), 256GB (8x32GB) RDDR5 5600MHz, SSD Kingston PCIe 5.0 x4 1TB, Toshiba SATA3 4Tb Enterprise, 3xNVIDIA Tesla L4 24Gb, 2000W CPRS(1+1) | 1'486'400 руб. |