Искусственный интеллект (ИИ) — это имитация человеческого интеллекта в машинах, запрограммированных на мышление, обучение и выполнение задач, обычно требующих человеческого познания. Системы ИИ могут анализировать данные, распознавать закономерности, принимать решения и даже совершенствоваться со временем благодаря машинному обучению (МО) и глубокому обучению (ГО).
Узкий ИИ (слабый ИИ) — разработан для решения конкретных задач (например, Siri, ChatGPT, беспилотные автомобили).
Общий ИИ (сильный ИИ) — гипотетический ИИ с человеческим мышлением (еще не создан).
Сверхразумный ИИ — ИИ, превосходящий человеческий интеллект (пока в теории).
ИИ находит разнообразное применение в различных отраслях:
Виртуальные помощники (Siri, Alexa, Google Assistant)
Рекомендательные системы (Netflix, Amazon, Spotify)
Устройства для умного дома (термостат Nest, Roomba)
Автоматизированная поддержка клиентов (чат-боты, такие как ChatGPT)
Обнаружение мошенничества (банки используют ИИ для выявления необычных транзакций)
Оптимизация цепочки поставок (прогнозирование спроса, управление запасами)
Помощь в диагностике (ИИ анализирует рентгеновские снимки, МРТ)
Разработка новых лекарственных препаратов (ИИ ускоряет фармацевтические исследования)
Персонализированная медицина (адаптация лечения на основе данных пациентов)
Беспилотные автомобили (Tesla, Waymo)
Управление дорожным движением (ИИ оптимизирует работу светофоров в умных городах)
Персонализированное обучение (ИИ-репетиторы (адаптация к потребностям учащихся)
Автоматизированная оценка (проверка заданий ИИ и предоставление обратной связи)
Искусство и музыка с использованием ИИ (DALL·E, MidJourney, песни, созданные ИИ)
Написание контента (ChatGPT, Grammarly для написания статей)
ИИ стремительно развивается благодаря достижениям в робототехнике, обработке естественного языка (NLP) и квантовых вычислениях. Однако необходимо учитывать этические вопросы (вытеснение рабочих мест, предвзятость, конфиденциальность).
Оптимальная конфигурация сервера для рабочих нагрузок ИИ зависит от конкретного типа задач ИИ, которые вы выполняете (например: обучение больших моделей, вывод или тонкая настройка). Ниже приведены некоторые общие рекомендации, основанные на различных вариантах использования:
(большие модели, например, модели LLM, модели диффузии)
Вариант использования: обучение моделей глубокого обучения с нуля (например, модели в стиле GPT, модели Stable Diffusion и т. д.).
Процессор: AMD EPYC 9654 (96 ядер) / Intel Xeon Platinum 8490H (60 ядер)
Видеокарта: 8× NVIDIA H100 80 ГБ SXM5 (или A100 80 ГБ для бюджетного варианта)
Оперативная память: 1 ТБ+ DDR5 ECC
Накопитель: 10 ТБ+ NVMe SSD (для быстрой загрузки данных), 100 ТБ+ HDD (для хранения наборов данных)
Сетевое подключение: 400 Гбит/с InfiniBand (для связи между несколькими GPU)
Блок питания: 5000 Вт+ (резервные блоки питания)
Охлаждение: жидкостное (для конфигураций с высокой плотностью графических процессоров)
Примечания:
Для конфигураций с несколькими графическими процессорами требуется NVLink/Switch для высокоскоростных соединений.
Для распределенного обучения рекомендуется использовать несколько узлов с сетью RDMA.
Решения под данные требования поставляется под заказ со сроком поставки 8-10 недель.
Конфигурации можно собрать на основе баз:
Huawei xFusion G8600 V7, Lenovo ThinkSystem SR780a V3, Lenovo ThinkSystem SR685a V3, Lenovo ThinkSystem SR680a V3.
(прогнозы в реальном времени)
Пример использования: Развертывание обученных моделей для вывода с низкой задержкой (например, чат-боты, распознавание изображений).
Процессор: AMD EPYC 9374F (32 ядра) / Intel Xeon Gold 6430
Видеокарта: 2× NVIDIA L40S (48 ГБ) или A10G (24 ГБ)
Оперативная память: 256 ГБ DDR5
Накопитель: SSD-накопитель NVMe емкостью 2 ТБ
Сетевое подключение: Ethernet 10 Гбит/с (25 Гбит/с для большого трафика)
Блок питания: 1600 Вт
Примечания:
Для периферийных развертываний рассмотрите NVIDIA T4 или Jetson AGX Orin.
TensorRT или ONNX Runtime могут оптимизировать скорость вывода.
Из наличия мы можем предложить вариант в следующей конфигурации:
| Конфигурация | Цена |
|---|---|
| Рабочая станция G47R 4U/Tower, MBD-H13SSL-N, EPYC 9374F (32/64, 3.85-4.1GHz, 256MB), 256GB (8x32GB) RDDR5 5600MHz, 2x 2TB SSD Kingston PCIe 5.0 x4, 3xNVIDIA Tesla L4 24Gb, 2000W CPRS(1+1) | 1'492'064 руб. |
(исследования/создание прототипов)
Пример использования: обучение ИИ в небольших масштабах, тонкая настройка и эксперименты.
Процессор: AMD Ryzen Threadripper 7970X (24 ядра) / Intel i9-14900K
Видеокарта: 1× NVIDIA RTX 4090 (24 ГБ) или б/у A6000 (48 ГБ)
Оперативная память: 128 ГБ DDR5
Накопитель: SSD-накопитель NVMe объёмом 2 ТБ
Охлаждение: воздушное/моноблочное жидкостное
Примечания:
Подходит для тонкой настройки LLM (например, LLaMA-7B) или небольших сверхточных нейронных сетей.
Потребительские графические процессоры Нет памяти ECC, но они экономичны.
Из наличия мы можем предложить вариант в следующей конфигурации:
| Конфигурация | Цена |
|---|---|
| Рабочая станция G47R 4U/Tower, ASUS PRIME Z790-P, Intel Core i9-14900K (3.2GHz/36MB/24 cores), 128GB (4x32GB) DDR5 6400MHz XMP, SSD Kingston PCIe 5.0 x4 2TB, GeForce RTX 4090 24Gb, 2000W CPRS(1+1) | 763'424 руб. |