NVIDIA Tesla M40/M4: GPU для нейронных сетей- Новости ИТ - Сервис
 
Главная страница


комплексные ИТ-решения

ВАШИ ИДЕИ
СТАНУТ РЕАЛЬНОСТЬЮ!

  
   


Самый полный
спектр ИТ-услуг
  Решения в области
Информационных технологий
 
 
 

 

 Главная  /  Новости  /  новости IT-рынка  /  NVIDIA Tesla M40/M4: GPU для нейронных сетей

Новости

NVIDIA Tesla M40/M4: GPU для нейронных сетей
11.11.2015, 08:52:10 
 
p>Специально для компаний, разрабатывающих продвинутые веб-сервисы с поддержкой машинного обучения, NVIDIA предложила новую платформу на основе двух монструозных ускорителей. Модель Tesla M40 названа самым мощным в мире ускорителем для глубинного обучения нейронных сетей. Tesla M4 представляет собой в несколько раз более слабую по сравнению с M40 видеокарту, основное предназначение которой — реализация разработанной и обученной с помощью M40 модели на конечных серверах с веб-сервисами.

AnandTech

AnandTech

Tesla M40, по утверждению разработчиков, позволяет сократить время обучения нейронных сетей на несколько дней или даже недель. Этот ускоритель оптимизирован для таких задач и в восемь раз быстрее обучает нейронные сети по сравнению с CPU (ему требуется всего 1,2 дня для обучения типичной сети AlexNet). Производительность легко масштабируется благодаря поддержке GPUDirect. Кроме того, Tesla M40 создан для работы в непрерывном режиме «24/7».

AnandTech

AnandTech

AnandTech

AnandTech

Что касается Tesla M4, то NVIDIA позиционирует этот ускоритель как оптимизированное решение для преобразования видео из одного формата в другой, обработки изображений и видео. Новинка отличается низкопрофильным дизайном и способна одновременно обрабатывать в 5 раз больше видеопотоков по сравнению с центральными процессорами.

AnandTech

AnandTech

AnandTech

AnandTech

Спецификации Tesla M40/M4:

  • Количество потоковых процессоров: 3072/1024;
  • Частота ядра: 1140/1075 МГц;
  • Эффективная частота GDDR5-памяти: 6/5,5 ГГц;
  • Разрядность шины памяти: 384/128 бит;
  • Количество VRAM: 12/4 Гбайт;
  • Пропускная способность памяти: 188/88 Гбайт/с;
  • Производительность в операциях одинарной точности: 7/2,2 Тфлопс;
  • Производительность в операциях двойной точности: 0,21/0,07 Тфлопс;
  • Количество транзисторов: 8/2,94 млрд;
  • Уровень TDP: 250 Вт/50–75 Вт;
  • Техпроцесс: 28 нм, разработан TSMC;
  • GPU: GM200/GM206.

Источник:


Источник: 3DNews

 
 
Новости:    Предыдущая Следующая   
 Архив новостей

Разделы новостей:

Подписаться на новости:

 

Поиск в новостях: