Архитектуры и бенчмарки — 3. Результаты

Итак, вычисления на CPU Intel(R) Core(TM) i7-7700HQ @ 2.80 GHz:

tensorflow-eigen (Intel) ~ 330 examples/sec (рис. 1)
tensorflow-mkl (Intel) ~ 640 examples/sec (рис. 2)

Как видим, библиотека MKL даёт прирост скорости при вычислениях на CPU практически вдвое.

Вычисления на GPU GeForce GTX 1050 Ti:

tensorflow-gpu (NVIDIA) ~ 5000 examples/sec (рис. 3)

Прирост скорости почти десятикратный.

Вот вычисления на процессоре AMD FX(tm)-8350 Eight-Core Processor @ 4.1 GHz:

tensorflow-eigen (AMD) ~ 310 examples/sec (рис. 4)

Забавно, что старенький процессор от AMD, будучи по меньшей мере раз в пять дешевле, показывает практически такие же результаты, что и вполне современный процессор от Intel, без учета ускорения библиотеки MKL. Если бы в AMD сподобились написать специализированную математическую библиотеку, результаты, надо полагать, были бы не хуже.

Дополнительно небольшой курьёз — на компьютере с процессором AMD вариант MKL встал без проблем, ни на что не ругался и, более того, показал на 15% большую производительность.

tensorflow-mkl (AMD) ~ 360 examples/sec (рис. 5)

Как библиотека от Intel умудрилась поднять производительность процессора AMD — загадка. Видимо, благодаря каким-то универсальным оптимизациям.

Для сравнения — результаты тестов от автора оригинальной статьи (рис. 6), насколько можно понять из комментариев к статье, без использования MKL.

Оригинал: VK.com

tensorflow-eigen (Intel) tensorflow-mkl (Intel) tensorflow-gpu (NVIDIA) tensorflow-eigen (AMD) tensorflow-mkl (AMD) Benchmarks

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *