Итак, вычисления на CPU Intel(R) Core(TM) i7-7700HQ @ 2.80 GHz
:
tensorflow-eigen (Intel) ~ 330 examples/sec (рис. 1)
tensorflow-mkl (Intel) ~ 640 examples/sec (рис. 2)
Как видим, библиотека MKL
даёт прирост скорости при вычислениях на CPU
практически вдвое.
Вычисления на GPU GeForce GTX 1050 Ti
:
tensorflow-gpu (NVIDIA) ~ 5000 examples/sec (рис. 3)
Прирост скорости почти десятикратный.
Вот вычисления на процессоре AMD FX(tm)-8350 Eight-Core Processor @ 4.1 GHz
:
tensorflow-eigen (AMD) ~ 310 examples/sec (рис. 4)
Забавно, что старенький процессор от AMD
, будучи по меньшей мере раз в пять дешевле, показывает практически такие же результаты, что и вполне современный процессор от Intel
, без учета ускорения библиотеки MKL
. Если бы в AMD
сподобились написать специализированную математическую библиотеку, результаты, надо полагать, были бы не хуже.
Дополнительно небольшой курьёз — на компьютере с процессором AMD
вариант MKL
встал без проблем, ни на что не ругался и, более того, показал на 15% большую производительность.
tensorflow-mkl (AMD) ~ 360 examples/sec (рис. 5)
Как библиотека от Intel
умудрилась поднять производительность процессора AMD
— загадка. Видимо, благодаря каким-то универсальным оптимизациям.
Для сравнения — результаты тестов от автора оригинальной статьи (рис. 6), насколько можно понять из комментариев к статье, без использования MKL
.
Оригинал: VK.com