本文对比了 AMD 锐龙系列的两款 APU 的内置核心显卡的图形性能。测试软件使用 Windows 10 Pro 上的 64 位 3DMark,测试硬件均为:

  • 内存:DDR4 3000MHz 8x2 双通道
  • 主板:华硕 B450M TUF M-ATX 小板

其他不关键的硬件(硬盘,电源等)就不列出了。结论是:2400G 的核显性能相比 2200G 领先了大约 25%。

阅读全文 »

NVIDIA 在 Volta 和 Turing 架构的 GPU 中进入了 Tensor Cores,可以大幅加速 float16 精度下的矩阵计算。如今的 TensorFlow r1.14 版本已经可以无缝支持 NVIDIA 的这项新特性,自动将 float16 精度下的卷积操作交给 Tensor Cores 来做。不过,float16 相比于 float32 来说,它可表示的范围更小,精度更差,直接在训练中使用 float16 类型会带来诸多问题(下溢、上溢等)。因此,混合精度应运而生。

NVIDIA 官方博客:Mixed-Precision Training of Deep Neural Networks

阅读全文 »

通常来说,神经网络的参数越多,它的性能越好。但是众多的参数意味着它们必须在非常大的数据集上进行训练,并且需要花费很长的时间。因此选择一个在 ImageNet 上预训练好的模型,在其基础上进行 Fine-tuning 是一个不错的选择。

阅读全文 »