AIハードウェア・半導体

AIツール活用

AI:NVIDIA Transformer EngineとFP8混合精度の実装ガイド|環境構築からベンチマークまで

大規模モデルのトレーニングに丸3日かかっていた処理が、FP8混合精度の導入後は1日半で完了した。計算コストが半減するのだから、導入しない理由を探す方が難しい。ただし現実は、対応GPUの制約やインストール時のエラー、フォールバック処理の実装な...