パフォーマンスの見積もりって難しいなあ

描画系の技術って、ハードウェアが複雑になっちゃってて、ある技術を実装したときにそれがどのくらいの速さなのかが中々事前に推測できなくなってますね。
CPUでのセットアップ時間はどのくらいなのか、マルチコアを使ったらどうなるのか、タイトルで使うときに本当にマルチコアがあいているのか、ドローコールの回数はどのくらいか、バンド幅を食い尽くしていないか、シェーダはどの程度重いか、頂点シェーダの負荷はどのくらいか、ピクセルシェーダの負荷はどのくらいか、カメラに対してどのくらいの割合で写るのか、カメラの中にいくつ存在するのか、テクスチャフェッチはどのくらいの回数起きるのか、テクスチャサイズはどのくらいか、キャッシュを活用できるサイズか、そもそもどんなデータが作られるのか、どんなデータを作りたいのか。
また、技術Aと技術Bが有るときに、どっちが早いの?という回答は、それこそ実装してみないことには分からないことが多いです。試行錯誤の回数を減らすには、見積もりの精度を上げるには、どうすればいいんでしょうね。ハードウェアの性質を把握することは相当重要なのかな、という気がしていますが、経験から知識が導き出されることも有るわけで。
・・・勘?