PAPI: Bibliothek zum Auslesen der CPU-Performance-Register
Pro: Leichgewichtig, Teile vom Program
Contra: Für Linux mit gepatchtem Kernel: Leider viel Wartungsaufwand bei jedem Kernel-Update, z. T. unzuverlässige Werte, nur wenige Werte gleichzeitig messbar, Programm muss geändert werden.
Intel VTune/ThreadProfiler:
Pro: Sehr viele Werte gleichzeitig messbar, gute GUI.
Contra: Unter Linux Kernel-Modul nötig, Programm insgesamt nicht ganz stabil, insbesondere bei Remote-Profiling.
generelles Problem: feinkörniges Profilen von Code mit geinlineten Funktionen:
beim Optimieren geht die Abbildung Quellcode ->Binary verloren -> Profiling schlecht möglich.
ohne Optimieren sind die Resultate wenig aussagekräftig.
Kennt jemand einen Profiler, der mit so etwas auf Quellcode-Ebene umgehen kann?