Hallo quack,
ich habe mich damit noch nie befasst, aber ich versuch’s mal: Dein Term ist ja im Grunde ein Potenzturm.
a^{b^c}
Wir beginnen, wie du richtig sagst, mit
b^c
und schließen mit
a^{(b^c)}
Wir arbeiten uns also von außen nach innen und im Gegensatz zu
a^{(b^c)}=a^{(b*c)}
Wie so vieles wurde das - nehme ich mal an - wegen seines Zwecks festgelegt: Der Potenzturm dient zur vereinfachten Darstellung großer Zahlen. In der „Wald- und Wiesen"mathematik, die linksassoziativ rechnen würde, wird kaum über die dritte Potenz hinausgegangen, weil mathematische Gleichungen schnell unübersichtlich werden. In Bereichen der Programmiersprachen allerdings, wo zum Beispiel die Grenzen der Speichervariablen ausgelotet werden, ist es vonnöten, auch mal vier oder 5 Potenzturm"etagen“ zu bauen. Die double-Variable kann zum Beispiel eine 15-stellige Zahl speichern und ist damit 8 Byte groß. Das als Potenzturm zu schreiben, ist weitaus übersichtlicher. Also - so kann ich es mir vorstellen - wurde die Konvention auf rechtsassoziativ festgelegt und die "Wald- und Wiesen"mathematik musste sich mit den Klammern begnügen, weil sie die Potenzierung ohnehin weniger braucht.
Als Buchtipp kann ich dir aber noch Florian Cajori: A History of Mathematical Notations. Open Court, Chicago 1928–1929, Dover, New York 1993. ISBN 0-486-67766-4 Buch anschauen empfehlen.