Erster Blick auf das Kühlsystem der ACA1240/1260

Caution: Non registered users only see threads and messages in the currently selected language, which is determined by their browser. Please create an account and log in to see all content by default. This is a limitation of the forum software.


Also users that are not logged in can not create new threads. This is a, unfortunately needed, counter measure against spam. Please create an account and log in to start new threads.

Don't Panic. Please wash hands.
  • Wir arbeiten dran - ich fürchte aber, dass wir nicht viel mehr zeigen können als letztes Jahr, weil wir "nur" Probleme "unter der Haube" gelöst haben. Zuletzt beispielsweise das Startverhalten bei kaltem Computer: Wir hatten immer mit extrem langen Standzeiten und hohen Taktfrequenzen getestet, aber nur extrem selten mit kaltem Rechner, weil die Testrechner immer über Nacht an waren um Instabilitäten zu finden.


    Das macht echt total stolz wenn man wochenlang keinen Absturz provozieren kann - aber wenn dann nach ein paar Tagen Ruhe der Rechner einfach nicht zuverlässig startet, kratzt man sich am Kopf :-) Das war ne harte Nuss, besonders weil man immer Testrechner und Turbokarte ganz abkühlen lassen muss, bis man den Fehler wieder nachstellen kann.


    Ich werd' auf jeden Fall mindestens eine Karte mitbringen, auf der wir was zeigen können. Welche Geschwindigkeit und welche CPU, das kann ich noch nicht sagen. Ich habe kommende Woche noch eine Auslieferung für eine Auftragsarbeit, kann also selbst nur wenig beitragen.


    Jens

  • Na da bin ich gespannt :) freue mich sehr auf die ACA1260. mich würde noch interessieren ob ihr die 105 MHz der Warp Karte dank eurem ausgeklügeltem Kühlsystem getoppt bekommt? Oder ist bei den rev6 CPUs grundsätzlich ab 105 Mhz der Ofen aus?

  • Wir haben naben neben der Kühlung noch ein Ass im Ärmel, das das Übertaktungsfenster grundsätzlich erweitert. Ohne die richtigen Softwaretools werden wir aber diese Möglichkeiten noch nicht ausschöpfen. Erst die Arbeit, dann das Vergnügen :-)


    Du musst immer im Hinterkopf behalten, dass die technischen Daten der ACA1240/1260 noch nicht veröffentlicht sind. Ich würde nicht jahrelang Entwicklung bezahlen, wenn da nicht das eine oder andere Feature drin wäre, das eine echte Neuerung im Vergleich zu anderen 68040/68060-basierten Karten drin wäre. Wir haben aber immer noch eine Menge zu tun, und werden immer nur das veröffentlichen, das zu 100% verifiziert ist. Selbst die Betatester werden nicht alles wissen.


    Jens

  • D.h. LC060 werden eher nicht eingesetzt?

    Doch, haben wir auch - sogar welche, die offiziell 75MHz können. Die könnten attraktiv sein für Leute, die schon einen 060 von einer anderen Karte "gerettet" haben, denn da ist nach dem CPU-Tausch nichts in Sachen Lizenzen zu machen.


    Hmm wie kann man den 040 atraktiver machen?

    Mehr Speed! Die Mac-Overclocker betreiben die 68040 in den alten Apple-Rechnern teilweise mit mehr als 50MHz. Wäre doch gelacht, wenn wir das nicht auch können!


    Jens

  • Soo.. die letzten zwei Tage haben wir intensiv an der ACA1240/1260 gearbeitet. Leider ist es beim 68040-40 nicht wirklich von Erfolg gekrönt gewesen, denn der geht schon in die Knie, wenn man ihm 42MHz gibt. Ich habe extra eine Maske mit 0,65µ-Maske ausgesucht, aber auch eine V-Version mit 0,5µ-Maske versucht, die jedoch noch schlechter abgeschnitten hat.


    Interessanter wurde es beim 68060-Rev.6. Da haben wir uns in 10MHz-Schritten nach oben gearbeitet, und 100MHz stabil ans Laufen bekommen. Leider ist schon bei 105MHz Schluss: Bei dem Tempo stürzt der Rechner ab, sobald Setpatch aufgerufen wird. Vermutlich kann die MMU einfach nicht so schnell - am Speicher liegt's nicht, denn den können wir mit dem 68040/40-Core bis 120MHz laufen lassen (3-facher CPU Takt für sehr kurze first-access-penalty).


    Hier ein paar Screenshots von Performance-Messtools und ein AIBB-Modul. Achtung: Das ist noch nicht zuende optimiert! Es ist gut möglich, dass wir noch einen Wait state beim Ram-Zugriff 'rausholen können, dann wird der Speicher nochmal ein gutes Stück schneller. Es sieht aber so aus, als würden wir mit mehr als 80MB/s Lese-Performance schon an der Spitze dessen liegen, was es bislang für den Amiga gegeben hat.


    Jens

  • Hallo Jens,


    hast du auch einen bustest der ACA1240/40?


    Die 50MHz werden schon noch erklommen.
    Es gab ja einige 50MHz Karten direkt für den CPU-Sockel für den Mac und im Amiga liefen die ja auch teilweise.
    Da habt bestimmt nur etwas übersehen.


    rolle

  • hast du auch einen bustest der ACA1240/40?

    Ist in post#4 dieses Threads. Der Shot ist zwar schon was älter, aber an der Fastmem-Geschwingigkeit hat sich kaum was verändert. Lediglich Chipmem-Lesen ist etwas schneller geworden. Ich kann nächste Woche nochmal einen 040 auf eine Karte stecken und aktuelle Tests machen.


    Die 50MHz werden schon noch erklommen.
    Es gab ja einige 50MHz Karten direkt für den CPU-Sockel für den Mac und im Amiga liefen die ja auch teilweise.
    Da habt bestimmt nur etwas übersehen.

    Nein, es war ziemlich eindeutig, dass diese CPU nicht mehr kann. Möglicherweise findet man 0,65µ-Masken die mehr als 40MHz können, aber Du musst Dir auch immer vor Augen halten, dass wir mit dem Speicherinterface etwas machen, was noch nie zuvor (auch nicht bei Apple) gemacht wurde: einen echten x-1-1-1 Burst, also mit jeder BCLK ein Langwort in den Prozessor übertragen. Die Speicher waren damals einfach nicht schnell genug. Natürlich könnten wir versuchen, das Speicherinterface zu bremsen, aber ob man dann etwas gewinnt, steht auf einem anderen Blatt: Eine CPU führt Code aus, der üblicherweise im Speicher liegt. Für jedes Kommando muss also ein Speicherzugriff gemacht werden. Ergo kann eine CPU immer nur so schnell sein, wie der Speicher an dem sie angeschlossen ist. An der Stelle kann man verdammt viel Performance liegen lassen, wenn man Fehler macht. Anders herum kann man massiv gewinnen, wenn man noch einen wait state heraus optimiert.


    Siehe bereits gezeigte Performance:


    ACA1240-40 erreicht über 30.000 Sysinfo-Dhrystones

    ACA1234-40 erreicht knapp die Performance einer B1230-IV, welche 50MHz getaktet war


    Beide holen diese Geschwindigkeit aus dem Speicher. Wenn wir also Benchmarks finden, die gleichermaßen auf einem schnellen Apple wie auf dem Amiga laufen, könnten wir vergleichen was ein 50MHz-Mac im Vergleich zur ACA1240-40 leistet.


    Ich vermute, dass wir beim Übertakten des 68040 an eine ähnliche Grenze stoßen, wie schon damals bei den QFP-68030 Prozessoren: Die liefen immer problemlos auf 40MHz in den alten Designs mit 72-poligen SIMM-Steckplätzen. Als ich dann aber die ACA1231 gebaut habe, die bei knapp 42MHz lief, musste die CPU gekühlt werden, sonst war's instabil (wenn sich jemand dran erinnert oder es sogar miterlebt hat: Wir haben den ersten Kunden den Kühlkörper nachgeschickt). Das war nötig, weil die CPUs mit dem schnellen Speicher einfach viel mehr zu tun hatten und entsprechend mehr Wärme produziert haben. Das Gleiche wird höchst wahrscheinlich mit den 68040 passieren, die bei 40MHz problemlos mit dem schnellen Speicher laufen, und bei 42MHz einknicken.


    Jens

  • Für den Vergleich mit einem Mac bieten sich Shapeshifter/Fusion an.
    Damit läufen MacOS quasi verlustfrei auf dem Amiga. -> Speedometer, MacBench
    Der Quadra 840AV (schnellster 68k Mac mit dem 68040/40MHz) wäre der ideale Vergleichsrechner.


    Wenn ich richtig gelesen habe, dann haben 50MHz Karten für den Mac immer einen 25MHz Bus gefordert und diesen verdoppelt.
    An Anschluß ans System und RAM blieb bei 25MHz.
    Es gab Versionen mit L2 Cache um das etwas zu kompensieren.


    Ich finde Motorola hat da vor 30 Jahren sehr gute Arbeit geleistet.
    Die CPUs erfüllen anscheinend alle Versprechungen beim maximalen Takt.

  • Ich hab' nochmal geschaut, was für Prozessoren genau in den Apples waren: Meist waren das 68LC040, also ohne FPU, aber mit MMU. Laut dieser Übersicht sind da nur ganz wenige dabei, die schneller als 40MHz können, aber sie machen jenseits von 40MHz alle Probleme, hauptsächlich mit der Seriellen.


    Ich frage mich, ob das MacOS überhaupt die MMU aktiviert? Das scheint die Schwachstelle zu sein, die MMU ist wohl das Erste, was bei höheren Frequenzen Ärger macht. Es könnte also sein, dass wir für noch höhere Frequenzen auf die MMU verzichten müssen, dafür aber die TTR nutzen können (die jedoch nur eine Granularität von 16MByte haben). Größtes "Problem" wäre dann, dass Caches im Kickstart nicht aktiviert wären, aber seit OS3.2 kann man das Kickstart ja einfach so ins Ram legen - das werden wir aber erst verfolgen, wenn ein paar Karten im Feld sind, und sich Langeweile breit macht :-)


    Jens

  • https://www.macinfo.de/rechner/apple-68k.html#68040

    Die Ausstattung mit einem LC könnte auch auch durch die Preisgestaltung begründet sein.


    Die MMU wurde wohl ausschließlich für den virtuellen RAM genutzt. Diese Funktion war optional.


    Ich habe nichts gefunden was aussagt, daß die 50MHz Beschleuniger Funktionen beschneiden.
    Es wird wohl so sein, daß sie am Bus wesentlich weniger belastet sind.



    Der 68040 ist ja richtig flexibel. Erinnert mich an mein Praktikum (>20a) und den PPC mit seinen
    sehr mächtigen Speichercontrollern.

    Link zum PDF


    Auch die Geschichte mit large und small buffer erzeugt auch nicht wenig Stellschrauben die zwischen Erfolg und Scheitern entscheiden.



    Anmerkung: Ich bin Laie und habe keine Ahnung (mehr) davon. Aber ich bin fasziniert und neugierig.

  • Auch die Geschichte mit large und small buffer erzeugt auch nicht wenig Stellschrauben die zwischen Erfolg und Scheitern entscheiden.

    Das ist ein wertvoller Hinweis - bisher hatten wir immer "large buffers" eingestellt, damit die Adressen möglichst früh gültig sind. Es wäre aber nicht das erste Mal, dass die Stromaufnahme eines Chips dadurch so groß wird, dass er einfach abstürzt weil andere Teile dadurch nicht mehr richtig versorgt werden (hatten wir bei den Cyclone-II basierten Flickerfixern).


    Glücklicherweise können wir die buffer sizes komplett in Software festlegen, also auch im Feld ändern, falls nötig. Es kann sein, dass die Apples die Buffers immer "klein" gesetzt haben, damit der Prozessor weniger Wärme produziert. Bei 25MHz holt man ohnehin durch die stärkeren Treiber nichts raus - die 40ns-Granularität auf dem Bus macht nahezu jede Anstrengung kaputt, irgendwo Zeit zu gewinnen.


    Aktuell machen wir beim 40MHz 68040 einen 3-1-1-1 Zugriff. Der Burst ist also nach 6 Clocks=150ns gelaufen. Für die Übertaktung haben wir den Speichertakt zunächst von 120MHz auf 80MHz runter gesetzt, was dann auf 4-1-1-1 reduziert, aber Luft für höheren Takt macht. Trotzdem hat's schon mit 84MHz Speichertakt und 42MHz CPU-Takt nicht mehr funktioniert, obwohl sämtliche Setup- und Hold-Zeiten dicke eingehalten sind. Die Performance auf dem Bus ist sogar geringer, denn 7 Clocks bei 42MHz sind 166,67ns.


    An die Adress- und Datentreiber haben wir überhaupt nicht gedacht - es gibt also wirklich noch einen Pfad, den wir noch nicht versucht haben.


    Jens

  • Link zum PDF


    840AV 68040 40MHz
    660AV 68040 25MHz


    zu den buffers steht nichts.


    Die 50MHz Beschleuniger funktionieren ja durch Taktverdopplung. (-> nur für 660AV möglich )
    Verdoppeln sich dann auch intern die Anzahl der Takte für den Zugriff?
    Aus einem burst read mit 4-2-2-2 wird dann ein 8-4-4-4 bei 50MHz?

  • Aus einem burst read mit 4-2-2-2 wird dann ein 8-4-4-4 bei 50MHz?

    Ja, das wird so sein, wenn der Beschleuniger keinen eigenen Speicher hat. Gerade das ist aber was man sich wünscht, denn wie schon so oft hier geschrieben holt eine CPU egal welcher Bauart, seine Performance immer nur aus dem Ram. Schau' Dir die komischen 060-Adapter für die A3640 an; deren Performance ist echt unterirdisch.


    Jens