.... Pentium IV lucreaza prin intermediul a doua canale de transmisie cu RDRAM, la o viteza de 3.2Gs.Advanced Transfer Cache se concretizeaza in marirea ratei de transfer a datelor intre memoria cache L2 si nucleul procesorului. Dimensiunea memoriei cache L2 este de 256KB. La schimbul de date cu sistemul memorie, AGP, PCI se folosesc blocuri de 64 bytes, ceea ce asigura o performanta mare pentru transferurile in rafala, iar conexiunea cu nucleul se face prin intermediul unei interfete de 256 biti, care poate transfera date la frecventa procesorului. Se obtine o largime de banda de 44.8GBs pentru un Pentium IV la1.4GHz, aproximativ de 3 ori mai mult ca un Pentium III la1GHz.Advanced Dynamic Execution optimizari ale arhitecturii de prelucrare si stocare temporara a instructiunilor mod speculativ si arbitrar de executie care impiedica procesorul sa aiba stari de stagnare cand instructiunile asteapta rezolvarea dependentelor, cum ar fi de exemplu incarcarea de date in memorie. Pot fi rulate astfel pana la126 de instructiuni in curs de rulare, fata de 42 in cazul microarhitecturii Pentium III. Execution Trace Cache in cazul procesorului Pentium IV nivelul 1 de cache pentru instructiuni este pozitionat dupa unitatea de decodare. In acest caz nu mai este necesara redecodarea instructiunilor repetitive odata ce ele se afla in acest cache, in plus sunt mai usor de dedus dependentele in procesul de predictie. Poate contine pana la 12000 de microinstructiuni comparativ este de 6 ori mai mare ca nivelul L1 de cache al unui PentiumIII si ofera spre executie 3 microinstructiuni la frecventa microprocesorului. Trace Cache-ul este un cache de instructiuni care incearca sa inregistreze instructiunile in ordinea lor de executie, ceea ce simplifica procesarea, asigurandu-se ca instructiunile sunt in ordinea corecta.Un nou algoritm de predictie a instructiunilor, Enhancced Branch Prediction, cu un buffer in care se pot stoca 4096 de alternative, de 8 ori mai multe ca la un Pentium III, eliminandu-se astfel 33 din predictiile gresite in cazul procesorului mentionat anterior.Unitatea de executie rapida asigura un nr mai mare de instructiuni 126, dintre sare unitatile de executie pot alege acest lucru permite microprocesorului sa evite asteptarile care apar atunci cand o instructiune foloseste datele furnizate de o alta instructiune. Unitatea aduce si o mai mare acuratete in predictia salturilor ranch prediction, rata de predictie gresita fiind cu 33 mai mica. Acuratetea este posibila datorita implementarii unui buffer de 4K ce stocheaza mai multe detalii despre ramurile accesate anterior, dar si datorita unui nou algoritm de predictie.Hiper Pipelined Technology dublarea fata de arhitectura PentiumIII a numarului de stadii pe care le parcurge o instructiune intre momentul intrarii in executie si obtinerea rezultatelor. Se obtine o crestere de performanta, dar avantajul principal este scalabilitatea in frecventa, procesoarele PentiumIV putand functiona la frecvente mult mai mari decat cele ale procesoarelor cu arhitecturi curente. Astfel, cu introducerea unei linii de asamblare in 20 de etape, Intel a reusit sa faca procesorul sa mearga la viteze foarte mari. In cazul unei instructiuni plasata pe o linie de asamblare in 10 etape, in timpul fiecarui impuls de ceas, o zecime este prelucrata si este nevoie de 10 cicluri de ceas pentru a termina. Deci, unei benzi de asamblare de la PentiumIV ii trebuie 20 de cicluri de ceas pt a termina o instructiune, in fiecare etapa prelucrarea fiind destul de redusa ceea ce diminueaza durata dintre 2 impulsuri de tact. Numarul total de cicluri necesare procesarii unei instructiuni se numeste timp de latenta. O linie de asamblare mai lunga inseamna timp de latenta mai mare.Rapid Execution Engine combinand inovatii ale arhitecturii interne si proiectarii fizice ale circuitelor, s-a reusit ca cele 4 unitati logice aritmetice simple ALU care executa microinstructiunile simple, sa ruleze la d...
Download