Asupra "paralelizarii" dispozitivelor secventiale de inmultire binara
O caracteristica generala comuna a implementarilor
procedurilor studiate a fost executia operatiei de inmultire
binara printr-o secventa de semnale de control, in principiu,
fiecare dintre acestea revendicand un impuls de CLOCK. Sub acest aspect, la un
pol al spectrului solutiilor se prezinta procedurile asa numite
"one - bit - at - a - time" (care iau decizia de adunare - deplasare sau doar
deplasare in functie de valoarea, la un anumit moment de timp, a unui
singur bit) in radix
O atentie aparte trebuie acordata celui de-al doilea element de accelerare fundamental care contribuie, impreuna cu marirea lui r, la imbunatatirea performantei solutiilor paralelizate, anume sumatorul CSA. Odata cu cresterea numarului multiplilor, insumarea CSA nu mai poate fi facuta printr-un singur nivel, necesitand mai multe, fiind apelate frecvent configuratii tip arbore (CSA tree arrangements [ErLa04], [Oliv01]). Evident, pe masura cresterii valorii bazei r, creste numarul de niveluri ale arborelui CSA cu consecinte defavorabile relative la performanta. De fapt, aici este localizat compromisul care inclina balanta alegerii in favoarea unei anumite solutii. Practic, nu exista nici un motiv la limitarea bazei la r=16, astfel ca in [Parh00] este discutat un inmultitor cu r=256. Discernerea solutiei mai favorabile nu este o sarcina simpla, ea fiind influentata in mare masura de tehnologia de circuite disponibila, precum si de unele artificii de exploatare a parametrilor CLOCK-ului (three - phase clock [Parh00]).
Se cuvine facuta o apreciere si legata de complexitatea integrarii de nivelul scara foarte larga (Very large scale integration, VLSI) a solutiilor de implementare pentru multiplier-ele prezentate. Componentele de structura ale acestora includ, asa cum rezulta din variatele configuratii, dar in special cea din fig. 3.38, registre, multiplexoare, sumatoare CSA si un sumator paralel rapid (care, in fig. 3.36, a fost adoptat de tip RCA doar pentru simplitatea reprezentarii), precum si o cantitate, in general, redusa de logica aleatoare (random logic) pentru sinteza controlului. Dintre acestea, se detaseaza prin influenta asupra complexitatii VLSI, arborele de sumatoare CSA. Admitand, pentru simplitate, ca referirile noastre se fac la inmultitoare fara recodificare Booth in baza r=2k, formarea vectorilor suma si carry ai produsului final cumulativ necesita k sumatoare CSA. Astfel, daca r=4, intrucat, asa cum se poate observa si din fig. 3.30, este necesara generarea multiplului 3Y, rezulta ca avem 4 vectori de intrare (Y, 2Y si cei suma si carry de la vechiul produs partial cumulativ) a caror adunare CSA necesita k=2 sumatoare. Tot asa, cand r=16, rezulta ca pentru a forma - prin intermediul multiplilor Y, 2Y, 4Y si 8Y - toti multipli necesari sunt necesare k=4 sumatoare CSA [Parh00], care pot fi interconectate intr-o structura arborescenta, spre exemplu, de tip Wallace. In general, un astfel de arbore CSA are (k+2) intrari si o inaltime, evaluata in numar de niveluri CSA, care poate fi aproximata prin log2 k. Complexitatea ariei (area complexity) unei astfel de structuri arborescente este data de , n fiind numarul de biti ai fiecarui operand de inmultit. Intrucat arborele CSA domina, prin prisma complexitatii ariei de integrare, sumatorul final rapid, necesitatea de arie revendicata de intreaga structura poate fi exprimata prin :
|
Pe de alta parte, complexitatea de timp (time complexity) a unei astfel de structuri arborescente CSA este data de , ori, daca luam in consideratie numarul de cicluri (pasi), egal cu n/k (vezi si in inmultirea exemplu din fig. 3.39, chiar daca aceasta apeleaza la recodificarea Booth), atunci obtinem . Daca la aceasta componenta de timp adaugam pe cea reclamata, in versiune rapida (spre exemplu, CLA), de insumare finala data de atunci pentru complexitatea de timp a intregului inmultitor rezulta :
|
Plecand de la (3.21) si (3.22) si incercand o evaluare a eficientei integrarii prin prisma costului, vom face uz de cunoscuta [Parh00][ErLa00] metrica AT care, in cazul inmultitoarelor noastre, rezulta :
|
La limita inferioara a spectrului complexitatii, cand k=1, atunci , acesta fiind cazul mai lentelor inmultitoare radix 2. Daca, insa, intram in zona dispozitivelor accelerate, pentru k=2, rezulta , iar pentru k=n (acesta fiind cazul complet paralel, cand toti bitii multiplier-ului X sunt inspectati simultan), rezulta . Ori, fiind cunoscut ca pentru un proiect optim este, la limita, proportional cu [Parh00] si intrucat niciunul din proiectele intermediare, intre cele extreme amintite, nu permite obtinerea unor valori mai bune pentru, se poate concluziona ca dispozitivele de inmultire raman asimptotic suboptimale pentru intreaga gama valorica a parametrului n. In plus, prin prisma aceleiasi matrice, mai rezulta ca inmultitoarele radix 2 sunt mai bune decat solutiile de sinteza "paralelizate".
Politica de confidentialitate |
.com | Copyright ©
2025 - Toate drepturile rezervate. Toate documentele au caracter informativ cu scop educational. |
Personaje din literatura |
Baltagul – caracterizarea personajelor |
Caracterizare Alexandru Lapusneanul |
Caracterizarea lui Gavilescu |
Caracterizarea personajelor negative din basmul |
Tehnica si mecanica |
Cuplaje - definitii. notatii. exemple. repere istorice. |
Actionare macara |
Reprezentarea si cotarea filetelor |
Geografie |
Turismul pe terra |
Vulcanii Și mediul |
Padurile pe terra si industrializarea lemnului |
Termeni si conditii |
Contact |
Creeaza si tu |