O maniera frecvent intalnita de cautare este asa numita cautare de siruri directa ('string search').
Formularea problemei:
Se da un tablou s de n elemente si un tablou p de m elemente, unde 0<m<n declarate astfel [4.3.2.a]:
VAR s: ARRAY[0..n‑1] OF char;
p: ARRAY[0..m-1] OF char; [4.3.2.a]
Cautarea se siruri are drept scop stabilirea primei aparitii a lui p in s.
De regula, s poate fi privit ca un text, iar p ca un cuvant model ('pattern') a carui prima aparitie se cauta in textul s.
Aceasta este o operatie fundamentala in toate sistemele de prelucrare a textelor si in acest sens este de mare interes gasirea unor algoritmi cat mai eficienti.
Cea mai simpla metoda de cautare este asa numita cautare de siruri directa.
Rezultatul unei astfel de cautari este un indice i care precizeaza aparitia unei coincidente intre model si sir.
Acest lucru este formalizat de predicatul P(i,j) [4.3.2.b].
P(i,j)<= Ak:0 k < j:si+k = pk [4.3.2.b]
Predicatul P(i,j) precizeaza faptul ca exista o coincidenta intre:
Sirul s (incepand cu indicele i)
Sirul p (incepand cu indicele 0) pe o lungime de j caractere (fig. 4.3.2.a).
i i + j - 1
s
p
0 1 2 j - 1
j caractere
Fig.4.3.2.a. Reprezentarea grafica a predicatului P(i,j)
Este evident ca indexul i care rezulta din cautarea directa de siruri trebuie sa satisfaca predicatul P(i,m).
Aceasta conditie nu este insa suficienta.
Deoarece cautarea trebuie sa furnizeze prima aparitie a modelului, P(k,m) trebuie sa fie fals pentru toti k < i .
Se noteaza aceasta conditie cu Q(i)[4.3.2.c].
Q(i) = Ak: 0 k < i: ~P(k,m) [4.3.2.c]
Punerea problemei sugereaza formularea cautarii directe de siruri ca si o iteratie de comparatii redactata in termenii predicatelor Q respectiv P.
Astfel implementarea lui Q(i) conduce la secventa [4.3.2.d]:
i:= -1;
REPEAT
i:= 1+1; [4.3.2.d]
gasit:= P(i,m)
UNTIL gasit OR (i=n-m);
Calculul lui P rezulta in continuare ca si o iteratie de comparatii de caractere individuale.
Rafinarea secventei anterioare conduce de fapt la implementarea cautarii directe de siruri ca o repetitie intr-o alta repetitie [4.3.2.e].
FUNCTION CautareDirecta(VAR poz: integer): boolean;
VAR i,j: integer;
BEGIN
i:= ‑1;
REPEAT [4.3.2.e]
i:= i+1; j:= 0;
WHILE (j<m)AND(s[i+j]=p[j]) DO j:= j+1
UNTIL (j=m)OR(i=n‑m);
poz:= i;
CautareDirecta:= j=m
END;
Termenul j = m din conditia de terminare, corespunde lui gasit deoarece el implica P(i,m).
Termenul i=n-m implica Q(n-m), deci non existenta vreunei coincidente in cadrul sirului.
Analiza cautarii de siruri directe.
Algoritmul lucreaza destul de eficient daca se presupune ca nepotrivirea in procesul de cautare apare cel mult dupa cateva comparatii in cadrul buclei interioare.
Astfel pentru un set de 128 de caractere se poate presupune ca nepotrivirea apare dupa inspectarea a 1 sau 2 caractere.
Cu toate acestea in cazul cel mai nefavorabil, degradarea performantei este ingrijoratoare.
Astfel daca spre exemplu sirul s este format din n-1 caractere 'A' urmate de un singur 'B',
Iar modelul consta din m-1 caractere 'A' urmate de un 'B',
In acest caz este necesar un numar de comparatii de ordinul n m pentru a gasi coincidenta la sfarsitul sirului.
Din fericire exista metode care imbunatatesc radical comportarea algoritmului in aceasta situatie.
Tehnicile de cautare care sunt prezentate in continuare materializeaza acest deziderat.
Politica de confidentialitate |
.com | Copyright ©
2024 - Toate drepturile rezervate. Toate documentele au caracter informativ cu scop educational. |
Personaje din literatura |
Baltagul – caracterizarea personajelor |
Caracterizare Alexandru Lapusneanul |
Caracterizarea lui Gavilescu |
Caracterizarea personajelor negative din basmul |
Tehnica si mecanica |
Cuplaje - definitii. notatii. exemple. repere istorice. |
Actionare macara |
Reprezentarea si cotarea filetelor |
Geografie |
Turismul pe terra |
Vulcanii Și mediul |
Padurile pe terra si industrializarea lemnului |
Termeni si conditii |
Contact |
Creeaza si tu |