CERCETAREA SELECTIVA
1. Definire. Principalele notiuni
Sondajul statistic este utilizat in ultimul timp din ce in ce mai mult in analiza calitatii produselor si serviciilor, in studiul parametrilor de functionare a unor linii tehnologice, studiul populatiei din punct de vedere al optiunilor demografice, politice, culturale etc.
Utilizarea sondajului statistic, ca alternativa a observarii totale, este un rezultat firesc al avantajelor majore pe care le aduce aceasta forma de cercetare statistica. In general, sondajul se utilizeaza intrucat asigura reducerea costului de obtinere a informatiei statistice.
Costurile de obtinere a datelor asupra carora se vor efectua prelucrarile statistice sunt cu mult mai mici decat in cazul observarii exhaustive. Aceasta intrucat se inregistreaza numai o parte a populatiei de referinta. Astfel, este posibil ca, pe baza unui esantion relativ mic, sa obtinem date ce caracterizeaza suficient de bine populatia de referinta.
Adesea, in studierea unui fenomen, se dispune de putin timp intre momentul in care se stabilesc datele necesare cercetarii si acela in care se utilizeaza rezultatele. Astfel, daca se efectueaza o ancheta statistica pentru masurarea eficacitatii unei campanii publicitare, observarea si culegerea datelor trebuie sa fie realizate cat mai aproape de debutul acestei campanii.
Cum esantioanele sunt cu mult mai mici decat populatia de referinta, are loc reducerea timpului de culegere si prelucrare a datelor, in aceeasi masura reducandu-se timpul alocat observarii.
In general, orice proces de observare statistica este susceptibil de a fi afectat de erori, dar sondajul permite obtinerea de date mai exacte decat cele dobandite in cadrul recensamintelor. Aceasta se datoreaza, in principal, utilizarii in procesul de culegere a datelor unor persoane competente, organizarii riguroase a controlului in teren.
Exista in anumite domenii in car observarile exhaustive nu pot fi utilizate.
Exemplul tipic in aceste caz este analiza calitatii unui lot de produse, caz in care, in mod frecvent, aceasta presupune distrugerea totala sau partiala a produselor.
Se considera o populatie statistica de referinta, simbolizata prin P, ce cuprinde N unitati elementare. Definim astfel populatia de referinta, prin enumerarea unitatilor elementare, sub forma:
P =
unde prin i s-a simbolizat o unitate elementara a populatiei studiate.
Se defineste astfel populatia ca un ansamblu de unitati elementare care au in comun una sau mai multe proprietati si care se supune cercetarii prin observare totala sau partiala. Populatia statistica nu desemneaza in mod obligatoriu persoane, putand fi constituita in aceeasi masura si din gospodarii, produse, unitati economice, autovehicule etc.
Populatia observata reprezinta ansamblul unitatilor elementare asupra carora sunt inregistrate caracteristicile din planul cercetarii statistice. Se simbolizeaza prin:
P O =
unde
Daca n = N, atunci observarea este exhaustiva, iar in cazul n < N, avem o observatie partiala.
Pentru populatia de referinta mai sunt utilizati termeni ca: lot, colectivitatea generala, populatie totala etc.
Pentru esantion, de asemenea, se utilizeaza termeni ca: populatie de selectie, mostra, selectie sau chiar sondaj.
Sondajul se defineste ca fiind o forma de cercetarea statistica realizata pe baza unei parti reprezentative din populatia studiata. In cazul acestei forme de cercetari statistice, populatia observata constituie esantionul, ce se va simboliza prin E = iar n reprezinta volumul esantionului.
Prin sondajul statistic, in urma prelucrarii datelor esantionului, se asigura estimarea distributiei si caracteristicilor populatiei de referinta. Rezultatele obtinute asupra esantionului se vor interpreta cu mai multa precautie, dupa cum metoda de esantioane este sau nu probabilista.
Sondajul statistic, dupa scopul urmarit, este descriptiv sau analitic
Obiectivul principal al sondajului descriptiv este acela al estimarii unui anumit numar de caracteristici sau de atribute ale unei populatii. Putem mentiona in acest sens anchetele pentru determinarea ponderii somerilor in populatia activa dintr-o anumita regiune sau analiza modalitatii de cheltuire a veniturilor populatiei pentru produse alimentare, nealimentare si servicii etc.
3. Sondajele analitice sunt realizate, in general, pentru verificarea unor ipoteze statistice sau analizarea legaturii dintre diverse variabile statistice. Se poate da drept exemplu de sondaj analitic cercetarea intreprinsa asupra unui esantion pentru stabilirea unei legaturi intre aparitia unei boli in randul populatiei si regiunea geografica in care locuieste populatia respectiva. De cele mai multe ori, in cadrul unui sondaj se regasesc, intr-o masura mai mare sau mai mica, atat caracteristici ale sondajului descriptiv, cat si cele ale celui analitic.
In cazul sondajului, de regula, prin eroare se intelege diferenta (abaterea) dintre indicatorul calculat pe baza esantionului si valoarea reala a indicatorului determinabila la nivelul populatiei de referinta. In cazul sondajului se impune deci analiza "preciziei", care este marimea abaterii dintre estimator si indicatorul estimat pentru populatia de referinta. In cadrul sondajului se intalnesc doua tipuri de erori:
erorile de observare sunt prezente in egala masura atat in observarile partiale, cat si in observarile exhaustive, din cele mai diverse cauze. Aceste erori pot preveni deveni datorita dificultatilor intalnite in construirea si actualizarea bazei de sondaj sau a confuziilor generate prin maniera de formulare a intrebarilor in cadrul chestionarelor elaborate. De altfel, in cadrul sondajelor are loc reducerea acestei categorii de erori.
eroarea de esantionare se datoreaza observarii numai a unei parti din populatie, in locul unei observari exhaustive
Marimea acestei erori este data de o multitudine de factori. Se observa, de exemplu, ca eroarea de esantionare de diminueaza, in general, in masura in care marimea esantionului creste, deoarece sondajul se fundamenteaza pe legea numerelor mari, care garanteaza o precizie acceptabila a rezultatelor numai in masura in care esantioanele sunt suficient de mari.
Marimea esantionului nu este singurul element care influenteaza eroarea de esantionare, aceasta fiind determinata in egala masura si de gradul de variatie a caracteristicilor studiate, de planul de esantionare utilizat si de metodele de estimare a parametrilor. Intr-o masura considerabila, eroarea de esantionare este determinata si de caracteristicile populatiei de referinta din care se extrage esantionul. Metoda sondajului se aplica numai in masura in care populatia de referinta este suficient de mare, iar unitatile elementare care o compun sunt suficient de omogene. In caz contrar, se va proceda la o observare exhaustiva.
2. Tipuri de sondaj. metode de formare a esantionului
In practica statistica, dupa procedeul utilizat in construirea esantionului, distingem doua categorii de sondaje: nealeatoare si aleatoare sau probabilistice. Fiecare din aceste doua tipuri cuprind anumite forme concrete de utilizare practica.
In cadrul sondajelor aleatoare sunt incluse acele procedee bazate pe metode de construire a esantioanelor in care legatura unitatilor din populatie se face in mod aleatoriu, fiecare unitate avand o probabilitate cunoscuta si diferita de zero de a accede in cadrul esantionului. Se pot utiliza nenumarate metode probabiliste sau neprobabiliste, alegerea fiind dictata de cele mai multe ori de argumente practice.
Esantioanele nealeatoare se bazeaza pe alegerea judicioasa a unitatilor, utilizand informatii cunoscute asupra populatiei supuse analizei. Se utilizeaza, intrucat sunt mai putin costisitoare si mult mai practice, dar in comparatie cu metodele de esantionare probabilista sunt mai putin exacte.
3. Metode de formare a esantionului
3.1. Metode aleatoare de esantionare
In cadrul acestor metode, fiecare unitate elementara din populatia de referinta are o anumita probabilitate, de a fi inclusa in esantion, ce este cunoscuta apriori.
Utilizand o metoda probabilista in generarea unui esantion, eroarea de esantionare este in general mai mica decat intr-o esantionare neprobabilista. Pentru esantioanele generate prin aceste metode se poate calcula marimea erorii de esantionare pentru fiecare estimator.
Dupa forma de prezentare a populatiei, se pot utiliza mai multe metode de esantionare probabiliste. In cadrul aceluiasi plan de esantionare exista posibilitatea utilizarii a uneia sau mai multe metode, care fac obiectul prezentarii urmatoare.
Esantionarea aleatoare simpla
Pentru esantionarea aleatoare simpla fiecare unitate elementara a populatiei are o anumita probabilitate nenula de a fi inclusa in esantion. Vom avea
esantionarea aleatoare simpla cu intoarcere (schema bilei revenite);
esantionarea aleatoare simpla fara intoarcere (schema bilei nerevenite).
Prin aceste metode, construirea esantionului se efectueaza prin extragerea succesiva a unitatilor.
Figura 1. Esantionarea aleatoare simpla fara intoarcere
In esantionarea aleatoare simpla cu intoarcere (procedeul bilei revenite) cele n extrageri sunt independente, compozitia urnei ramanand aceeasi pe tot parcursul procesului de constituire a esantionului. Prin utilizarea metodei in discutie, la fiecare extragere probabilitatea de a retine in esantion o unitate elementara este constanta si este egala cu fractia n/N. Prin aceasta metoda o unitate poate fi inclusa de mai multe ori in esantion. Datorita schemei probabiliste pe care se bazeaza se mai numeste si esantionare binominala.
Figura 2. Esantionarea aleatoare simpla cu intoarcere
Pentru o esantionare simpla fara intoarcere, urna ce defineste populatia de referinta isi schimba compozitia de la o extragere la alta. Procesul de constituire a esantionului nu mai este definit de evenimente independente, ca in prima varianta, probabilitatea de extragere a unei unitati in pasul k fiind data de fractia:
O unitate poate fi inclusa in esantion o singura data.
Daca dimensiunea populatiei de referinta este suficient de mare, cele doua metode dau rezultate aproximativ identice. Metoda esantionarii fara intoarcere ofera rezultate mai precise, precum si avantaje majore din punct de vedere operational.
Selectia unitatilor pe baza unei din cele doua metode se bazeaza pe existenta unor baze de sondaj, sub forma unor liste, in care fiecare unitate elementara are un anumit numar de ordine. Forma cea mai des intalnita de selectare a unitatilor pe baza acestor liste este data de utilizarea tabelelor de numere aleatoare.
Isi gasesc o larga aplicare in construirea unui esantion aleatoriu si se utilizeaza daca exista o baza de sondaj, iar fiecare unitate din populatia de referinta se poate identifica printr-un numar.
Tabelele de numere aleatoare se construiesc pe baza succesiunilor de cifre de la 0 la 9, care se extrag la intamplare cu probabilitati egale. Se considera adesea in practica drept numere aleatoare realizarile unei variabile aleatoare continue uniforme pe intervalul Numerele generate astfel se numesc pseudoaleatoare.
S-au construit diverse tabele, care sunt mai mult sau mai putin utilizabile dintre care amintim: tabelele lui Kendall si Smith, tabelele Rand Corporation, tabelele lui Yulle etc.
Datorita dimensiunilor, aceste tabele sunt greu de utilizat manual si de aceea se prefera generarea numerelor pseudoaleatoare, folosind diverse procedee, prin intermediul calculatoarelor.
Metodele cele mai des utilizate sunt cele bazate pe definirea unei relatii de recurenta. Dezavantajul major al acestor metode este ca duc, dupa un anumit numar de pasi, la generarea de siruri periodice. Putem aminti, in acest sens, metoda lui J. Von Neumann si metoda lui Lehmer.
Vom prezenta in cele ce urmeaza diverse metode de generare a esantioanelor pe baza numerelor aleatoare.
Exemplu: Consideram N = 90 si volumul esantionului n = 9. Dintr-un tabel de numere intamplatoare se extrage numarul (succesiunea de cifre):
Se vor citi numerele pe grupe de cate doua cifre si se vor pastra numai cel care au valoarea mai mica sau cel mult egala cu 90, iar cele care apar de mai multe ori vor fi retinute o singura data:
S-a preferat esantionarea simpla fara intoarcere. Daca se utilizeaza o esantionare simpla cu intoarcere, atunci numarul 03 apare de doua ori si nu va aparea atunci in esantion unitatea cu indicativul 16, intrucat se retin numai 9 numere si coloana 21, citind in mod succesiv de sus in jos numerele definite de pe fiecare linie si succesiunea de cifre din coloanele 21, 22 si 23. Se gasesc numerele:
In sirul numerelor au fost pastrate numai cele care sunt mai mici ca 500, astfel ca in esantion vor fi incluse unitatile cu indicativele urmatoare:
Un asemenea procedeu de esantionare se utilizeaza numai in cazul in care volumul esantionului este mic, iar populatia de referinta permite inscrierea unitatilor pe liste pentru atribuirea unui numar de identificare.
Includerea unitatilor din populatie in esantion se face pe baza unei progresii aritmetice, alegand un numar de la care se realizeaza construirea progresiei. Ratia progresiei se numeste pas de numarare si se determina pe baza relatiei:
Deci, construirea unui esantion prim metoda sistemica se realizeaza prin intermediul a doua elemente:
pasul de sondaj sau de numarare (k);
punctul de plecare ales (x), unde .
Se poate scrie, in acest caz, esantionul sub forma:
.
Exemplul 1.: Daca se considera o populatie de 380 de unitati si se doreste un esantion format din 15 unitati, folosind acest procedeu parcurgem urmatoarele etape:
Se calculeaza pasul de sondaj, obtinand .
Se alege punctul de plecarea de la unitatile de la 1 la 25, in mod aleator.
Presupunem ca acesta este 10 si se poate determina pe baza tragerii la sorti sau utilizand un tabel de numere aleatoare.
Se determina unitatile din esantion:
S-a obtinut un
esantion cu 16 unitati, intrucat, cum raportul , s-a preferat o valoare intreaga mai mica decat
valoarea reala obtinuta. Daca se alege
k = 26, adica numarul intreg imediat urmator valorii reale a
raportului, volumul esantionului era de numai 14 unitati. Din
acest motiv, se prefera prima varianta, care ofera
esantioane de volum mai mare.
Esantionarea stratificata
Metodele de esantionare descrise pana acum s-au fundamentat pe alegerea aleatoare a esantionului pe baza listelor ce cuprind unitatile populatiei de referinta. Pentru imbunatatirea calitatii esantioanelor construite se pot utiliza si alte informatii cunoscute apriori despre populatia de referinta. Utilizarea acestor informatii duce la imbunatatirea calitatii estimatorilor obtinuti. Una din aceste metode este cea bazata pe impartirea in prealabil a populatiei pe straturi, dupa unul sau mai multe criterii, pentru a asigura cresterea sansei de obtinere a unor esantioane reprezentative.
Aplicarea esantionarii stratificate, in cazul stratificarii populatiei dupa un criteriu, se bazeaza pe descompunerea variantei totale in varianta datorata dispersiei in interiorul claselor (straturilor) si cea dintre straturile constituite.
= +
se
utilizeaza pentru
esantionarea simpla
si sistematica se
utilizeaza pentru
esantionarea stratificata
Figura 3.
Descompunerea variantei pe factori
Intrucat , esantionarea stratificata ofera rezultate mai bune decat esantionarea simpla sau sistematica. Cresterea eficientei este cu atat mai mare cu cat populatia de referinta este neomogena si permite construirea de clase tipice.
Procedeul de esantionare se desfasoara in urmatoarele etape:
Se repartizeaza volumul esantionului pe straturi, avand in vedere criteriile dupa care s-a realizat stratificarea. Pentru fiecare strat, se genereaza aleatoriu unitatile care se includ in esantion.
Stratificarea apriori, care utilizeaza diferite informatii statistice suplimentare obtinute dupa stratificarea anterioara, pentru optimizarea acesteia.
Definirea straturilor
Se definesc variabilele de control prin intermediul carora se stabilesc straturile. In functie de calitatea variabilelor de control se poate asigura o omogenitate mai mare a straturilor pentru caracteristicile (variabilele) esentiale in studiul fenomenului considerat.
La construirea unui esantion se poate opta pentru stratificarea populatiei pe unul sau mai multe niveluri in functie de cerintele cercetarii si de modul de organizare a populatiei, precum si de caracteristicile unitatilor elementare.
Fie variabila de control X pentru care definim clasele de valori , unde k reprezinta numarul de clase. Atunci structura populatiei de referinta se poate realiza utilizand straturile , unde:
.
Straturile de mai sus satisfac urmatoarele doua proprietati
1)
2) .
In virtutea acestor doua proprietati, o unitate elementara trebuie sa apartina unuia si numai unuia din straturile definite. Daca clasele (straturile) satisfac cele doua proprietati, se spune ca sunt bine definite.
Alegerea numarului de clase se face in functie de marimea si natura populatiei, in practica considerand ca foarte rar pentru un anumit criteriu de clasificare se constituie mai mult de sapte sau opt straturi.
Pentru stratificarea unei populatii se pot utiliza criterii dintre cele mai diverse: geografice, organizatorice, profilul activitatii, marimea unitatilor dupa anumite proprietati (numarul de angajati, nivelul productivitatii) etc.
Un element important in marirea eficientei estimatorilor statistici il reprezinta modul in care se repartizeaza volumul esantionului de straturi.
Daca reprezinta numarul unitatilor din esantion care se gasesc in stratul , atunci: .
Se utilizeaza, in acest sens, repartizarea proportionala si optima a unitatilor din esantion pe straturi.
In cazul repartizarii proportionale, partea din esantion care se atribuie fiecarui strat este direct proportionala cu numarul total de unitati din stratul considerat
Notam, in acest sens, proportia numarului de unitati din straturile considerate prin: P1, P2, ., Pi, ., Pk unde evident , iar . S-a notat prin numarul de unitati din populatia de referinta, din stratul , iar .
In cazul repartizarii proportionale, numarul de unitati din fiecare strat, ce sunt incluse in esantion, se defineste prin:
Se asigura ca ponderea numarului de unitati ale fiecarui strat din esantion este egala cu ponderea numarului de unitati din stratul respectiv in ansamblul populatiei.
Repartizarea proportionala considera drept criteriu de clasificare numai volumul fiecarui strat, fara a tine seama si de gradul de variabilitate din fiecare strat. Tocmai de acest element tine seama repartizarea optima pe care o prezentam in cele ce urmeaza
Pentru aplicarea acestui procedeu de repartizare a esantionului se va dispune de ponderea fiecarui strat in volumul total al populatiei, precum si de varianta fiecarui strat. Aceasta metoda se recomanda sa se aplice in situatia in care straturile au grade de dispersare diferite. Daca toate straturile au aceeasi variabilitate, ceea ce rezulta din egalitatea variantelor straturilor, atunci rezultatele oferite de repartizarea optima sunt identice cu aplicarea procedeului repartizarii proportionale.
Se noteaza cu abaterea standard a unitatilor din stratul , iar unitatile din esantion ce se repartizeaza acestui strat se calculeaza dupa relatia:
Numarul astfel determinat este direct proportional cu volumul stratului si invers proportional cu omogenitatea acestuia.
Exista si alte metode de repartizare neproportionala (in raport cu distributia frecventelor pe grupe) a volumului unui esantion. Se utilizeaza in acest sens metoda de repartizare proportionala cu valorile variabilei X, caz in care se realizeaza o repartizare proportionala, dar nu in raport cu numarul unitatilor stratului (cu proportia stratului), ci dupa variabila X.
Se aplica in cazul in care repartizarea volumului global al variabilei X pe straturi difera semnificativ de repartizarea numarului de unitati pe straturi, iar variabila X are un rol aparte in studierea fenomenului considerat.
Prin acest procedeu unitatile din populatie nu mai au aceeasi probabilitate de a fin incluse in esantion, ci aceasta probabilitate difera de la o unitate la alta, dar pentru fiecare este diferita de zero.
Esantionarea cu probabilitati inegale
Esantionarile prezentate s-au fundamentat pe egalitatea probabilitatilor unitatilor de a accede in populatia observata (esantion). Astfel, daca o populatie are in cadrul sau N unitati elementare , atunci probabilitatea ca o unitate oarecare sa fie inclusa in esantion este:
In cazul acestor esantionari, probabilitatile:
satisfac urmatoarele proprietati:
1)
2) in general,
3)
Esantionarea cu probabilitati inegale se recomanda atunci cand unitatile populatiei, in raport cu una sau mai multe caracteristici au valori ce difera semnificativ, iar aplicarea esantionarii cu probabilitati egale duce la o eficienta scazuta a estimatiilor facute.
Exemplul 2.: Consideram ca numarul de vanzatori si volumul vanzarilor unui produs intr-o perioada de timp se prezinta, pentru cinci puncte de vanzare, prin seriile paralele de inregistrare in tabelul 1.:
Tabelul 1.
Punctul de vanzare |
Numarul de angajati (persoane) |
Volumul vanzarilor (produse) |
Total |
Pentru simplificarea calculelor vom considera numai esantioane formate dintr-o singura unitate (exemplu ipotetic).
Volumul total al desfacerilor, pe ansamblul populatiei este de 2000 de produse. Folosind diverse procedee se va determina un estimator al acestuia, utilizand un esantion.
a. In cazul sondajului simplu cu probabilitati egale, pentru un esantion format dintr-o unitate, rezultatele sunt prezentate in tabelul 2.:
Tabelul 2.
Unitatea din esantion |
Vanzari |
Estimatorul vanzarilor totale |
|
(produse) |
|||
100 x 5 = 500 |
|||
|
240 x 5 = 1200 |
||
|
159 x 5 = 795 |
||
461 x 5 = 2305 |
|||
1040 x 5 = 5200 |
|||
Total |
In acest caz, media estimatorilor vanzarilor totale este:
ceea ce arata ca avem un estimator nedeplasat al volumului mediu al desfacerilor.
b. Din exemplul de mai sus se observa ca, daca nu tinem seama in construirea esantioanelor de dimensiunea fiecarei unitati in raport de angajati, rezultatele nu sunt din cele mai bune. Astfel, asa cum reiese si din tabelul 2. estimatorii obtinuti pentru cele cinci esantioane difera semnificativ. In cazul in care variabilele sunt corelate, daca de exemplu, unitatea a patra are din numarul total de angajati, este firesc ca aceasta sa reprezinte in aceeasi proportie si contributia din numarul total al vanzarilor estimate produse. Estimatorii obtinuti pentru cele cinci esantioane sunt trecuti in tabelul 3.
Tabelul 3.
Esantionul |
Numarul de angajati (persoane) |
Vanzari |
Estimatorul vanzarilor totale |
(produse) |
|||
|
|||
|
|||
|
|||
|
|||
|
|||
Total |
In acest caz,
Se constata
ca, pentru fiecare esantion estimatorii detinuti sunt
foarte apropiati de valoarea reala. Daca la sondajul simplu
estimatorii erau cuprinsi intr-un interval real cu lungimea egala cu
5200-500 = 4700 de produse, prin aceasta varianta lungimea
intervalului de variatie a estimatorilor este de numai
2120-1844 = 276 produse. Astfel, daca volumul vanzarilor este
proportional cu numarul de angajati, atunci orice esantion
va da aceeasi estimatie a vanzarilor totale.
Cu toate ca estimatorii obtinuti si prezentati in ultima coloana a tabelului sunt foarte apropiati de valoarea reala, totusi estimatorul este deplasat, intrucat:
In varianta specificata, rezultatele obtinute au tendinta de a subestima valoarea reala a indicatorului. Se poate obtine si un estimator nedeplasat daca probabilitatile de selectie a unitatilor se stabilesc in raport cu o variabila-cauza a carei valoare se estimeaza. In acest sens, fiecare esantion are o anumita probabilitate de a fi generat, determinata de probabilitatile cu care se includ unitatile de esantion. Pentru exemplul considerat, calculele sunt prezentate in tabelul 4.
Tabelul 4.
Esantionul |
Estimatorul vanzarilor totale (produse) |
Probabilitatea de generare a esantionului |
Total |
In varianta aceasta se obtine un estimator nedeplasat, intrucat:
Aceasta metoda se aplica daca intre cele doua variabile exista o legatura directa si o buna masurare a valorilor variabile ce definesc marimea (importanta) unitatilor.
Se deosebeste de esantioanele prezentate pana acum, in care unitatile elementare erau extrase una cate una, prin faptul ca in acest caz se extrag grupuri de unitati eterogene care se numesc grappe sau pachete de serii.
Definim o "grappe" sau un pachet printr-un ansamblu de unitati elementare.
Aceasta esantionare se utilizeaza in cazul in care populatia studiata se prezinta sub forma unei ierarhii. Putem da ca exemplu structurarea pe patru niveluri a locuitorilor unui judet potrivit schemei din figura de mai jos.
Astfel, ansamblul persoanelor care locuiesc in aceeasi locuinta constituie o "grappe" de unitati (persoane) si se afla pe primul nivel de agregare; imobilul este o "grappe" de locuinte si se obtine prin agregarea locuintelor din acelasi sat, deci ansamblul gospodariilor din acelasi sat; zona pedoclimatica este o "grappe" de sate care se afla in acelasi teritoriu administrativ.
Aceasta metoda de esantionare este mult mai simplu de aplicat si reduce cu mult complexitatea bazei de sondaj. Se inlocuieste astfel o lista de persoane, pentru exemplul considerat, cu o lista de locuinte, de sate si zone pentru care modificarile care intervin in timp sunt mai putin frecvente decat in cazul listei de persoane.
P
Nivelul 0 = judet
Nivelul 1= tona pedoclimatica
.
Nivelul 2 = sat
. . .
Nivelul 3 = locuinte
. . .
Un alt avantaj major este reducerea costului de culegere a datelor, intrucat aceasta metoda asigura constituirea esantionului din grupe compacte de unitati. Forma de generare a esantionului reduce in mod simtitor deplasarile in teren, asigura o mai buna supervizare a culegerii datelor, urmarirea non-raspunsurilor etc.
De cele mai multe ori, esantionarea pe "grappe" asigura estimatori mai putin precisi decat esantionarile elementare, dar avantajele prezentate mai sus o impun in practica statistica.
In practica statistica sunt folosite mai multe tipuri de esantioane, ca de exemplu:
Esantionarea in mai multe trepte
Este o metoda de esantionare care se desfasoara in mai multe etape succesive si se aplica tot pentru o populatie care este organizata ierarhic, pe mai multe niveluri. Se constituie astfel pentru fiecare nivel una sau mai multe baze de sondaj, cuprinzand unitatile elementare corespunzatoare de pe nivelul imediat urmator
In prima etapa se aleg unitatile din primul nivel sau treapta. Alegerea acestora poate sa fie exhaustiva, pe baza unor selectii aleatoare sau pseudoaleatoare. Unitatile alese se numesc unitati primare.
In etapa a doua, pentru unitatile alese in prima etapa sa se dispuna de baza de sondaj, in temeiul careia vor fi alese unitatile in aceasta etapa. Astfel, avem o dispunere in cascada a bazelor de sondaj, incat unitatile alese intr-o etapa formeaza o baza pentru nivelul urmator de esantionare. Unitatile din al doilea nivel se numesc unitati secundare. Pentru fiecare nivel, includerea unitatilor elementare trebuie sa se faca respectand principiul complitudinii si complementaritatii.
A. Extragerea unitatilor primare cu probabilitati egale
Consideram o populatie de referinta structurata ierarhic pe k niveluri. Pentru fiecare nivel, probabilitatea de extragere a unei unitati este .
Fiecare unitate de pe ultimul nivel are aceeasi sansa de a fi inclusa in esantion, probabilitatea fiind egala cu:
B. Extragerea de unitati primare cu probabilitati neegale
In acest caz, populatia este structurata pe baza unei ierarhii ce cuprinde unitati primare. Probabilitatea de extragere a unei anumite unitati este direct proportionala cu numarul de unitati de pe nivelul imediat urmator de agregare.
Esantionarea in mai multe faze
Reprezinta o generalizare a esantionarii stratificate (tipice) si se utilizeaza din cel putin urmatoarele considerente:
Prin modul de organizare duce la cresterea operativitatii si reducerea cheltuielilor cu colectarea informatiilor statistice;
De la o faza la alta are loc reducere a numarului de unitati pe esantion, dar cresc corespunzator obiectivele pe care le propune cercetarea;
Cand nu exista date care sa asigure stratificarea populatiei, prin modul de desfasurare, esantionarea in mai multe faze poate fi asimilata cu o stratificare aposteori care stratifica un esantion si nu intreaga populatie. Se culeg astfel informatii asupra unui esantion preliminar, fie simultan, fie ulterior, despre subesantion extras din esantionul initial.
Intre subesantioanele generate si populatia de referinta exista relatia de incluziune:
,
unde prin p s-a definit numarul de faze. Daca se noteaza prin volumul fiecarui esantion, iar prin N volumul populatiei de referinta, atunci se verifica relatia de ordine:
.
3.2. Metode nealeatoare de esantionare
Caracteristica principala a acestor metode este data de alegerea judicioasa a unitatilor din esantion, astfel incat aceasta sa fie cat mai aproape de caracteristicile esentiale ale populatiei din care se extrage.
In esantionarea neprobabilista se presupune o repartitie uniforma sau aleatoare a caracteristicilor populatiei.
Cum unitatile sunt incluse in esantion dupa o maniera arbitrara, dar avand la baza o alegere rationala, in cadrul acestor metode de esantionare nu se poate estima probabilitatea ca un element sa figureze in esantion. Mai mult, nimeni nu ne poate asigura ca toate elementele primare au sansa de a fi incluse in esantion. Nu este posibila estimarea variantei si nici calcularea deplasarii estimatorilor in raport cu indicatorii populatiei de referinta.
Cum exactitatea rezultatelor nu poate fi masurata, singurul mod de a evalua calitatea datelor din ancheta este de a compara aceste rezultate cu datele existente asupra populatiei observate, dar intotdeauna nimic nu poate proba ca estimatorii se vor comporta la nivelul erorilor acceptabile.
Daca populatia de referinta este omogena, atunci metodele neprobabiliste ne pot oferi rezultate acceptabile, constituind un instrument util de cercetare statistica.
Principalele tipuri de metode neprobabiliste utilizate in practica statistica sunt:
Esantionarea la intamplare
Esantioanele de voluntari
Esantioanele dirijate
Esantioanele prin metoda cotelor
Esantionarea la intamplare
Se utilizeaza cu rezultate bune daca populatia de referinta este omogena. In cadrul acestei metode, rezultatele obtinute sunt puternic afectate de intuitia operatorilor de ancheta in asigurarea reprezentativitatii esantionului. Metoda se practica in cele mai diverse domenii si prezinta ca principal avantaj un inalt grad de operativitate.
Exemplul 3.:
a) Cazul tipic este ancheta de sondare a opiniei publice intr-o anumita problema de actualitate.
b) Un alt caz este cel din domeniul ecologic, in care cercetarea partiala se utilizeaza pentru evaluarea concentratiei de substante poluante dintr-un loc sau din atmosfera unei localitati. Daca compozitia apei sau a aerului este omogena, va trebui ca toate esantioanele care se utilizeaza sa dea rezultate sensibil asemanatoare.
Pentru un asemenea mod de investigatie, se recomanda ca rezultatele sa fie privite cu precautie, intrucat acestea sunt puternic afectate de operatorii care asigura culegerea datelor. Totusi daca sunt respectate cateva conditii minime privind asigurarea caracterului "aleator" in constituirea esantionului, rezultatele obtinute sunt suficient de reprezentative.
Esantioanele de voluntari
Aceasta forma de esantionare se utilizeaza cu precadere in cercetarile psihologice sau medicale, dar tot asa de bine si in studii de marketing. Includerea in esantion a persoanelor nu se realizeaza la intamplare, ci pe baza optiunii voluntare a acestora de a face parte din esantion. De cele mai multe ori, cercetarea statistica pe baza unui esantion de voluntari este de durata si necesita o exigenta deosebita.
Esantioanele dirijate
Dupa cum indica si numele, esantioanele dirijate, presupun alegerea unitatilor in functie de anumite judecati asupra compozitiei populatiei de referinta
De cele mai multe ori se utilizeaza in studiile preliminare asupra unui fenomen.
Aceasta maniera de alegere dirijata a unitatilor esantionului determina costuri reduse, precum si un inalt grad de operativitate. In acelasi timp, cum alegerea unitatilor incluse in esantion este pseudoaleatoare, esantioanele generate pot prezenta deplasari semnificative ale indicatorilor calculati fata de valorile populatiei de referinta. Aceasta deplasare este cu atat mai pronuntata, cu cat se are in vedere, de obicei, tendinta de a elimina unitatile "extreme" din populatia de referinta si a retine numai unitatile "tipice".
Esantioanele prin metoda cotelor
Reprezinta forma de esantionare cel mai des utilizata in anchetele socio-economice. Aceasta metoda de esantionare, bazata in ultima instanta pe o alegere rationala a unitatilor din esantion, da rezultate suficient de bune in anchetele opinie la nivel national.
Asimilarea acestora cu o metoda aleatoare se realizeaza in masura in care frecventele relativ definite in cadrul populatiei, pentru anumite caracteristici, pot fi interpretate ca probabilitati. Aceasta echivalenta se realizeaza in masura in care volumul populatiei de referinta este suficient de mare pentru a da posibilitatea aplicarii legii numerelor mari.
Avantajele metodei
Vor fi prezentate avantajele majore ale acestei metode ce au determinat utilizarea esantionarii pe cote:
Metoda pe cote, datorita desfasurarii, este in general mai putin costisitoare decat o metoda probabilista de esantionare.
Datorita informatiilor cerute, este mai practica, fiindca evita utilizarea unor liste ce sunt greu de procurat sau care nu sunt actualizate. Se asigura o culegere rapida a informatiilor cerute.
Esantionarea prin metoda cotelor se poate realiza chiar daca nu exista o baza de sondaj, cu precadere in ultimele etape ale procesului de agregare. Astfel, se asigura utilizarea metodei si in cazul cand institutia care realizeaza ancheta, din ratiuni privind secretul investigatiei in curs, nu are acces la informatiile necesare.
Dezavantajele metodei
Aceasta metoda nu permite evaluarea erorilor de esantionare, neexistand posibilitatea de a calcula precizia estimatorilor plecand de la rezultatele obtinute asupra esantionului. Este o consecinta imediata a faptului ca in definirea esantionului intervine in mod direct intuitia anchetatorilor in alegerea unitatilor. Astfel, nu se poate cunoaste aprioric probabilitatea ca o unitate elementara din populatia de referinta sa faca parte din esantion. Din acest considerent nu putem calcula pentru un estimator marimea erorii.
Metoda pe cote are o fundamentare teoretica facila, asigurarea reprezentativitatii bazandu-se pe urmatoarele elemente: masura in care caracteristicile de control, pe baza carora se asigura reprezentativitatea, sunt semnificative pentru studiul intreprins si pentru definirea populatiei de referinta; informatiile asupra caracteristicilor de control din populatia de referinta sunt exacte; masura in care anchetatorii nu-si impun o anumita tendinta proprie in selectarea unitatilor, alegand de cele mai multe ori, pentru interogare, persoane din mediul social, din care fac parte.
Cu toate acestea, se impune esantionarea pe cote in cercetarile in care se cere operativitate s nu o inalta precizie a rezultatelor obtinute.
Variabilele de control
Metoda pe cote se bazeaza pe definirea structurilor populatiei dupa diferite caracteristici, sub ipoteza de corelare a acestora. Astfel, pentru fiecare caracteristica, structura esantionului trebuie sa fie identica cu structura populatiei de referinta, asigurand astfel o premisa de baza pentru a genera o mare apropiere intre populatie si esantion in ceea ce priveste distributia dupa ansamblul caracteristicilor considerate.
Se definesc variabilele de control ca fiind ansamblul caracteristicilor retinute pentru a asigura identitatea dintre esantion si populatia de referinta. Variabilele de control de stabilesc in functie de tipul populatiei si de cerintele studiului intreprins.
Identificarea variabilelor de control se face dupa un anumit studiu amanuntit, luand in analiza criterii de ordin teoretic si practic, enumerate dupa cum urmeaza:
Se va tine seama de scopul studiului intreprins, dupa care se definesc variabilele pe baza intreprinderilor incluse in chestionarul anchetei. Astfel, se asigura o legatura stransa intre variabilele de control ce definesc cotele si variabilele studiate.
Se vor stabili acele variabile de control pentru care se pot defini o distributie statistica pentru populatia de referinta, utilizand informatii disponibile.
Vor fi alese acele variabile de control, astfel incat operatorul de teren sa aiba o implicare cat mai mica in asigurarea reprezentativitatii. Se vor stabili acele variabile are admit o definire clara a distributiei, fara a exista riscul unei interpretari excesive din partea operatorului sau a persoanei investigate. De exemplu, nu se recomanda utilizarea drept variabila de control a veniturilor obtinute de o persoana sau o familie in construirea unui esantion.
Politica de confidentialitate |
.com | Copyright ©
2024 - Toate drepturile rezervate. Toate documentele au caracter informativ cu scop educational. |
Personaje din literatura |
Baltagul – caracterizarea personajelor |
Caracterizare Alexandru Lapusneanul |
Caracterizarea lui Gavilescu |
Caracterizarea personajelor negative din basmul |
Tehnica si mecanica |
Cuplaje - definitii. notatii. exemple. repere istorice. |
Actionare macara |
Reprezentarea si cotarea filetelor |
Geografie |
Turismul pe terra |
Vulcanii Și mediul |
Padurile pe terra si industrializarea lemnului |
Termeni si conditii |
Contact |
Creeaza si tu |