Criterii de clasificare
O clasificare traditionala a intrebarilor dupa continutul informatiei vizate este cea care distinge trei mari categorii: intrebari factuale, de opinie si de cunostinte.
In cazul intrebarilor factuale, informatia priveste elemente de comportament ale indivizilor anchetati, ale semenilor din jurul lor sau situatii ce caracterizeaza viata subiectilor sau a comunitatilor in care traiesc. In principiu, toate aceste aspecte se materializeaza in fapte comportamentale sau situationale si ar putea fi inregistrate prin metoda observatiei, daca o asemenea investigare n-ar presupune eforturi extrem de mari. Cate seriale a urmarit omul in ultima saptamana la televizor, la ce ora s-a sculat in dimineata zilei respective, cati bani cheltuie familia pe luna cu hrana, unde si-a petrecut concediu, la ce varsta a avut primul contact sexual etc. iata cateva mostre de indicatori cu un clar continut factual, dintr-o gama extrem de ampla si de diversa, ce conduc la intrebari intalnite in orice chestionar. Se vede deci ca raspunsul la aceste intrebari poate fi judecat in termeni de adevarat sau fals, intrucat ele se refera la o situatie obiectiva si verificabila prin alte mijloace.
Continutul intrebarilor de opinie vizeaza aspecte ce tin de universul interior al individului, cum ar fi parerile, atitudinile, credintele, asteptarile, proiectarea in viitor, evaluarile, atasamentul fata de valori, explicatiile fenomenelor din jurul sau, justificarile si motivatia actiunilor etc. Termenul de opinie este luat intr-un sens mult mai larg decat cel in care se foloseste in mod curent. Caracteristicile informatiei continuta in raspunsul la aceste intrebari este faptul ca ea nu poate fi obtinuta in mod direct prin alte metode decat cele ce fac apel la comunicarea verbala cu subiectii si, deci, ca verificarea celor afirmate de acestia este o intreprindere dificila, posibil (uneori) de realizat doar prin metode indirecte.
"De ce"-ul?
Exista intrebari care vizeaza obtinerea unor explicatii de la intervievatii insisi, in legatura cu opiniile sau conduita lor. Insa in acest caz, trebuie sa se tina seama de diferitele acceptiuni ale intrebarii de tipul "de ce?" care poate atrage raspunsuri continand informatii foarte variate.
"De ce-ul", care ar parea cercetatorului novice un mijloc foarte simplu de a obtine o explicatie din partea anchetatului, este un exemplu reusit al necesitatii unei conceptualizari nascute din obiectivele anchetei si din adaptarea intrebarilor la acestea.
P. Lazarsfeld citeaza cazul unui chestionar in care se cerea subiectilor sa spuna de ce au fost sa vada cutare film. Unul ar fi putut raspunde in termeni de dispozitie generala ( ca merge in fiecare seara la cinema); altul, dimpotriva, ar fi putut explica de ce a fost la film in acea seara: nu aveam nimic de facut sau, din intamplare, l-a invitat un amic. Iar altii ar fi putut declara ca au citit un articol elogios despre filmul respectiv etc. Intrebarea "de ce?" face ca fiecare anchetat sa evoce in raspunsul sau aspectul deciziei care i-a venit mai intai in minte. El insusi poate nu este constient de adevaratul motiv care l-a determinat sa actioneze.
Asadar, intrebarea "de ce?" nu este buna, deoarece capata raspunsuri cu un continut prea variat, datorate unor ratiuni diferite, dificile de clasificat pentru anchetator. Intreband pur si simplu "de ce?" riscam sa obtinem prea des un soi de justificare a deciziei sau opiniei, decat o analiza.
Daca vrem sa ramanem la un nivel de explicatie mai superficial decat adevaratul studiu de motivatie, este mai prudent sa intrebi:"Cum ati fost determinat sa.?", "Cum ati ajuns la.?", fapt ce inclina raspunsurile spre o cauza mai exterioara.
Al treilea tip de intrebari, anume intrebarile de cunostinte, au si ele un specific foarte clar, ce nu permite nici o confuzie cu celelalte, in speta cele factuale, cu care par a se asemana. O intrebare de genul:
Unde este inmormantat Mihai Eminescu ?
nu are drept scop sa ne furnizeze o informatie necesara sporirii cunostintelor noastre despre poetul national, ci una care sa ne ajute sa caracterizam persoana anchetata. Rostul acestor intrebari - evident de aceeasi natura cu cele folosite in orice situatie de examen - nu este, pentru sociolog, in primul rand, acela de a masura in mod cat mai corect nivelul cunostintelor oamenilor intr-un domeniu oarecare. Ele evidentiaza preocuparile intelectuale ale indivizilor in anumite domenii, ca urmare a unor interese sau a unor situatii de viata specifice. Aplicand, de exemplu, recrutilor un chestionar cu intrebari de cunostinte din domeniul diferitelor obiecte studiate in treptele scolare obligatorii, vom putea sa evaluam calitatea invatamantului general. De asemenea, prin intermediul unor intrebari de cunostinte, putem evalua interesul oamenilor pentru anumite domenii ale artei si, chiar despre sistemul lor de valori, credinte, atitudini etc. Intrebarile de cunostinte pot furniza informatii si despre anumite comportamente, cum ar fi, de pilda, lectura scrierilor religioase ori frecventarea bisericii.
Ele pot fi utilizate si ca intrebari de control. Asa cum o arata si numele, acest gen de intrebari nu sunt adresate pentru a aduce o informatie propriu-zisa din partea respondentului, ci pentru a verifica, a controla acuratetea raspunsurilor sale la alte intrebari. Printre altele, ele pot fi folosite pentru a testa sinceritatea subiectului. In acest caz, intr-un limbaj mai tehnic, ele sunt considerate si ca "itemi de minciuna" (lie items), cel mai tare dintre acesti itemi constituindu-l chiar intrebarea ce-i cere subiectului sa spuna daca a mintit sau nu vreodata, pe care am mai invocat-o mai sus. dar si o lista de titluri fictive de carti sau de nume de autori, din care subiectul este pus sa mentioneze ceea ce a citit, constituie un indicator al onestitatii raspunsurilor sale in general.
O specie aparte de intrebari o constituie cele de motivatie, care sunt, in intelesul foarte larg intrebari de opinie, dar de o distinctivitate sporita. Relevanta lor deriva din aceea ca sondeaza o zona a subiectivitatii umane de o importanta capitala, si anume cea a universului cauzal-motivational al aprecierilor, deciziilor si actiunilor umane. Desi exista un strat motivational mai superficial si schimbator, putem vorbi si de o infrastructura motivationala mai solida si mai stabila, pe baza careia se pot face predictii comportamentale si se pot deci estima schimbari in optiunile oamenilor. Daca, bunaoara, cunoastem motivele pentru care indivizii simpatizeaza cu un partid sau cu o personalitate politica, putem anticipa mai bine ce alte partide ori personalitati ar putea intra in aprecierea acestor indivizi si/sau ce ar trebui sa faca partidele si personalitatile respective pentru ca sa se intample acest lucru.
Intrebarile de motivatie aduc, in principiu, la cunostinta cercetatorului explicatiile si interpretarile subiectului cu privire la opiniile si faptele sale, in corelatie cu starile mediului social inconjurator si cu evaluarile acestor stari, pe care individul le realizeaza necontenit. Inregistrarea raspunsurilor la respectivele intrebari necesita precautii sporite, fiind necesara consemnarea fidela a declaratiilor celor chestionati, adica utilizarea intrebarilor deschise.
Pe
de alta parte, este cat se poate de clar ca raspunsurile la
intrebari de genul:"De ce ?", "Motivati raspunsul", "Ce v-a
determinat sa ?" etc. nu trebuie luate de cercetator ca atare, ci
se impune o interpretare a lor. Aceasta, intrucat motivatia, din punctul
de vedere ce ne intereseaza aici, se structureaza pe trei paliere
principale: motivele reale, motivele constientizate de subiect
si motivele declarate de acesta
(in particular, cu ocazia anchetei sau interviului). Din mai multe cauze, intre
cele trei planuri nu exista corespondenta deplina. Cu
deosebire de
2. Dupa forma de inregistrare a raspunsurilor, se face, in principiu, o distinctie intre intrebarile inchise si cele deschise, primele fiind acelea care ofera subiectului variante de raspuns prefabricate, respondentul urmand doar sa o aleaga pe cea care se potriveste situatiei sau opiniei sale, iar celelalte reclamand inregistrarea, cat mai fidela si cat mai completa, a raspunsului dat de subiectul chestionat. In cazul anchetei si, mai ales, al sondajului de opinie, culegerea si interpretarea datelor sunt realizate din perspectiva statistica; aceasta inseamna ca prelucrarea informatiei dobandite printr-o intrebare deschisa trebuie efectuata, finalmente, in acelasi mod ca si pentru una inchisa, deci pornind de la stabilirea de categorii in care este introdus continutul raspunsurilor. Deosebirea este ca aceste categorii se stabilesc dupa efectuarea anchetei iar clasificarea raspunsurilor se face de catre cercetator, pe baza analizei textului raspunsului.
In faza de constructie a chestionarului cercetatorul trebuie sa decida, in esenta, asupra urmatoarelor doua aspecte:
daca este posibil si preferabil sa se stabileasca si sa se expliciteze dinainte categoriile de raspunsuri si, in caz afirmativ;
daca e posibil si preferabil ca subiectul sa fie cel care alege cea mai adecvata forma de rezumare a raspunsului sau, folosind grila de categorii propusa.
Cele doua intrebari combinate dau trei solutii posibile, pentru fiecare intrebare din chestionar:
a. se stabilesc a priori categoriile de raspuns si subiectul alege;
b. se stabilesc a priori categoriile de raspuns iar operatorul, in functie de raspunsul subiectului, alege varianta "potrivita";
c. se stabilesc a posteriori categoriile de raspuns, urmand a clasifica "la birou" continutul raspunsurilor.
Grafic intrebarile deschise se evidentiaza in chestionar prin aceea ca, dupa textul propriu-zis al intrebarii, apare un spatiu liber in care operatorul sau subiectul (cand e vorba de autocompletare) marcheaza raspunsul. Limitele de interventie permise operatorului sunt, de obicei, destul de reduse, lui ceradu-i-se reproducerea cat mai fidela a discursului subiectului. Doar atunci cand subiectul nu poate fi tinut in frau si el ne ofera de o maniera mult prea ampla raspunsul, este permisa inregistrarea selectiva sau rezumata.
Pentru intrebarile inchise, formele de prezentare grafica a variantelor de raspuns sunt destul de diferite. In cele mai numeroase situatii, variantele sunt asezate una sub alta, dupa textul intrebarii, si sunt numerotate. Alegerea variantei potrivite se face prin incercuirea numarului - cu functie de cod - din fata variantei respective. De regula, prin forma si fontul caracterelor, se evidentiaza in mod clar diferenta intre intrebarea propriu-zisa si variantele de raspuns.
Sistemul de variante al oricarei intrebari inchise trebuie sa satisfaca un numar de conditii elementare:
a. El trebuie sa fie complet, in sensul ca orice raspuns posibil trebuie sa-si gaseaca locul in gama variantelor prevazute.
b. El trebuie sa fie discriminatoriu, intelegand prin aceasta ca doua situatii semnificativ diferite trebuie surprinse in variante de raspuns diferite.
c. El trebuie sa fie univoc, adica unui raspuns sa-i corespunda o singura varianta dintre cele oferite.
Cel mai simplu sistem de raspuns la o intrebare inchisa este cel cu doua variante de raspuns, care, de regula, pot fi interpretate in termenii Da/Nu. Folosirea acestui gen de intrebari este posibila si la intrebarile factuale, cand se cere precizarea existentei sau inexistentei unui lucru, efectuarea unei actiuni etc., si la cele de opinie, cand subiectului i se pretinde o forma foarte transanta de exprimare a parerii: e de acord sau nu cu ceva, are o opinie favorabila sau nefavorabila in legatura cu altceva s.a.m.d. In cele mai multe cazuri insa, daca e vorba de opinii, lucrurile sunt mai complexe, evantaiul de raspunsuri formand o scala ordinala, care incearca sa surprinda gradual intensitatea unei opinii: masura in care oamenii sunt satisfacuti de un aspect al vietii lor, taria cu care cred in ceva, nuantele in aprecierea activitatii unei personalitati publice sau a unei institutii etc. Un exemplu de asemenea intrebare este urmatoarea:
Cum credeti ca veti trai peste un an ?
Mult mai bine
Ceva mai bine
Aproximativ la fel
Ceva mai prost
Mult mai prost
Exista cazuri cand cercetatorul crede intr-o capacitate de autoanaliza a subiectului superioara celei implicate de folosirea catorva cuvinte pentru a desemna starile respective. Atunci, el ii va cere acestuia sa-si plaseze opinia pe o scala abstracta, marcata cu valori numerice, semnificatie lexicala atribuindu-se doar valorilor din capete. Iata un asemenea exemplu:
Cat de multumit sunteti de salariul pe care-l primiti ?
0 1 2 3 4 5 6 7 8 9 10
Total nemultumit Total multumit
O lunga si veche dezbatere opune partizanii folosirii celor doua tipuri de intrebari. Practica cercetarii - si, in mod deosebit, extinderea sondajelor de opinie, ale caror rezultate trebuie sa apara intr-un timp foarte scurt - a facut ca, incetul cu incetul, intrebarile inchise sa ajunga net predominante, aproape in toate tipurile de anchete. Utilizarea celor deschise ramane, asa cum deja o recomanda, cu o jumatate de secol in urma, Paul Lazarsfeld, doar o chestiune ocazionata de insuficienta cunoastere a problematicii cercetate - deci in cercetari cu caracter explorativ, in anchete pilot etc. -, de necesitatea de a se completa, detalia, preciza continutul raspunsurilor unor intrebari inchise mai deosebite, de dorinta de a obtine detalii asupra motivatiilor invocate de subiecti etc.
Utilizarea atat de frecventa a intrebarilor inchise - si, nu numai in cazul sondajelor de opinie - se datoreaza unei serii de avantaje incontestabile pe care le ofera acestea. Dintre cele mai importante atuuri ale intrebarilor inchise mentionam:
a. Rapiditatea si usurinta prelucrarii rezultatelor. Este o chestiune ce nu mai necesita nici o explicatie, acest avantaj fiind decisiv atunci cand rezultatul unui sondaj trebuie transmis beneficiarului in timp de cateva zile de la data comandarii lui.
b. Usurinta completarii chestionarului, adica rapiditate si atractivitate pentru subiecti. Este un avantaj, de asemenea, extrem de puternic indeosebi in cazul anchetelor in scris, subiectului revenindu-i sarcina doar de a inconjura niste coduri sau a pune X-uri in casute, operatii ce solicita eforturi mentale si motrice mult mai reduse decat completarea unui text.
c. Precizarea continutului intrebarii, dat fiind faptul ca variantele intregesc textul ei propriu-zis.
d. Uniformitatea intrebarii si a inregistrarii raspunsurilor este avantajul de cunoastere cel mai important al intrebarilor inchise.
e. Evitarea erorilor generate de operatiile de postcodificare
f. Intrebarile inchise faciliteaza gasirea raspunsului potrivit. Avantajul deriva din cunoscuta lege a psihologiei conform careia oamenilor le este mult mai usor sa recunoasca ceva decat sa-si aminteasca si sa reproduca acel lucru. Referindu-ne la intrebarile de opinie, putem spune ca omul mai usor si mai repede se regaseste intr-un model decat sa definesca acel model ce-i este propriu.
Esenta disputei intre adeptii folosirii uneia sau alteia din cele doua categorii de intrebari :
"Partizanii folosirii intrebarilor deschise argumenteaza ca acestea permit subiectilor sa spuna ceea ce realmente exista in mintea lor, fara a fi influentati prin sugestii din partea cercetatorului, in vreme ce intrebarile inchise plaseaza subiectii intr-un evantai limitat de posibilitati de alegere. Ei considera intrebarile inchise ca fiind, in mod tipic, decontextualizate si oferind un set inchis si incomplet de optiuni de raspunsuri arbitrare, ceea ce conduce la distorsionarea raspunsurilor. Cercetatorii din zona sondajelor, pe de alta parte, cred ca intrebarile deschise tind sa furnizeze un material ce este extrem de variabil, cu o slaba fidelitate (reliability) si dificil de codificat"(W. Foddy, 1993, p.127)
Numarul si ordinea intrebarilor in chestionar.
Intrebarea referitoare la numarul optim de intrebari ce ar trebui sa formeze un chestionar, intrebare pe care orice persoana fara experienta de cercetare si-o pune sau e tentat sa o puna altora mai versati in realizarea unor astfel de studii, este, in sine, fara obiect, dat fiind ca un asemenea optim - daca exista - depinde de o serie de prea multi factori pentru a se putea discerne o regula generala. Generala este poate doar constatarea ca, de cele mai multe ori, din dorinta de a "acoperi" cat mai bine continutul conceptelor prin indicatori, tendinta cercetatorului este de a formula mai multe intrebari decat ar recomanda-o conditiile concrete de desfasurare a anchetei.
Factorii principali care fac sa intalnim, in practica, un evantai extrem de larg de tipuri de chestionare, de la cele compuse doar din cateva intrebari pana la altele ce cuprind 200-300 de intrebari sau chiar mai multe, sunt, in principal urmatorii: obiectul cercetarii (problema studiata), tipul cercetarii, finalitatea acesteia, beneficiarul rezultatelor, tehnica de ancheta, felul intrebarilor, resursele materiale de care dispune cercetatorul, calitatea si numarul operatorilor avuti la dispozitie, timpul de care se dispune si genul de populatie careia i se adreseaza chestionarul.
Referitor la tipul cercetarii, adesea se face distinctia intre studii "explorative" si studii "explicative". Primele vizeaza mai curand aspectele descriptive ale fenomenului si deci nu pretind introducerea prea multor factori suplimentari in cercetare, efectandu-se, prin urmare, de obicei, cu chestionare mai simple.
Orice cercetare se face cu un anume scop si se adreseaza unui "beneficiar". In genere, putem distinge anchetele facute in scop pur stiintific, de pe urma carora rezulta articole stiintifice sau carti de care beneficiaza intreaga comunitate a specialistilor, si altele pur aplicative, comandate de o institutie, un partid, un ziar etc. intr-un scop foarte precis, cele cunoscute, de regula, de publicul larg ca "sondaje de opinie". De obicei, aceste din urma studii, ce sunt si foarte strict circumscrise in timp, utilizeaza chestionare mai simple, cu un numar mai mic de intrebari.
Referitor la natura intrebarilor, se poate aprecia ca utilizarea intrebarilor inchise, cu un numar mai mic de variante de raspuns, este un factor ce favorizeaza evident posibilitatea de a spori mult numarul de intrebari.
In general, la stabilirea numarului de intrebari din chestionar este necesar sa se evalueze timpul mediu reclamat de completarea efectiva a lui, parametru ce nu poate depasi, fara riscul unor erori mari, anumite limite. De pilda, un chestionar aplicat "in piciare" (pe strada, sa spunem) nu poate sa rapeasca subiectului mai mult de 5-10 minute. Ancheta clasica desfasurata la domiciliu poate dura, fara probleme deosebite, chiar si o jumatate de ora, dar nu se recomanda depasirea unei durate de 45 de minute decat in anumite circumstante speciale, cand subiectii sunt stimulati sa coopereze folosindu-se diferite recompense. Ancheta prin telefon, de asemenea nu se poate extinde peste durata catorva minute, decat daca subiectul a fost contactat in prealabil si s-a fixat un moment de timp la care sa poata fi sunat pentru a sustine o discutie telefonica mai lunga.
Ordinea intrebarilor in chestionar nu trebuie - si nici nu este bine - sa reproduca structura tematica a chestionarului. In stabilirea succesiunii intrebarilor e nevoie sa se tina seama de o serie de aspecte care favorizeaza comunicarea si stimuleaza cooperarea subiectului. De pilda, in debutul chestionarului se recomanda folosirea uneia sau mai multor intrebari "usoare", la care oamenii raspund cu placere, cu scopul de "a sparge gheata" cat mai repede si de a antrena subiectul in dialog. Daca dintre intrebarile-indicatori nu exista nici una care sa satisfaca astfel de cerinte, se pot construi cateva in mod special cu aceasta destinatie, chiar daca, altfel, nu sunt cu nimic utile cercetarii.
Asezarea intrebarilor in chestionar intr-o forma "logica" este evidenta pentru motivul ca aceasta genereaza un efect de consecventa sau de consonanta a raspunsurilor, care depaseste cu mult gradul de consonanta reala a opiniilor oamenilor.
Ordinea in care sunt intrebarile asezate intr-un chestionar capata o importanta deosebita in ancheta orala. Intrucat raspunsul la fiecare intrebare a chestionarului depinde nu numai de ceea ce a facut omul sau de ceea ce a gandit inainte de a intra in contact cu cercetatorul, ci si de modul in care se stabileste aceasta relatie subiect-cercetator, de felul cum subiectul o percepe si ii evalueaza consecintele pentru propria viata, este clar ca ordinea intrebarilor devine o chestiune relevanta numai in acest gen de ancheta, cea orala, in cadrul careia subiectul descopera succesiv problemele privitor la care este chestionat. Astfel, cu fiecare intrebare ce i se adreseaza, imaginea sa asupra situatiei in care se gaseste pus de ancheta se modifica si deci si raspunsurile la anumite intrebari - care raspunsuri sunt semnificativ influentate de aceasta perceptie - pot fi altele decat atunci cand intrebarea avea un alt loc in acelasi chestionar sau era plasata in cadrul altei succesiuni de intrebari sau al altui chestionar, diferit ca si continut al intrebarilor.
Un exemplu este cel al lui H. Schuman(1983):
Ex. inversarea a doua intrebari adresate americanilor
Ganditi ca SUA sa accepte ca ziaristii comunisti sa vina aici si sa trimita articole despre ce au vazut.
Ganditi ca o tara comunista trebuie sa accepte ca ziaristii americani sa mearga acolo si sa trimita in SUA note despre ce au vazut?
Se observa modificarea raspunsurilor: nr. de "Da" variaza
Problema non-raspunsurilor.
Pe langa intervievatii care nu pot raspunde fie pentru ca nu stiu sa scrie sau sa se exprime, fie pentru ca nu sunt suficient de informati, exista si cei ce nu vor sa raspunda sau uita. Ce reprezinta aceste raspunsuri care nu au fost date?
Putem oare considra ca cei care au raspuns sunt cei mai bine informati, cei mai interesati, cei mai obisnuiti cu scrisul, cei mai putin neglijenti sau cei mai cooperanti? (Sa admitem ca intr-o ancheta nu obtinem decat 50% dintre raspunsuri. Ce parte a esantionului o reprezinta cei 50% care nu au raspuns? Sunt probabil cei mai tineri sau cei mai saraci. Daca cei ce nu au raspuns difera de cei ce au raspuns, rezultatele stabilite in functie de cei din urma nu vor fi exacte din punct de vedere statistic. Asadar, o ancheta prin intermediul chestionarului scris risca problema non-raspunsurilor. Practic, cum se poate mari numarul raspunsurilor? Si cum se poate evalua semnificatia non-raspunsuri?
Interpretarea non-raspunsurilor.
Trebuie sa ne intrebam in ce masura non-raspunsurile falsifica reprezentativitatea esantionului, altfel spus care sunt cei ce raspund si cum difera fata de cei ce raspund.
Aceasta problema este grava dat fiind ca nivelul non-raspunsurilor este adesea ridicat. Decesele, maladiile, schimbarile de adresa reprezinta o parte importanta din totalitatea cauzelor ce determina non-raspunsurile. In ce parte a esantionului se afla acestea? Putem utiliza mai multe sisteme pentru a afla.
1. Primul consta in a grupa raspunsurile primite in functie de data lor de sosire: raspunsul primit intr-o saptamana, in 15 zile sau in trei saptamini. Apoi, se trimit scrisori de reamintire, chemare, atentionare sau carti postale continind un minim de intrebari inchise ce ne vor ajuta la caracterizarea intarziatilor. Acest procedeu permite decelarea partiala a celor ce se afla cel mai aproape de cei ce nu au raspuns. Sa ne imaginam ca 40% dintre raspunsuri sosesc imediat. Ca urmare unei scrisori de atentionare, 15% dintre 60% care nu au raspuns vor trimite chestionarul. Putem presupune ca acesti 15% sunt mai reprezentativi pentru cei 60% decat cei 40%. Totalizand rezultatele, ar fi mai bine sa ponderam importanta celor 15% decat sa extindem rezultatele celor 40% la intregul esantion, fara a tine seama de ceilalti care nu au raspuns sau amestecand raspunsurile celor 40%.
In sfarsit, putem trimite anchetatori la domiciliul unui anumit numar dintre cei care nu au raspuns. Aceasta metoda le-a permis lui M.H. Hansen si lui
W.N Nurwitz sa stabileasca reguli destul de precise, referitoare la numarul chestionarelor de trimis prin posta, in comparatie cu cei care nu au raspuns la interviu, pentru a obtine indicatiile cele mai exacte din punct de vedere statistic.
Astfel putem determina nu numai directia erorii introduse de cei ce nu raspund, in cadrul rezultatelor esantionarii, ci si sa masuram gradul sau influenta erorii.
1. Socialul este socialmente determinat . (un fapt social este determinat de alte fapte sociale).
Emil Durkheim in "Despre sinucidere"- construieste o imagine a realului in care actiunea factorilor sociali devine vizibila datorita incrucisarii indicatorilor factorilor sociali -variabilele independente- cu indicatorii comportamentulu studiat-variabilele dependente.
-ancheta prin chestionar are rolul de a scoate la lumina determinantii sociali, inconstienti ai practicilor.
2. Cea de-a doua parte a chestionarului abordeaza acele caracteristici ale obiectului cercetarii care sunt considerate a priori pertinente.
Ex. Ipoteza: modul de viata al salariatilor ajunge sa se infiltreze in viata lor profesionala
-se pun 6 intrebari despre distractie:, despre subiectele de conversatie, despre activitatile extraprofesionale din timpul serviciului, despre petrecerile din cadrul unitatii, despre activitatile din cadrul unitatii(biblioteca, sala de fittness), despre realizarea in cadrul unitatii a unui obiect, lucrari care nu este destinat acesteia. Raspunsurile vor fi corelate cu caracteristicile sociale ale subiectilor interogati pentru a fi puse in evidenta variatiile raportului dintre sfera privata si sfera profesionala.
ESANTIONAREA
Definirea esantionarii
Prin esantionare se urmareste realizarea unei cercetari reprezentative prin studierea numai a unei parti din universul cercetarii, care alcatuieste o colectie statistica de unitati (elemente). In domeniul social, esantionarea intervine in cercetari realizate prin ancheta de tipul sondajelor de opinie publica, de marketing, de audienta, de consum etc., dar si in studiul documentelor sociale, ca si in diverse alte cercetari (de exemplu, se determina numarul de vizite necesare in observatia instantanee).
Esantionarea consta in extragerea, in conditii specificate, a unui numar de unitati statistice din universul cercetarii. In consecinta, esantionul este un model la scara mica al universului cercetarii. Datele obtinute din studierea esantionului (statistica "s") pot fi extinse la nivelul colectivitatii totale (parametru ,,p"), cu anumite limite de variatie, la un nivel de probabilitate (precizie) stabilit.
Esantionarea se bazeaza pe doua teorii statistice: legea numerelor mari si calculul probabilitatilor. Legea numerelor mari (Bernoulli, Poisson) fundamenteaza marimea
esantionului (n), iar calculul probabilitatilor reglementeaza selectia subiectilor in esantion.
Referindu-ne la reprezentativitate, vom avea in vedere ca aceasta este dependenta de marimea esantionului si de schema de esantionare utilizata. Reprezentativitatea (eficienta) este cu atat mai buna cu cat avem de-a face cu erori de esantionare mai mici.
Scopurile cercetarilor selective sunt acelea de estimare a parametrilor (media, proportia) ce caracterizeaza o anumita caracteristica a populatiei si de testare a unor ipoteze statistice despre populatie (C.A. Moser, Metode de ancheta in investigarea fenomenelor sociale, 1967). In cele ce urmeaza, nu ne propunem sa inlocuim tratarea esantionarii din manualele de statistica. Sociologul accentueaza aspectele legate de proiectarea esantionului si culegerea datelor. Statisticianul este preocupat mai mult de estimari si informatii. Colaborarea dintre cele doua specialitati (si specialisti) este absolut necesara.
La intrebarea cat de mare trebuie sa fie un esantion, raspunsul este doar orientativ, de tipul: "Suficient de mare pentru a putea fi reprezentativ". Teoretic, s-a stabilit ca marimea esantionului este invers proportionala cu patratul erorii de esantionare. Altfel formulat, eroarea de esantionare este invers proportionala cu radacina patrata din marimea esantionului. Pentru a reduce eroarea la jumatate, trebuie sa creasca de patru ori volumul esantionului. Calcularea marimii esantionului presupune cunoasterea caracteristicilor distributiei variabilelor colectivitatii totale, considerate criterii de esantionare. La o colectivitate relativ omogena, marimea ceruta pentru esantion va fi mai mica decat la o colectivitate mai eterogena, la un nivel dorit de reprezentativitate. La randul sau, probabilitatea exprima nivelul la care se fac estimarile de la esantion la colectivitatea totala, iar eroarea de esantionare defineste spatiul de variatie a valorilor estimate, respectiv eroarea standard a mediei sau a procentului (proportiei).
In practica cercetarilor sociologice s-a convenit ca nivelul probabilitatii cu care se fac estimarile sa nu fie mai mic de 0,95, dar, evident, poate sa se apropie cat mai mult de 1. Este cunoscut faptul ca nivelurile de probabilitate se dispun pe spatiul 0-1. Cat priveste valoarea 1, ea are sens aici doar cand se studiaza intreaga populatie, cand de fapt estimarea nu mai este necesara. Un nivel de probabilitate de 0,95 ne asigura ca valoarea estimata pentru colectivitatea totala se situeaza in spatiul de variatie in 95 de cazuri din 100 de esantioane (in 19 cazuri din 20). Se utilizeaza si notiunea de prag de incredere - in acest caz, el este de 0,05. Posibilitatea erorii este de 5 cazuri din 100 esantioane (sau 1 caz din 20). Daca am lucra cu o probabilitate de 0,99, atunci nivelul de precizie al valorilor estimate pentru aceeasi marime a esantionului devine mai mare, dar spatiul de variatie (eroarea) creste. Cat priveste eroarea de estimare a valorilor esantionului, aceasta este acceptata pe intervalul de la ± 1% pana la ± 5%. Prin urmare, o valoare determinata la nivel de esantion si estimata in populatia totala ia valoarea cuprinsa in spatiul delimitat de valoarea de esantion ± eroarea de estimare pentru o probabilitate data. Astfel, o valoare relativa de 50%, cat ar reprezenta popularitatea unui partid, de exemplu, conduce la o valoare estimata in colectivitate situata in spatiul 49-51 % ; pentru o eroare de 1%, spatiul de estimare devine 45-55%, pentru o eroare de 5%.
De aici rezulta cateva elemente de orientare a esantionarii:
1. Pentru a obtine rezultate acceptabile, nu este necesar sa studiem intreaga colectivitate, daca aceasta este relativ mare. La colectivitatile mici, esantionarea este neavenita. In acest ultim caz trebuie sa se studieze intreaga populatie sau loturi ale populatiei.
2. Marimea esantionului nu se determina ca proportie din colectivitatea totala. In fapt, acest raport poate fi egal cu 1 (chiar mai mare decat 1 atunci cand universul cercetarii este foarte mic) sau poate lua valori extrem de mici, de ordinul a milionimea parte. Marimea colectivitatii totale este luata in considerare la constituirea unui coeficient pentru corectia finita, cu care se reduce marimea esantionului atunci cand acesta reprezinta mai mult de 10% din populatia totala (C.A. Moser, op. cit.). Cand acest raport scade, coeficientul de corectie se apropie de 1 si nu mai conteaza. O corectie a marimii esantionului se realizeaza si atunci cand selectia este fara inlocuire (nerepetata), ceea ce este cazul aproape general in cercetarea sociala. Si aici se obtine insa tot o reducere nesemnificativa a esantionului; dar, asa cum vom vedea, cercetarile sufera din cauza unor esantioane prea mici. Mai importanta decat corectia marimii esantionului este determinarea exacta a erorii de esantionare.
3. Riscurile de eroare sunt importante, avand in vedere ca se studiaza un singur esantion, comparativ cu numarul practic inabordabil de mare ce s-ar putea constitui pentru colectivitalile mari. Un exemplu ne poate edifica: la o colectivitate de 15 milioane persoane sunt posibile 10.000 de esantioane de cate 1.500 persoane, fara nici o persoana comuna, si 10.000 la puterea 1.500 esantioane daca se accepta intrarea oricarei persoane in mai multe esantioane. In primul caz, pentru o probabilitate de 0,95, rezulta ca in 9.500 de esantioane din 10.000 este de asteptat ca valoarea estimata sa fie in limita spatiului de variatie, iar in 500 de cazuri sa fie in afara. Eroarea de esantionare exprima variatia de la un esantion la altul. Media valorilor medii pentru toate esantioanele ne da valoarea medie a variabilei in populatia totala (parametru). Studiindu-se un esantion fara inlocuire (o unitate o data selectata nu se mai introduce in colectia statistica), la determinarea erorii standard de estimare a parametrilor ar trebui sa se utilizeze, de asemenea, factori de corectie. Altfel, in cazul inferentelor poate sa apara eroare de tipul II, adica sa se accepte ipoteza nula, a lipsei de diferenta semnificativa dintre doua medii sau doua procente - m1 = m2, p1 = p2 -, desi cele doua medii (procente) comparate pot fi diferite, ca urmare a faptului ca eroarea standard este calculata la un nivel mai mare si deci si spatiul de variatie acceptat este mai mare. In acest fel, diferentele mai mici, dar semnificative, sunt ignorate. De exemplu, o diferenta de 0,2 intre doua medii comparate sau de 2 puncte procentuale intre doua procente sa fie tratate ca nesemnificative, deoarece utilizand o valoare necorectata a erorii standard, rezulta o diferenta teoretica semnificativa de 0,25 (2,5 puncte procentuale) pentru un nivel de probabilitate de 0,95. Celalalt risc, eroarea de tipul I, ar fi respingerea ipotezei nule si acceptarea ipotezei existentei diferentei, m1 ≠ m2, p1 ≠ p2 , desi ea nu este semnificativa. Acest fapt se produce si cand se utilizeaza pragul de incredere mai putin riguros (p = 0,95). Sporirea nivelului de rigurozitate, p>0,99, poate atrage insa reaparitia erorii de tipul II (C.A. Moser, Metode de ancheta in investigarea fenomenelor sociale, 1967).
Cu toate acestea, se pot obtine estimari acceptabile ale valorilor in colectivitatea totala cu un singur esantion. Probleme mai dificile le ridica studiile de predictie a unei evolutii viitoare (anchetele preelectorale, de exemplu). Aici este eecomandabil sa se lucreze cu un nivel inalt de probabilitate (de la 0,99 in sus) si cu eroare mica (sub 3%), ceea ce inseamna esantioane relativ mari.
Marimea esantionului
Determinarea marimii optime a esantionului se realizeaza printr-un proces de analiza, in care intra, pe langa elementele statistice, costurile si alte aspecte legate de posibilitatile de care se dispune la un moment dat.
De cele mai multe ori nu se cunosc valorile variabilelor pentru colectivitatea totala, iar valorile de esantionare sunt cunoscute dupa efectuarea cercetarii. Din acest motiv, marimea esantionului este abordata la nivel toretic, facand anumite ipoteze in legatura cu valorile variabilelor. procedand intr-o maniera normativa, marimea optima a unui esantion se stabileste prin luarea in considerare a valorilor adecvate ale nivelurilor pobabilitatii cu care se face estimarea si a marimii erorilor de estimare.
Formulele teoretice de determinare a marimii unui esantion sunt valabile pentru esantionare simpla aleatorie si sunt diferite pentru variabilele cantitative, respectiv variabilele calitative (atribute):
a) variabilele cantitative, cand se poate calcula media (m) si abaterea standard a mediei (σ):
n = tx σ/ e
b) variabile calitative (atribute), sau ori de cate ori valoarea variabilei se exprima in procente (respectiv in proportii):
n = t P(100 - P) / e;
n = tp(1 - p) / e,
unde t este valoarea ce corespunde nivelului de
probabilitate. Ea se determina din proprietatea repartitiei normale
(Gauss), marimea suprafetei delimitata simetric la dreapta
si la stanga mediei prin unitati de abatere standard. La t = 1
se acopera 68% din cazuri (deci o proportie si, totodata, o
probabilitate de 0,68). Unei probabilitati de 0,95 ii corespunde t =
1,96;
Valoarea minima teoretica a lui n ar rezulta daca se iau in considerare valoarea maxima acceptata pentru eroare (± 5%) si pragul minim de probabilitate (0,95), pentru estimarea valorii de minim 5 puncte procentuale, si cand n ar fi de 76 persoane. De observat insa ca estimarea valorii de 5 procente din esantion, pentru colectivitatea totala, se situeaza in intervalul 0-10% (5% ± 5%).
Valoarea optima a marimii esantionului se determina in functie de atingerea unor obiective specifice, la costuri abordabile.
a) Pentru cercetari descriptive (probabilitate minima, eroare teoretica si dispersie maxime).
Daca: 1) P = 50%
2) t = 2
3) e = 5%
Rezulta: n = 400
b) Pentru cercetari care presupun analize corelationale pe cateva subesantioane (Cu reducerea marimii erorii teoretice).
Daca: 1) P = 50%
2) t = 2
3) e = 3%
Rezulta: n = 1.083
Este marimea esantionului cel mai des utilizat in Romania si nu numai, in studiile de marketing, de opinie publica etc. Marimea respectiva este totusi prea mica pentru analizele cu variabile care au mai multe diviziuni, pe grupuri multiple etc.
c) Daca se doreste reprezentativitate pe multe subgrupuri, marimea esantionului trebuie sa creasca in mod considerabil. Tot astfel si in cazul efectuarii de predictii.
c1. Reprezentativitate cu probabilitate si eroare de marime medie.
Daca: 1) P = 50%
2) t = 2,56
3) e = 2%
Rezulta: n = 4.093
c2. Reprezentativitate cu asigurare doar a erorii teoretice de marime medie.
Daca: 1) P = 50%
2) t = 2
3) e = 2%
Rezulta: n = 2.500
Totodata intervin si alti factori legati de imprastierea teritoriala, marimea mica a unor straturi de populatie pe care le vrem reprezentate etc.
Esantioanele mai mari sunt necesare si pentru faptul ca in cercetarile nationale are loc o indepartare de la cerintele esantionarii simplu aleatorie, pentru care sunt valabile formulele teoretice enuntate.
d) Valoarea lui n sporeste substantial la nivelul mediu de probabilitate si eroare teoretica minima.
Daca: 1) p = 50%
2) t = 2,56
3) e = 1%
Rezulta: n = 16.384
Solutie de urmat in situatii foarte fine de predictie.
e) Cand se ia in considerare si un nivel foarte inalt pentru t, n creste pe masura.
Daca: 1) P = 50%
2) t = 5 (Probabilitatea = 0,99999)
3) e = 1%
Rezulta: n = 125.000
Pentru situatiile obisnuite, acest numar pare o exagerare, dar sunt cercetari care necesita astfel de esantioane. Raportat la populatia adulta a Romaniei, el nu reprezinta decat 0,7%. Costurile ar fi mult mai mici decat pentru un recensamant.
Intr-un mod asemanator se lucreaza pentru variabilele cantitative. In conditiile necunoasterii valorilor variabilelor in colectivitatea totala, se fac si aici anumite supozitii. De exemplu, se poate presupune ca abaterea standard (σ) are o anumita valoare relativa fata de medie (considerata 1). Pentru σ = 0,5, marimea esantionului este similara cazului d, prezentat anterior.
Daca: 1) σ = 0,5 · 1
2) t = 2 (Probabilitatea = 0,95)
3) e = 2% (P = 0,02
Rezulta: n = 2.500
Ipotezele asupra abaterii standard sunt mai dificil de stabilit, existand riscul atat al construirii de esantioane cu reprezentativitate slaba (erori de esantioane de peste 5% la nivelul minim de probabilitate), cat si al unor esantioane exagerat de mari, fara o crestere substantiala a eficientei, dar cu costuri inalte de realizare.
Eroarea de esantionare
In momentul proiectarii esantionului, se stabileste nivelul dorit al erorii de estimare a valorilor populatiei totale pe intervalul 1-5%. De avut in vedere faptul ca, in studiile de predictie, aceasta valoare trebuie sa fie de maxim 3, de dorit 2 sau chiar 1, iar estimarea se face cu o probabilitate de 0,97, 0,98, 0,99 si mai mare.
Rationamentul proiectarii esantionului incepe cu analiza de estimare a erorii de esantionare ce ar rezulta la o anumita marime a lui n.
; corectat
; corectat .
Sa urmarim un asemenea demers de incercare si eroare. Presupunem ca am studiat 10 persoane in legatura cu optiunea lor politica (practica intalnita in documentarea jurnalistica). Am gasit ca 2 persoane sunt adepte ale partidului A, 4 sunt adepte ale partidului B, iar 4 nu prefera nici un partid. Se pune problema sa estimam popularitatea partidelor. Mai intai am vrea sa stim care este proportia, in populatia din care fac parte cele 10 persoane, a celor care opteaza pentru un partid sau altul.
1) p = 0,6
2) t = 2
3) n = 10
= 0,31
Pe baza acestui "rezultat", putem spune ca audienta partidelor se situeaza in spatiul 0,6 - 0,31 si 0,6 + 0,31, ceea ce este total nesatisfacator ca nivel de cunoastere: audienta partidelor este undeva pe spatiul 29-91 % si aceasta doar in 95 de cazuri din 100 esantioane, iar in 5 cazuri parametrul estimat poate fi in afara acestui spatiu imens.
Acelasi rezultat al erorii standard poate fi folosit pentru a estima proportia celor care nu au afiliere politica. In acest caz, am spune ca proportia in populatie a celor neafiliati politic este undeva pe spatiul de 0,4 - 0,31 si 0,4 - 0,31 (adica intre 9% si 71%!). Lucrurile se complica si mai mult (daca se mai accepta o continuare a demonstratiei). Rezulta ca intre 29 si 91% au afiliere politica, dar intre 9 si 71% nu au astfel de afiliere. Similar, s-ar putea discuta despre popularitatea partidului B: eroarea standard ar duce la un parametru in populatie situat pe spatiul 0 - 0,4 (de la 0% la 40%). Si mai nostim este faptul ca, in cazul expus, pentru partidul "A", eroarea este superioara popularitatii inregistrate.
Singura concluzie ce s-ar putea trage studiind cele 10 persoane este ca rezultatele sunt valabile doar la acest nivel. Daca efectuam un studiu adancit privind motivarea optiunilor, schimbarea lor etc., putem obtine, evident, rezultate interesante.
De fapt, tot acest exercitiu (care nu este totusi gratuit, din moment ce unii "analisti politici" mizeaza pe asemenea "cercetari") conduce la concluzia implicata in punctul de pornire al demonstratiei (stiam deja ca un esantion trebuie sa fie suficient de mare, iar 10 nu este un numar mare). Am fi putut demara rationamentele cu eroarea standard. Continuam insa strategia adoptata si sporim n la 100; se obtine eroarea standard o proportiei de 0,6.
Parametrul in populatie se situeaza pe spatiul 0,5 -0,7 (adica intre 50% si 70%), ceea ce este inca inacceptabil pentru estimari. Daca sporim pe n la 400, ajungem in zona acceptabila pentru studiile descriptive.
dar spatiul de estimare este inca mare: 0,55 - 0,65 (55 - 65%).
Putem sa analizam toate celelalte ipoteze privind marimea esantionului si eroarea standard dorita. Ne vom indrepta insa atentia asupra unei alte probleme. Este vorba de faptul ca eroarea standard poate fi corect cxprimata doar dupa ce am efectuat cercetarea si cunoastem valorile variabilelor in esantion (avem deja statisticile). Pentru efectuarea de inferente si determinarea semnificatiei statisticilor pentru colectivitatea totala, se impune sa se cunoasca erorile de esantionare pentru fiecare variabila. Analizele pe subesantioane mici vor releva erori standard mai mari decat nivelul teoretic stabilit initial. Am retinut deja ca diferitele scheme de esantionare reclama forme specifice de calcul al erorilor de esantionare. Daca rezulta o eroare de esantionare mai mare de ± 5%, nu se mai pot efectua inferente cu un grad acceptabil de precizie, fie ca este vorba de o variabila la nivelul esantionului sau pe subesantioane.
O regula de comportament preventiv ar fi aceea de a nu se proiecta esantioane la limitele minime de acceptabilitate (Probabilitate de 0,95, dar mai ales erori standard de 5%).
Pe de alta parte, este de retinut faptul ca cercetatorul trebuie sa determine marimea totala a erorilor (Et).
Et=Xr - m,
unde Xr este valoarea adevarata a mediei in populatie, iau m - media esantionului.
Eroarea totala de esantionare este compusa din erorile de esantionare, care, la randul lor, pot fi de selectie si de estimare, erori datorate variabilitatii si omogenitatii esantionului, dar si din afara esantionului (incompletitudinea listei, non-raspunsurile si erorile de masurare) (G. Henry, Practical sampling, 1990).
Sunt necesare calcule speciale pentru determinarea erorii standard, in functie de schema de esantionare utilizata. La esantionarea stratificata se insumeaza erorile pe strat; va rezulta o eroare standard inferioara esantionarii simplu-aleatorii. In schimb, la esantioanele cluster si multistadiale, eroarea standard este mai mare decat in cazul esantionarii simplu-aleatorii (L. Kish, A Confidence Intervals for Clusters, 1957). Astfel, la esantionarea stratificata calculul erorii standard se realizeaza dupa formula:
Eroarea standard pentru fiecare strat este ponderata cu marimea stratului (Wk = Nk / N), ceea ce reduce eroarea standard totala (Em). In schimb, la esantionarea cluster, eroarea standard se calculeaza dupa formula:
,
unde a este numarul de clustere selectate, A este numarul total de clustere in populatie, ma este media esantionului, iar m este media totala (G. Henry, op. cit.).
Daca procentele comparate sunt apropiate, estimarea
diferentelor dintre ele reclama esantioane mai mari. ESOMAR
(Societatea Europeana pentru Cercetarea Opiniei si Marketing), in Ghidul
sau (acceptat de Comisia Internationala de Comert, in aprilie
1990), recomanda esantioane de 1.500-2.000 persoane, pe
considerentul ca o eroare standard de 3% ar corespunde unui esantion de
1.000 persoane
In cercetarile efectuate
La esantioanele multistadiale si cluster, pe langa determinarile erorilor de esantionare pot fi necesare si alte calcule pentru estimari cat mai adecvate ale parametrilor populatiei totale, cum ar fi ponderarea pentru selectia cu probabilitati inegale (W = Pc / Pe, unde Pc este proportia in colectivitate, iar Pe proportia in esantion), ca si pentru non-raspunsuri. Gary Henry recomanda considerarea celor care nu raspund ca pe un strat si evaluarea impactului asupra estimarilor din esantion.
Tipuri de esantionare
Criteriul principal de diferentiere a esantionarii este legat de caracterul probabilist (aleatoriu), respectiv neprobabilist. In esantionarea probabilista, fiecare element (unitate statistica) din universul cercetarii are sansa cunoscuta de a fi selectat pentru cercetare, probabilitate diferita de zero, egala sau variabila. Datorita acestui fapt, in esantionarea probabilista se poate calcula eroarea standard de estimare a nivelului unei valori obtinute in cercetare si, prin aceasta, se face extinderea rezultatelor la nivelul colectivitatii totale. In esantionarea neprobabilista nu este posibila estimarea de la esantion la colectivitatea totala. Nu se pot efectua inferente statistice, deoarece nu se poate determina eroarea standard a unei valori medii sau a unui procent (proportie).
Esantionarea probabilista este la randul ei de doua tipuri: simplu aleatorie si stratificata. In esantionarea simplu-aleatorie, universul cercetarii este tratat ca un tot nediferentiat. Ea este aplicabila cand coleceta statistica este relativ omogena in privinta criteriului (criteriilor) de esantionare. Selectia unitatilor statistice se efectueaza direct din ansamblul universului cercetarii, iar probabilitatea unei unitati statistice de a fi aleasa in esantion este egala cu fractia de esantionare (p = f = n/N).
La esantionarea probabilist-stratificata se realizeaza o diviziune a universului cercetarii in sectiuni (straturi) semnificative determinate de numarul valorilor variabilelor folosite drept criteriu de clasificare. Stratificarea se face pentru a asigura selectia proportionala din fiecare strat. Acest fapt prezinta o importanta deosebita cand straturile sunt de dimensiuni diferite, situatie in care populatia din straturile mici nu ar fi selectata in schema simplu-aleatorie sau ar fi selectata intr-un numar insuficient. In esantionarea stratificata se determina cate un subesantion pentru fiecare strat, iar esantionul total este suma subesantioanelor pe straturi.
In general, marirea esantioanelor este proportionala cu marimea straturilor. La esantionarea stratificata proportionala, subiectii au aceeasi sansa de a fi selectati. La straturile de dimensiuni mici, se poate utiliza probabilitate mai mare de selectie a subiectilor. Numarul straturilor creste pe masura cresterii numarului de variabile si a numarului de viziuni ale acestora. O stratificare dupa sex are doua straturi, una dupa varsta poate avea 5 sau 10 straturi, caz in care stratificarea combinata, dupa sex si varsta, ar avea 10, respectiv 20 de straturi.
Sa exemplificam situatia pentru populatia adulta (varsta de peste 18 ani) in care se face stratificarea dupa sex si varsta (date din Anuarul Statistic al Romaniei, 1996).
I. Univers al cercetarii II. Esantion (N = 2.000)
(N = 16,8 milioane) (valori absolute)
a) Sex a) Sex
1. Femei = 51,6% 1. Femei = 1032
2. Barbati = 48,4% 2. Barbati = 968
b) Varsta (in ani) b) Varsta (in ani)
1. 18-19 = 92
2. 20-24 = 216
3. 25-29 = 220
4. 30-34 = 154
5. 35-39 = 204
6. 40-44 = 192
7. 45-49 = 162
8. 50-54 = 134
9. 55-59 = 7,9% 9. 55-59 = 158
10. 60 si peste = 23,4% 10. 60 si peste = 468
Structura combinata
Varsta-sex |
femei |
barbati |
Varsta/sex |
femei |
barbati |
60 si peste |
60 si peste |
Daca se doreste ca fiecare strat sa aiba reprezentativitate relativ inalta, este nevoie de utilizarea unei alocari neproportionale pe straturi. Se acorda sanse mai mari pentru straturile mici. La structurile simple considerate ar fi cazul reprezentarii tinerilor de 18-19 ani, iar la structura combinata, cu exceptia stratului 60 ani si peste, se impune o crestere a subesantioanelor, mai ales daca se are in vedere analize pentru fiecare strat, ceea ce ar conduce la un esantion total mai mare.
Dificultatea practicarii esantionarii probabiliste se refera la intocmirea listei, intr-o ordine intamplatoare (randomizare), cu toate unitatile (membrii) din universul cercetarii. Mai mult, la esantionarea probabilist-stratificata sunt necesare listele pentru fiecare strat in parte. In conditiile unor evidente statistice adecvate, de tipul Registrului general al populatiei, operatia de elaborare a esantioanelor probabiliste se poate realiza cu usurinta. In multe tari, Oficiile de statistica furnizeaza la cerere (si contra cost) asemenea esantioane probabiliste.
O alta dificultate a acestor tipuri de esantioane, avand in vedere gradul mare de raspandire in teritoriu a subiectilor, priveste costul ridicat si timpul necesar realizarii cercetarilor.
Procedurile de selectie probabilista sunt cele ale numerelor intamplatoare, ale loteriei si ale pasului mecanic (selectie sistematica).
Procedura numerelor intamplatoare presupune atribuirea fiecarei unitati statistice a unui numar, generarea unui tabel cu numere intamplatoare (acestea pot fi gasite si in cartile de statistica). Fiecare numar intamplator are un numar de cifre corespunzator numarului de cifre ale utimei unitati statistice din universul cercetarii. Pentru esantionarea simplu-aleatorie a populatiei adulte a Romaniei, ne-ar trebui un tabel cu numere intamplatoare alcatuite din cate 8 cifre (in care cel mai mic este 00000001, iar cel mai mare se situeara undeva intre 16 si 17 milioane).
La esantioanele extrase din colectivitati mici, situatia se simplifica mult, avand in vedere ca am avea de ales esantionul din cateva mii sau chiar sute de persoane, cum ar fi o lista a unei localitati, a unei sectii de votare. Aici este suficient un tabel cu numere intamplatoare alcatuite din cate 3 sau 4 cifre. Primul numar intamplator din tabel indica numarul primului subiect ales si asa mai departe. Daca in tabelul de numere intamplatoare exista un numar mai mare decat in universul cercetarii, se trece la urmatorul numar intamplator.
Metoda loteriei (a urnei) se utilizeaza cand numarul colectiei din care se face extragerea este relativ mic, de ordinul catorva zeci. Fiecare unitate de selectie este introdusa in urna si se extrag atatea unitati cate sunt repartizate pentru nivelul respectiv (asemanator extragerii numerelor castigatoare la loto). Cand colectia din care se face extractia este mare, nu se mai poate respecta principiul sanselor egale, mai ales daca urmeaza sa se extraga un numar mic de unitati. Raportul optim N/n este in functie si de modalitatea de extragere, dar nu ar trebui sa fie mai mare de 100 (!) (Nu am gasit un calcul efectuat pentru aceasta problema).
In practica, se utilizeaza adesea o alta procedura de selectie unitatilor statistice. Este vorba de selectia sistematica (a intervalelor egale sau a pasului). Aceasta procedura se indeparteaza intr-o anumita masura de cerintele selectiei probabiliste. Este insa in general acceptata cel putin ca selectie cvasialeatorie. Pentru H. Blalock, procedura de selectie sistematica (mecanica) ar reprezenta un tip distinct de esantionare probabilista pe considerentul ca se indeparteaza de procedura simplu-aleatorie. Totusi si el considera ca atunci cand lista universului cercetarii este intocmita dupa principiile randomizarii (fara o ordine anume, nici ca importata si nici eventuale cicluri) si este completa, esantionarea sistematica se apropie de cea simplu-aleatorie (H. Blalock jr, Social Statistics, 1972).
O data intocmita lista cu unitatile statistice, se determina raportul N/n (care devine pasul de selectie). Pentru a alege 10 unitati din 400, se aplica un pas de 40. Se alege mai intai un numar mai mic de 40, si apoi se aleg urmatoarele 9 unitati din 40 in 40. Daca exista un dubiu pentru includerea unitatii de la un numar selectat, se alege numarul imediat mai mic sau mai mare.
La selectia unitatilor statistice se are in vedere constituirea si a unor rezerve (mai ales in esantionarea persoanelor), deoarece este posibil ca unele sa nu fie identificate, altele sa nu fie disponibile etc. Rezerva se stabileste la 10-20% din esantionul de studiat. Nu se utilizeaza insa rezervele inainte de a avea certitudinea posibilitatii de studiere a uneia sau mai multor unitati selectate.
Datorita imprastierii mari a esantioanelor nationale si a lipsei cadrului general de esantionare, se practica adeseori scheme de esantionare cu mai multe stadii. Astfel, cercetarea empirica se va concentra pe anumite zone, iar listele cu unitatile statistice din care se face selectia se intocmesc numai pentru zonele respective.
Intr-o esantionare bistadiala se selecteaza mai intai zonele (localitati, zone in cadrul localitatilor, cum ar fi sectiile de votare, zona de recensamant etc., numite clustere), iar in stadiul al doilea se selecteaza subiectii de pe listele zonelor retinute pentru studiu.
Schema bistadiala este in general acceptata ca fiind apropiata de esantionarea simplu-aleatorie. Si esantionarea multistadiala este insa tratata de catre unii autori ca un tip specific, cvasialeatoriu de esantionare (H. Blalock jr, op. cit.). Cert este ca esantionarea multistadiala mareste nivelul erorii standard de estimare a valorilor (a erorilor de esantionare). La randul sau, C.A. Moser trateaza esantionarea de tip cluster ca un caz special al esantionarii multistadiale (C.A. Moser, op. cit.).
In esantionarea
cu mai multe stadii se impune sa avem informatii despre zonele ce
constituie obiect de selectie: cate sunt, o lista a lor, delimitarea
clara, indicatori sintetici de caracterizare, posibilitatea procurarii
listelor cu unitatile statistice ce vor fi supuse selectiei. In
lipsa acestor ultime liste, se poate trece la efectuarea de microrecensamanturi
in zonele de referinta. Metoda L. Kish (dezvoltata in deceniile 6-7
O varianta de alegere sistematica in clusterul final este aceea a grilei de alegere a persoanelor de pe o lista de adrese.
Unii cercetatori introduc, am zice nepermis, in randul schemelor probabiliste si modalitatii de lucru in care efectiv nu se realizeaza selectii statistice. Este cazul procedurii numite ,,ruta stradala", in care operatorilor li se cere sa viziteze un numar de adrese folosind un anumit interval si eventual o grila de stabilire a persoanelor. Totusi, daca strazile nu au fost initial selectate printr-o anumita procedura probabilista, nu este posibila estimarea reprezentativitatii la nivel national sau de localitate. De fapt nu exista un element de referinta de tipul unei colectii statistice, pentru care sa se efectueze estimarile parametrilor. Cel mult poate fi vorba de populatia totala care locuieste pe strazile unde se efectueaza studiul, considerand grila de alegere a persoanelor studiate o schema sistematica. In acest fel, s-ar putea acoperi o localitate mica. Aplicarea ei pe localitati mari este insa hazardata.
O alta clasificare a esantioanelor se refera la caracterul unitatii statistice finale de selectie. Aceasta poate fi constituita dintr-un singur element, caz in care avem esantion individual, sau din mai multe elemente -esantion de grup (cluster). Pentru evitarea unor confuzii, ar fi de preferat ca denumirea de esantionare cluster sa se foloseasca numai in acest ultim caz. Ea semnifica faptul ca unitatea statistica finala este un grup care se studiaza in totalitate. Asa apare clara si distinctia fata de esantionarea multistadiala, unde in clusterul final se face o selectie aleatorie a subiectilor ce vor fi studiati. Mai mult, la esantionarea multistadiala sunt utilizate o serie de diviziuni care de fapt nu sunt grupuri. Or, in esantionarea cluster propriu-zisa, populatia se repartizeaza sau este deja constituita in grupuri, alcatuind structuri ierarhizate: clase de elevi intr-o scoala, echipe de lucru intr-o fabrica etc.
H. Blalock se refera la faptul ca, daca straturile trebuie sa fie cat mai omogene in interior si mai diferite unele de altele, clusterii trebuie sa fie cat mai asemanatori intre ei si cat mai diferentiati in interior (sa reproduca structura colectivitatii totale, caz in care ar fi suficienta studierea unuia singur). In astfel de cercetari nu suntem interesati doar de comportamentele individuale, ci si de cele ale grupului luat ca intreg. La randul sau, Gary Henry, enumerand cinci tehnici de esantionare probabilista: simplu-aleatorie, stratificata, sistematica, multistadiala si cluster, face distinctie intre ultimele doua, in functie de modul cum se aleg subiectii. La esantionarea multistadiala, din clusterii finali se selecteaza aleatoriu subiectii in esantion (se pierde insa imaginea despre grup ca intreg), pe cand la esantionarea cluster se studiaza toti membrii clusterilor finali selectati aleatoriu (G. Henry, op. cit.).
Evident ca nu se pune problema respingerii denumirilor folosite de un autor sau altul. Un cercetator trebuie sa fie insa foarte atent la implicatile schemelor de esantionare pe care le foloseste.
O schema multistadiala de esantionare probabilist-stratificata, utilizata in Romania in studiile de opinie publica si de marketing, consta in considerarea drept criterii de stratificare a provinciilor istorice, a mediului rezidential si a marimii localitatilor urbane. In primul stadiu se selecteaza localitatile, in al doilea stadiu sunt selectate sectiile de votare din localitatile retinute anterior, iar in al treilea stadiu sunt selectati subiectii, de pe listele electorale.
Un esantion de 1.200 persoane, considerand 10 persoane pe fiecare sectie studiata, conduce la selectarea a 120 sectii de votare (ideal ar fi considerarea circumscriptiei statistice de recensamant, deoarece ar exista date de caracterizare a populatiei, insa aceste liste nu sunt disponibile), distribuite proportional pe localitati si provincii. In locul provinciilor istorice se pot determina diferite arii culturale (D. Sandu, Statistica in stiintele sociale, 1992).
La esantionarea neprobabilista, selectia persoanelor urmeaza o procedura preferentiala (convenience) sau bazata pe experienta (judgment) (L. Kazimier, Statistical Analysis for Business and Economy, 1967).
Cea mai cunoscuta schema de esantionare neprobabilista este cea pe cote. In faza de proiectare, aceasta schema se aseamana cu constituirea straturilor in esantionarea probabilista. Diferenta consta in faptul ca la esantionarea probabilist-stratificata, in selectia persoanelor se urmeaza o procedura aleatorie, la esantionarea pe cote se repartizeaza operatorilor doar numarul si structura de realizat, urmand ca ei sa faca selectia cu o procedura neprobabilista
Esantionarea pe cote are caracter stiintific. Ea permite obtinerea de rezultate satisfacatoare si la costuri mult mai mici. Fara a se putea determina eroarea de esantionare si a se face inferente de la esantion la colectivitatea totala, acest tip se poate dovedi uneori mai relevant decat unul probabilist inadecvat realizat (ceea ce conduce la distorsiuni importante si abateri de la reprezentativitate).
Intr-adevar, in cercetarile bazate pe esantionarea pe cote, stratificata dupa criterii semnificative, se obtin date pentru descrierea si explicatia domeniului studiat. De mentionat ca esecul de a asigura selectia probabilista, intr-o schema astfel definita (cum ar fi metoda rutei stradale), ca si atunci cand eroarea este inacceptabil de mare, ne aduce de fapt in situatia unei esantionari neprobabiliste.
Gary Henry utilizeaza denumirea de esantionare neprobabilista nu numai pentru esantionarea pe cote, ci si pentru diferite proceduri de constituire a colectiilor de cazuri de care aminteam anterior: cazurile tipice, extreme, similare, esentiale, metoda ,bulgarelui de zapada" (G. Henry, op. cit., 1990).
Toate aceste abordari, precum si altele asemanatoare de tipul esantionarii teoretice, a esantionarii calitative, a esantionarii de oportunitate, nu sunt in masura sa introduca un discurs coerent asupra teoriei esantionarii, procedeele respective avand cu totul alta semnificatie, care a fost deja analizata. Or, in esantionarea neprobabilista se respecta una dintre cerintele esantionarii, respectiv marimea esantionului, de unde indreptatirea utilizarii termenului.
Obiectivele diferite ale cercetarii, urmarite intr-un caz sau altul, conduc la adoptarea unor tipuri diferite de esantioane, cum ar fi cele unice (utilizate o singura data) si cele panel (utilizate in mai multe cercetari), respectiv esantioane de baza si esantioane multifazice.
Daca esantionul de baza reprezinta o reducere la o anumita scara a universului cercetarii, suficient de mare pentru a servi la elaborarea ulterioara de esantioane reprezentative, esantionul multifazic (sau ierarhizat) se refera la faptul ca dintr-un esantion utilizat la un moment dat se extrag esantioane mai mici pentru unele studii partiale (T. Rotariu, P. Ilut, Ancheta sociologica si sondajul de opinie, 1997).
La randul sau, esantionul panel (fix) serveste la masurarea schimbarii si la analiza sensului principal al determinarii in cazul variabilelor ce se influenteaza reciproc.
Proiectarea, construirea si patrarea esantioanelor fixe reprezentative ridica o serie de probleme, insa avantajele studiului panel compenseaza eforturile depuse. In plus, esantioanele fixe se realizeaza cu costuri reduse, comparativ cu determinarea la fiecare ancheta in parte, iar informatiile obtinute - cel mai adesea - sunt mai complete si mai sigure decat cele din cadrul anchetelor sociologice unice (S. Chelcea, I. Marginean, I. Cauc, Cercetarea sociologica. Metode si tehnici de cercetare, 1998).
Printre problemele critice ale esantionului panel enumeram: participarea, mortalitatea si conditionarea.
Practica studiilor panel arata ca doar 8 din 10 persoane solicitate consimt sa fie incluse in astfel de esantioane. Daca exista anumite diferente, relevante pentru cercetare, intre cel care accepta sa participe si cel care refuza, reprezentativitatea are de suferit.
Apoi s-a constatat ca numai o parte din persoanele care au consimtit sa participe in panel coopereaza in continuare cu cercetatorii. La randul lor, schimbarea adresei, modificarea statusului persoanei, decesul provoaca alte pierderi (,,mortalitatea") esantionului fix.
Cat priveste conditionarea, ea se refera la modificarea comportamentului celor studiati doar pentru faptul ca au intrat in esantionul panel.
In cercetarea panel asupra calitatii vietii
organizata
In practica s-au imaginat diferite modalitati de corectare a esantionului panel si pastrarea reprezentativitatii, cum ar fi: adaugarea de persoane selectate aleatoriu de pe o lista de rezerva, compararea rezultatelor cu cele ale unui esantion alternativ etc.
CURS NR.10
Erori si surse de eroare in anchete si sondaje
Definirea notiunii
Notiunea de eroare se poate defini in procesul de masurare, cand se porneste de la premisa ca exista o valoare "adevarata", fixa, independenta, a marimii ce se masoara si care, in cadrul acestui proces, datorita imperfectiunii aparatelor sau organelor de simt, nu poate fi regasita exact, ci numai cu aproximatie.
Erori legate de esantionare
-pentru esantioanele probabilistice se poate calcula in cazul fiecarui indicator folosit ,adica in cazul fiecarei intrebari o marime numita eroare standard care arata cat este in medie eroarea comisa, atunci cand inlocuim valoarea din populatie cu cea din esantion.
-caracterul nealeator al unui esantion poate fi probat prin existenta unuia sau mai multor factori de distorsiune. , deci cu actiune constanta.
Ex. daca publicam intr-un ziar o serie de intrebari prin care cerem oamenilor sa ne spuna lucruri din care sa deducem opiniile lor politice -avem o serie de factori de distorsiune:
-intrebarile ajung doar la o parte din populatie,
-in randul cititorilor se va face o selectie nealeatoare a persoanelor care raspund.
-nonraspunsurile produc distorsiuni prin deformarea esantionului, care initial, a putut fi ales in mod corect.
-dificultatea gasirii persoanei cautate din cauza programului sau in perioada anchetei
-mutarea intregii familii de la adresa mentionata -invalidarea rapunsurilor la un chestionar intreg
-nereturnarea unui chestionar trimis prin posta.
Erori legate de constructia chestionarului
Erori datorate formularii intrebarilor
Erori generate de numarul si ordinea intrebarilor
Erori generate de forma de raspuns a intrebarilor
Erori produse de constructia grafica a chestionarului
Erori produse de formularea intrebarilor
Apar erori datorita limbajului utilizat -se folosesc cuvinte si expresii din limbajul comun sau trebuie sa se faca apel la notiuni, idei foarte simple. De asemenea se recomanda folosirea unui discurs care sa nu dea nastere la variante diferite de interpretare
Erorile sunt legate si de continutul intrebarilor . Astfel in raport cu problema studiata se vor elabora intrebari concrete si precise
Una din greselile cele mai frecvente este aceea de a cuprinde doua intrebari in una singura:
Ex. In ce masura sunteti multumit de politica guvernului in domeniile invatamantului si cercetarii stiintifice?
Se recomanda evitarea constructiei intrebarilor in forme care sa sugereze raspunsurile.
Ex. Foarte multa lume considera necesara inasprirea anumitor categorii de pedepse prevazute in Codul Penal, deoarece la noi in tara, in ultimii ani, fenomenul criminalitatii a luat o amploare necunoscuta pana acum si este de presupus ca lucrurile se vor inrautatii si mai mult, prin extinderea folosirii drogurilor, a armelor de foc etc.Dumneavoastra sunteti sau nu de acord cu o asenmenea modificare a Codului Penal? fata de
Sunteti sau nu de acord cu modificarea Codului Penal, in sensul inaspririi pedepselor pentru acele infractiuni care, in ultima vreme, s-au inmultit?
Erori generate de numarul si ordinea intrebarilor
-numarul intrebarilor -daca durata unei anchete depaseste timpul pe care subiectuliil acorda acestei activitati, acesta va da semne de nerabdare si se vor primi raspunsuri superficiale, eronate
-ordinea intrebarilor-datorita unei intrebari dificile sau referitoare la o situatie delicata subiectul isi poate schimba atitudinea si poate refuza continuarea discutiei-se vor aseza la sfarsitul chestionarului-intrebarile de identificare-ex, ocupatie,scolaritate etc
-contaminarea raspunsurilor la o intrebare ce urmeaza in chestionar dupa o alta referitoare la acelasi subiect sau la unul apropiat
-intrebarile filtru-existenta sau nonexistenta intrebarilor filtru poate conduce la erori-situatia este mai dificila in cazul intrebarilor de opinie-sa aflam parerea gospodinelor despre detergentul X-o intrebare directa este irelevanta. In acest sens aplica "planul in cinci puncte" a lui Gallup
1.-Prin intermediul primelor doua intrebari vom verifica daca subiectul a auzit despre produs
2.Prin a treia intrebare ne vom centra pe aspectul concret al problemei
3.Ultimele doua intrebari se vor referi la aspecte speciale ce conduc la
cunoasterea mai clara a aspectului relevat de a treia intrebare.
Ati auzit de produsul X? da nu
Despre ce produs este vorba?
Ati folosit in ultima luna acest detergent? Da nu
De ce folositi(nu folositi) acest detergent ?
Pentru subiectii care raspund cu da -Daca pretul detergentului ar creste cu....lei, l-ati mai folosi?
Pentru subiectii care raspund cu nu - daca pretul detergentului ar scade cu ....lei, ati fi dispusa sa treceti la folosirea lui?
Erori generate de forma de raspuns
-utilizarea necorespunzatoare de inregistrare a raspunsului
In cazul intrebarilor inchise
a-subiectului i se sugereaza raspunuri posibile atunci cind el in fapt nu are raspuns
b-neadaptarea sistemului de raspuns la continutul intrebarii
c-ordinea variantelor de raspuns-anchetele electorale -listele cu numele personalitatilor politice
In cazul intrebarilor deschise
a.-oamenilor le place sa scrie si chestionarele pot cuprinde informatii putin relevante
b . -in ancheta orala raspunsul se inregistreaza de catre operator care va introduce erori specifice
c . -subiectul poate sa nu-si exprime opinia in cele mai potrivite cuvinte
d. -variantele de raspuns pot asigura unitatea interpretarii sensului intrebarii , iar in forma deschisa pot genera interpretari diferite
e. -opinia poate exista intr-o forma latenta si nu poate fi descoperita decat prin variantele de raspuns
f. -in procesul de postcodificare numarul erorilor poate fi ridicat
Erori generate de constructia grafica a chestionarului
a.-intrebarile sa fie clar delimitate unele de altele ca si de varintele proprii de raspuns
b. -intrebarile filtru sa nu fie prea multe deoarece multitudinea sagetilor si bifurcatiilor poate deruta subiectul
c. -continuarea seriei de variante de raspuns la o intrebare de pe o pagina pe alta
Erori datorate operatorilor
a.trasaturile de personalitate-aspectul exterior-placut/neplacut
-caracteristicile vocii(ton ,ritm etc)
-temperament ,nivel de cunostinte, trasaturi morale
erori: frecventa mare a nonraspunsurilor
greseli de codificare
inregistrarea unei opinii neconforma cu realitatea
b. corelatia dintre tema anchetei si atitudinea sau opiniile anchetatorului
c. anticipatiile operatorului
-anticipatii de structura-atitudine-operatorul evalueaza dupa raspunsul la primele intrebari atitudinea subiectului fata de tema anchetei
-anticipatii de rol-imaginea pe care operatorul si-o face asupra subiectului
-anticipatiile de probabilitate-distributia raspunsurilor pe care operatorul o anticipa
Erori datorate respondentilor
-dezirabilitatea sociala-tendinta subiectilor de a da raspunsuri in conformitate cu ceea ce e de dorit din punct de vedere social
-limitele memoriei umane-memoria de lunga durata -cu cat intervalul de timp dintre petrecerea unui eveniment si cel al chestionarii este mai mare cu atat probabilitatea de a aparea raspunsuri gresite sau nonraspunsuri creste.
-procesarea si interpretarea informatiei -intelesul diferit pe care subiectii il atribuie unuia sau aceluiasi cuvant, precum si relatia cognitiva respodent-operator
Politica de confidentialitate |
.com | Copyright ©
2024 - Toate drepturile rezervate. Toate documentele au caracter informativ cu scop educational. |
Personaje din literatura |
Baltagul – caracterizarea personajelor |
Caracterizare Alexandru Lapusneanul |
Caracterizarea lui Gavilescu |
Caracterizarea personajelor negative din basmul |
Tehnica si mecanica |
Cuplaje - definitii. notatii. exemple. repere istorice. |
Actionare macara |
Reprezentarea si cotarea filetelor |
Geografie |
Turismul pe terra |
Vulcanii Și mediul |
Padurile pe terra si industrializarea lemnului |
Termeni si conditii |
Contact |
Creeaza si tu |