Analiza datelor in cercetarile de marketing
1.Activitati preliminare in analiza datelor
Dupa culegerea datelor prin intermediul chestionarelor si sistematizarea acestora, inainte ca acestea sa intre in procesul de prelucrare si analiza propriu-zisa au loc urmatoarele activitati:
a)determinarea bazei de calcul procentual
b)calculul erorilor
c)testarea semnificatiei procentajelor
a)determinarea bazei de calcul procentual
Este importanta pentru prelucrarile ulterioare ale datelor colectate cu ajutorul chestionarelor. Presupunem ca unui esantion de 500 de subiecti li s-a aplicat un chestionar cu patru intrebari inchise.
1.Inchiriati casete video? a)Da b)Nu (Daca nu, interviul nu mai are loc)
2.Vi se par tarifele de inchiriere ridicate a)Da b) Nu
3.Ce fel de inregistrari video inchiriati: a) filme, b)desene animate, c)spectacole, d) documentare, e)videoclipuri, f) competitii sportive, g) altele
Ce tipuri de filme inchiriati? a) de actiune, b)comedii, c)muzicale, d)SF, e) altele
Informatiile colectate din chestionare au fost sistematizate tabelar, astfel:
Intrebarea |
Raspunsuri |
Numar total |
|
raspunsuri |
respondenti |
||
a)300, b)200 | |||
a)150, b)100 | |||
a)165,b)57,c)62,d)48, e)120,f)35,g)23 | |||
a)124,b)75,c)38,d)150 e)62 |
Sa se stabileasca baza de calcul procentual care trebuie sa fie considerata pentru prelucrarea datelor cu ajutorul chestionarului.
Ca baza de calcul procentual se poate utiliza:
-numarul total de subiecti pe esantion
-numarul total de respondenti
Diferenta dintre cele doua o reprezinta:
- nonraspunsurile -apar in cazul persoanelor din esantion care nu au dorit sau nu au stiut sa raspunda la o anumita intrebare
-persoanele neimplicate -subiecti care fac parte din esantion dar care nu sunt vizati de o anumita intrebare, respectiv care au fost separati de restul esantionului printr-o intrebare filtru.
La intrebarea 2, marimea esantionului nu este relevanta, deoarece aceasta intrebare ii priveste doar pe cei care inchiriaza casete video (300 de persoane), numarul persoanelor neimplicate fiind de 200.
Da 150 50 %
Nu 100 33,33 %
Non raspunsuri 50 16,7%
Subpopulatia 300 100 %
In acest caz, baza de calcul este numarul subiectilor care inchiriaza casete video.
Se poate lua ca baza de calcul si numarul respondentilor, 250.
Da 150 60%
Nu 100 40 %
Respondenti 250 100 %
La intrebarea 3, baza de calcul ar putea fi stabilita astfel:
Numarul raspunsurilor este mai mare decat al subiectilor din esantion.Se pot utiliza ambii indicatori, dar semnificatia rezultatelor este diferita.
Inregistrari video |
Numar de raspunsuri |
Ponderea in numarul total |
|
de raspunsuri |
de respondenti(%) |
||
a.filme artistice | |||
b. desene animate | |||
c.spectacole | |||
d.documentare | |||
e.clipuri | |||
f.competitii sportive | |||
g.altele | |||
Total raspunsuri respondenti |
b)calculul erorilor
Eroarea datorata nonraspunsurilor se poate calcula in mai multe moduri.
EXEMPLU
Intr-un chestionar referitor la intentiile de efectuare a unei vacante in strainatate s-a pus intrebarea Intentionati sa efectuati o vacanta in strainatate in urmatoarele 6 luni ?
Da
Nu
Nu stiu
Raspunsurile pe un esantion de 1200 sunt:
Variante de raspuns |
a |
b |
c |
Numar de raspunsuri |
Aparitia nonraspunsurilor poate fi determinata de urmatoarele cauze:
1.imposibilitatea intervievarii subiectilor inclusi pe lista de sondaj-nu au putut fi contactati, si-au schimbat domiciliul, se afla vacanta, sunt bolnavi etc
2.refuzul de a raspunde
3.abandon pe parcursul completarii chestionarului
imposibilitatea de a raspunde-intrebari neclare, subiect necunoscut, nefamiliar, nu-si amintesc un aspect solicitat etc.
Se calculeaza ponderile nonraspunsurilor:
ponderea celor care nu vor efectua o vacanta in strainatate
ponderea celor care s-ar putea sa plece intr-o vacanta in strainatate(cei care nu au raspuns s-ar putea sa plece totusi in strainatate)
ponderea celor care vor calatori probabil in strainatate
(indecisii-300, se impart in mod egal intre cele doua alternative de raspuns)
ponderea celor care s-ar putea sa efectueze o calatorie in strainatate in urmatoarele 6 luni, in ipoteza ca persoanele indecise au aceeasi atitudine ca si respondentii.
Eroarea totala este produsul dintre eroarea de esantionare, eroarea datorata nonraspunsurilor si eroarea de masurare.
Eroarea totala se calculeaza cu metoda ERA(Error Ratio Analysis) a lui Brown:
unde:
este eroarea totala
este eroarea de esantionare
este eroarea datorata nonraspunsurilor
este eroarea de masurare
EXEMPLU
Se considera un sondaj in care au fost determinati indicatorii:
-proportia reala a componentelor populatiei statistice care au o anumita caracteristica, t=0,7
-proportia observata, r=0,8
-proportia reala in esantionul prevazut p=0,6
-proportia reala in esantionul intevievat a=0,9
Sa se calculeze eroarea totala, eroarea datorata nonraspunsurilor, eroarea de esantionare, eroarea de masurare.
Eroarea totala:
Eroarea de esantionare:
Eroarea datorata nonraspunsurilor:
Eroarea de masurare:
c)testarea semnificatiei procentajelor
In cazul unei esantionari probabilistice simple si a unei intrebari cu raspuns unic, testarea semnificatiei diferentei dintre doua procentaje si se realizeaza cu formula:
unde n este marimea esantionului si n> 30.
Regula de decizie este urmatoarea:
daca > 1,96 diferenta este semnificativa pentru pragul de probabilitate de 95%
daca <1,96, diferenta nu este semnificativa la pragul de probabilitate de 95%
In cazul unei esantionari probabiliste simple si al unei intrebari cu raspunsuri multiple, testarea semnificatiei diferentei dintre doua procentaje si se realizeaza cu formula:
n este marimea esantionului, iar este ponderea subiectilor care au mentionat simultan doua criterii.
2.Analiza univariata a datelor
Analiza datelor reprezinta procesul de aplicare a tehnicilor statistico-matematice, in scopul extragerii din baza de date a informatiilor necesare procesului decizional de marketing.
Metodele de analiza se pot grupa dupa mai multe criterii si anume:
tipul de scala utilizat(nominala, ordinala, interval sau proportionala)
numarul esantioanelor cercetare(unul, doua sau mai multe)
natura relatiei dintre esantioane(independente sau dependente)
numarul variabilelor considerate
Obiectivele urmarite in analiza datelor sunt de obicei:
determinarea tendintei centrale a variabilelor
caracterizarea variatiei si repartitiei acestora
masurarea gradului de asociere dintre ele
realizarea unor estimari si previziuni
evaluarea diferentelor dintre variabile sau grupuri de variabile
evidentierea legaturilor cauzale dintre ele
2.1. Determinarea tendintei centrale
Tendinta centrala se caracterizeaza diferit in functie de nivelul la care s-a realizat masurarea.
Tabel 1
Tipuri de scale |
Indicatori ai tendintei centrale |
|||
Grupul modal(valoarea modala) |
Mediana |
Media aritmetica |
Media geometrica |
|
Nominala |
x | |||
Ordinala |
x |
x | ||
Interval |
x |
x |
x | |
Proportionala |
x |
x |
x |
x |
Indicatorii tendintei centrale sunt:
valoarea modala
grupul modal
mediana
media aritmetica
media geometrica
Daca datele sunt negrupate, valoarea modala este cea care prezinta cea mai mare frecventa de aparitie.
Exemplu:
Intr-o cercetare directa a preferintelor populatiei unui oras pentru turismul de weekend, esantionul este alcatuit din 350 de persoane, care practica aceasta forma de turism, distribuite dupa statutul socio -profesional, dupa cum urmeaza:
Tabel 2
Categoria socio-profesionala |
Numar persoane |
Muncitori | |
Maistri-tehnicieni | |
Liber intreprinzatori | |
Functionari | |
Persoane cu studii superioare | |
Elevi-studenti | |
Casnice | |
Pensionari | |
Altii |
Valoarea modala este 110.
In cazul distributiei de frecvente specifice datelor grupate, grupul modal este constituit din grupul care cuprinde cele mai multe componente comparativ cu celelalte grupuri.
Presupunem ca acelasi esantion se distribuie pe grupe de varsta:
Tabel 3.
Grupa de varsta(ani) |
Numar de persoane |
sub 14 ani | |
61 si peste |
Grupul modal este reprezentat de grupul 19-24 de ani.
Mediana-reprezinta valoarea deasupra si dedesubtul careia se afla cate o jumatate din observatii.
Daca datele sunt negrupate si daca numarul observatiilor este fara sot, mediana este la mijloc.
EXEMPLU:
Numarul de portii dintr-un preparat culinar vandute in cinci restaurante
Tabel 4
Restaurantul |
Numarul de portii |
R1 | |
R2 | |
R3 |
110 mediana |
R4 | |
R5 |
Daca numarul observatii este cu sot, mediana se considera a fi la jumatate, intre cele doua valori centrale.
Exemplu:
Tabel 5
Restaurantul |
Numarul de portii |
R1 | |
R2 | |
R3 | |
R4 |
Mediana este 90.
In cazul datelor grupate, mediana se calculeaza astfel:numarul total de observatii(frecvente) se
imparte la doi si astfel rezulta cate observatii trebuie sa fie deasupra si cate dedesubtul medianei; dupa aceasta se determina frecventele cumulate pentru a stabili in care grupa se situeaza mediana; in final se calculeaza valoarea medianei.
In cazul datelor din Tabelul 3., totalul frecventelor este 350, rezulta ca 175 de observatii trebuie sa se afle deasupra medianei si 175 dedesubtul ei.Observam ca grupei 19-24 ani frecventele cumulate care ii corespund sunt 220-valoarea care este cea mai apropriata de 175, decat ar fi frecventele cumulate corespunzatoare grupei 14-18 ani.Deci valoarea medianei se situeaza undeva in cadrul grupei de de varsta 19-24 ani.Marimea intervalului 19-24 ani este de 5, aceasta se pondereaza cu numarul de observatii aditionale necesare(120/126), iar valoarea se adauga la 19.Rezulta ca mediana este situata la categoria de varsta de 23,75 ani, deci aproape 24 de ani.
Media aritmetica este un indicator al tendintei centrale in cazul scalelor interval si proportionale(vezi Tabel 1).
Media aritmetica, a unei variabile x despre care se cunosc n observatii intr-un esantion investigat, se calculeaza dupa formula:
Daca vanzarile unui supermarket au fost pe parcursul unei saptamani de: 300 u.m. (luni), 530 u.m.(marti), 340 u.m.(miercuri), 320 u.m.(joi), 510 (u.m.)vineri, 710 u.m.(sambata), media vanzarilor zilnice, pe saptamana in cauza este:
u.m.
Media aritmetica ponderata se calculeaza cu formula:
unde reprezinta valoarea variabilei x corespunzatoare frecventei .
EXEMPLU.
In cazul unei cercetari a imaginii unui hotel de catre un grup de turist, amplasamentul a fost apreciat de catre membrii esantionuluii pe o diferentiala semantica cu 5 trepte astfel:
f.favorabil 70 45 35 30 20 f.nefavorabil
Pentru evaluarea sintetica a opiniei turistilor, se atribuie fiecarei trepte o nota(care reflecta aprecierea lor): 5=f.favorabil, 1=f.nefavorabil.
Aprecierea medie:
Daca datele sunt grupate, pentru calcul mediei aritmetice se foloseste formula:
unde este frecventa grupului i
este punctul de mijloc al intervalului unui grup
n este numarul de observatii cuprinse in esantion
EXEMPLU
Calculul mediei vanzarilor in cazul unui numar de 50 de magazine, grupate dupa vanzarile realizate.
Tabel 6
Vanzari (u.m.) |
Numar de unitati () |
Mijlocul intervalului () |
|
TOTAL |
Media geometrica este un indicator al tendintei centrale in cazul scalelor proportionale(vezi Tabel 1.)
Formule de calcul:
2.2.Modalitati de caracterizare a variatiei si repartitia variabilelor
Caraterizarea variatiei se face diferentiat in functie de nivelul de masurare realizat printr-un tip de scala sau altul(Tabel 7)
Tabel 7.
Indicatori ai variatiei |
Tipuri de scale |
|||
Nominale |
Ordinale |
Interval |
Proportionale |
|
Distributia de frecvente |
x |
x |
x |
x |
Procente |
x |
x |
x |
x |
Decile |
x |
x |
x |
|
Centile |
x |
x |
x |
|
Cuartile |
x |
x |
x |
|
Amplitudinea variatiei |
x |
x |
||
Abaterea medie |
x |
x |
||
Varianta |
x |
x |
||
Abaterea standard |
x |
x |
Cuartilele -reprezinta doua valori stabilite ca o patrime din observatii sa se afle sub prima cuartila(numita cuartila inferioara) si o patrime din observatii se afle deasupra celei de-a doua cuartile(cuartila superioara).Celelalte doua patrimi din observatii se afla intre valorile celor doua cuartile si mediana.
Decilele -reprezinta impartirea numarului observatiilor la 10.
Centilele-reprezinta impartirea numarului observatiilor la 100.
Amplitudinea absoluta a variatiei-este diferenta dintre observatia cu valoarea cea mai mare si cea cu valoarea cea mai mica.
Amplitudinea relativa a variatiei este raportul dintre amplitudinea absoluta si medie.
Abaterea medie-este media aritmetia a valorilor absolute ale abaterilor termenilor esantionului de la media lor.
Varianta-este media aritmetica a patratelor abaterilor individuale ale termenilor esantionului de la medie.
Abaterea standard este radical cu semnul plus din varianta.
3.Analiza bivariata ( analiza gradului de asociere a doua variabile)
Presupune masurarea gradului de asociere a doua variabile, sub aspectul:
- directiei(naturii),
- intensitatii;
- semnificatiei statistice.
3.1.Masurarea asocierii dintre variabile nominale
Se poate realiza cu ajutorul:
-coeficientului de corelatie phi
-coeficientul de contigenta
Procesul de masurare a gradului de asociere in cazul acestor variabile incepe prin construirea de tabele de contigenta.
Un asemenea tabel contine distributia de frecvente, considerata simultan pentru doua sau mai multe variabile caracteristice.
EXEMPLU
Dorim sa aflam daca preferintele barbatilor pentru un anumit tip de fastfood, in care fumatul este interzis, difera semnificativ de preferintele femeilor.
Cu datele culese de la un esantion de 500 de persoane, din care 300 barbati si 200 femei, se poate alcatui tabelul de contingenta:
Tabel 8
Sexul |
Prefera unitatea |
Nu prefera unitatea |
Total |
Barbati | |||
Femei | |||
TOTAL |
Calculam procentual preferintele membrilor esantionului.
Tabel 9.
Sexul |
Prefera unitatea(%) |
Nu prefera unitatea |
Total |
Barbati | |||
Femei |
Probabilitatea ca un barbat sa prefere fastfoodul este de 65,33%, iar ca o femeie sa-l prefere este de 71 %.
Gradul de asociere dintre cele doua variabile: sex si preferinta(variabile dihotomice) se poate determina cu ajutorul coeficientului de corelatie phi. El se calculeaza cu formula:
unde a,b,c,d, reprezinta frecventele tabelului de contigenta de tipul 2 x 2, dupa cum urmeaza:
a |
b |
c |
d |
In cazul nostru:
a=196 |
b=104 |
c=58 |
d=142 |
deci
Coeficientul de corelatie poate lua valori intre -1,0 si +1,0.Cele doua extreme indica o asociere perfecta intre variabile, iar valoarea zero indica lipsa corelatiei.
Pentru a determina in ce proportie preferintele pentru fastfoodul investigat sunt explicate de variabila sex coeficientul se ridica la patrat, pentru a obtine coeficientul de determinare, care indica proportia variatiei explicate a unei din variabile de catre cealalta variabila.
Aceasta inseamna ca 12,67 % din variatia preferintelor este explicata de variabila sex.
Concluzia este ca intensitatea asocierii intre cele doua variabile este foarte slaba.
Semnul coeficientului de corelatie caracterizeaza directia asocierii.Semnul + indica o corelatie pozitiva, in sensul ca exista o asociere intre sexul masculin si preferinta pentru fastfoodul luat in discutie.
Pentru testarea gradului de semnificatie a asocierii dintre opiniile subiectilor din cele doua esantioane independente(barbati si femei) si preferinta pentru fastfood, se utilizeaza testul neparametric .Prin acest test se urmareste sa se stabileasca daca preferintele barbatilor difera semnificativ fata de ale femeilor.
Realizarea testului are ca punct de plecare ipoteza nula -faptul ca valoarea coeficientului de corelatie nu difera semnificativ fata de zero, adica preferintele barbatilor nu difera semnificativ de ale femeilor.
ipoteza nula H 0:
ipoteza alternativa H1:
Se determina cu formula:
unde:
r si k reprezinta numarul de randuri si respectiv de coloane ale tabelului de contigenta
frecventele randului i si ale coloanei j care rezulta din observare
frecventele randului i si ale coloanei j care se asteapta sa rezulte conform ipotezei nule; ele se obtin prin inmultirea frecventei marginale a randului i cu cea a coloanei j si impartirea produsului la numarul total al cazurilor(marimea esantionului)
Valorile rezultate prin utilizarea formule de mai sus au o repartitie de esantionare care poate fi aproximata de o repartitie cu (r-1)(k-1) grade de libertate.Daca valoarea calculata a lui este egala sau mai mica decat valoarea teoretica corespunzatoare unui numar de grade de libertate si unui anumit grad de semnificatie, atunci ipoteza nula se accepta.
In exemplul nostru:
Valoarea teoretica pentru (2-1)(2-1)=1 grad de libertate este de .Deoarece se poate afirma ca la un nivel de semnificatie de 0,05 ipoteza nula nu se accepta(se accepta ipoteza H1) adica difera semnificativ de zero, deci preferintele barbatilor difera semnificativ de cele ale femeilor.
Ori de cate ori tabelul de contingenta este de tipul 2 x 2, pentru determinarea valorii lui se poate utiliza si urmatoarea formula :
unde a, b, c, d au aceeasi semnificatie, iar N=a+b+c+d.
Deoarece, asa cum este cazul si in acest exemplu, testul care este conceput pentru repartitii continue se aplica unor date in forma discreta, pentru o mai mare exactitate, apare necesitatea unei corectii pentru continuitate, cunoscuta sub denumirea de corectia lui Yates.
In aceste conditii, valoarea calculata a lui se face cu formula:
In cazul nostru:
Intrucat concluziile raman aceleasi cu cele stabilite pentru aplicarea primei formule.
Pentru masurarea gradului de asociere intre variabilele unui tabel de contigenta cu orice numar de randuri sau coloane se utilizeaza coeficientul de contingenta C, care se calculeaza dupa formula:
unde: este valoarea calculata a lui
N-este numarul subiectilor din esantion
Daca numarul de coloane ale tabelului de contigenta este egal cu numarul de linii, atunci valoarea coeficientului C este pozitiva si variaza intre zero si , unde c este numarul de coloane ale tabelului de contingenta.
In cazul cercetarilor de marketing se uilizeaza scheme de proiectare de tip "inainte-dupa", in care subiectii din esantion sunt supusi la doua masurari-.inainte si dupa aplicarea factorului experimental.
De exemplu, daca factorul experimental este o actiune promotionala, este mare probabilitatea de a se modifica opinia subiectilor, masurata dupa aplicarea acestuia.
In aceste situatii, pentru testarea semnificatiei schimbarilor de opinie de la o masurare la alta, se foloseste testul McNemar.
Tabelul de contigenta in acest caz este:
Masurare "dupa" |
Imagine nefavorabila |
Imagine favorabila |
Imagine favorabila |
a |
b |
Imagine nefavorabila |
c |
d |
unde a, b, c,d reprezinta frecventele de aparitie a celor patru cazuri posibile in urma aplicarii factorului experimental.
Ceea ce intereseaza in acest exemplu sunt doar frecventele inregistrate in celulele a si d, suma lor reprezentand totalul persoanelor care si-au modificat imaginea intre prima si a doua masurare.
Conform ipotezei nule se asteapta ca jumatate din modificari si anume sa fie intr-o directie (ele vor aparea in celula a) si jumatate sa fie in cealalta directie(ele vor apare in celula d).
Testul McNemar este o adaptare a testului la specificul unui tabel de contigenta in care sunt considerate doar frecventele inregistrate in cele doua celule.
se determina cu formula:
unde frecventele care rezulta din observare
frecventele care se asteapta sa rezulte conform ipotezei nule, respectiv
Dupa realizarea gruparii si simplificari, se ajunge la forma finala :
Daca aplicam corectia lui Yates, atunci:
Daca valoarea lui este egala sau mai mare decat valoarea teoretica, corespunzatoare unui grad de libertate si a unui anumit grad de semnificatie, ipoteza nula nu se accepta, deci factorul experimental a avut o influenta semnificativa asupra imaginii subiectilor care compun esantionul.
Presupunem ca avem urmatorul tabel de contigenta, in cazul unui esantion de 250 de persoane.
Masurare "dupa" |
Imagine nefavorabila |
Imagine favorabila |
Imagine favorabila | ||
Imagine nefavorabila |
Rezulta ca :
Valoarea teoretica pentru un grad de libertate este de Deoarece calculat are valoare mai mare decat teoretic, la un grad de semnificatie de 0,025, ipoteza nula nu se accepta, adica actiunea promotionala a determinat schimbari semnificative ale produsului in randul turistilor.
3.2.Masurarea asocierii variabilelor ordinale
Masurarea gradului de asociere intre variabile masurate cu ajutorul scalelor ordinale este mai plina de semnificatii, deoarece, inafara relatiei de echivalenta presupusa de o scala nominala, tipul de scala ordinala permite si ordonarea alternativelor cercetate pentru fiecare variabila cercetata.
Variabilele ordinale pot varia concomitent intr-o anumita directie, care poate fi pozitiva(variatia se realizeaza in acelasi sens) sau negativa(variatia se realizeaza in sensuri contrare).
Exista doua modalitati de cercetare a relatiilor de asociere:
a)relatiile dintre rangurile alternativelor considerate pentru cele doua variabile
b)relatiile dintre variabilele de tip ordinal
a) relatiile dintre rangurile alternativelor variabilelor
Se utilizeaza coeficientul Spearman de corelatie a rangurilor, , care are formula de calcul:
-diferenta intre cele doua ranguri, detinute de variabila i
n-marimea esantionului
EXEMPLU
Consideram 10 firme de turism, A,B,C,D,E,F,G,H,I,J, care ocupa locurile 1,2,3,4,5,6,7,8,9,10 in ceea ce priveste profitabilitatea la sfarsitul anului si locurile 2,4,1,5,3,7,6,9,8,10 in ceea ce priveste gradul de ocupare.
Pentru masurarea gradului de asociere dintre rangurile detinute de cele 10 firme in privinta profitabilitatii, pe de o parte, si gradului de ocupare, pe de alta, se va folosi coeficientul de corelatie a rangurilor Spearman .
Tabelul de date:
Firma |
Rangul detinut in ceea ce priveste |
|
|
|
Profitabilitatea |
Gradul de ocupare |
|||
A | ||||
B | ||||
C | ||||
D | ||||
E | ||||
F | ||||
G | ||||
H | ||||
I | ||||
L | ||||
TOTAL |
Rezulta ca :
Stiind ca poate lua valori intre -1(pentru o corelatie inversa perfecta) si +1 ( pentru o corelatie directa perfecta, iar zero pentru lipsa totala de asociere, in cazul considerat intre profitabilitate si gradul de ocupare exista o corelatie directa si foarte intensa.
Pentru a testa gradul de semnificatie statistica a coeficientului de corelatie se formuleaza ipoteza nula si ipoteza alternativa:
ipoteza nula: H0
ipoteza alternativa H1:
Pentru un nivel de incredere de 0,99 valoarea coeficientului Z este 2,58.
Pentru determinarea valorii calculate a lui Z se foloseste formula:
Stiind ca daca se accepta ipoteza nula, iar in caz contrar se accepta ipoteza alternativa, concluzia este ca se accepta H1, adica valoarea coeficientului de corelatie a rangurilor in populatia cercetata difera in mod semnificativ de zero.
b)relatiile dintre variabilele ordinale
Atunci cand se cerceteaza relatiile dintre variabilele ordinale si cand mai multe alternative sunt la egalitate, gradul de asociere se masoara prin coeficientul lui Goodman si a lui Kruskal, .
Acesta se
calculeaza cu formula:
unde P si Q sunt valori calculate, ca in exemplul de mai jos.
EXEMPLU
Se organizeaza degustarea unui preparat culinar dietetic intr-un esantion de 301 de persoane, culegandu-se informatii cu privire la intentia de a le cumpara in viitor.Intentiile sunt prezentate pe cinci niveluri, de la categoria 1- sigur va cumpara, la categoria 5 -sigur nu va cumpara.
Prezentarea datelor culese:
Categorii de varsta |
Intentii de cumparare |
||||
sub 20 de ani 20-40 de ani 40-50 de ani peste 50 de ani |
Se doreste a se afla gradul de asociere dintre variabilele "intentii de cumparare" si "varsta".
Pentru calculul lui P se procedeaza in felul urmator: se porneste prin a inmulti frecventa din partea stanga sus cu suma frecventelor aflate mai jos cu un rind si la dreapta, astfel:
Apoi pe coloana a doua, a treia si a patra.
Mai departe se considera frecventele situate pe randurile doi si trei:
+15+10+5+25+20+20+1)=960
10(15+10+5+20+5+1)=560
15(10+5+5+1)=315
20(5+1)=120
20(25+20+5+1)=1020
15(20+5+1)=390
15(5+1)=90
10(1)=10
Insumand toate produsele obtinute se obtine P=6815
Pentru calcularea lui Q se porneste din stanga sus si se procedeaza similar.
linia 1
+10+15+20+20+15+15+10+35+25+20+5)=5000
20(10+10+15+20+15+15+35+25+20)=3300
15(10+10+20+15+35+25)=1725
10(10+20+35)=650
linia 2
20(10+15+15+20+35+25+20+5)=2900
20(15+15+20+35+25+20)=2600
15(20+15+35+25)=1425
10(20+35)=550
linia 3
5(5+20+25+35)=425
10(20+25+35)=800
15(25+35)=900
15(35)=525
Q=20800
Cunoscand ca poate lua valori in intervalul -1 si +1, in acest caz, intentiile de cumparare ale produsului culinar testat si varsta exista o corelatie inversa destul de intensa.
OBSERVATIE
Avand determinate sumele P si Q, se poate calcula si coeficientul de corelatie a rangurilor a lui Kendall, cu formula:
, in care S=P+Q, iar n este marimea esantionului.
3.3.Corelatia dintre variabilele metrice
In cazul scalelor metrice(de tip interval sau proprotionale) este posibila masurarea distantelor dintre alternative.Astfel, pentru masurarea gradului de asociere a variabilelor masurate pe scale metrice se utilizeaza coeficientul de corelatie a lui Pearson, r.
unde X si Y sunt variabilele masurate cu ajutorul scalelor metrice.
EXEMPLU.
Se doreste stabilirea corelatie care exista intre modificarea venitului national in ultimii 6 ani intr-o tara oarecare si circulatia turistica interna din tara respectiva-exprimata prin cheltuielile pentru turism ale populatiei.
In tabel sunt prezentati indicii cu baza fixa ai celor doua variabile considerate in cei 6 ani si calculele necesare pentru determinarea lui r.
Anul |
Venitul national X |
Cheltuieli pentru turism Y |
|
|
XY |
|
|
|
|
|
deci valoarea lui r este :
Ridicam la patrat: si obtinem coeficientul de determinare, care indica proportia variatia explicate a uneia din variabile(97%) de catre cealalta variabila.
Coeficientul r poate lua valori intre -1 si
In cazul considerat, cele doua variabile sunt strans corelate.
Pentru a testa gradul de semnificatie, se formuleaza:
ipoteza nula H0: r
ipoteza alternativa H1:
Din tabele, pentru un nivel de incredere de 0,99, valoarea coeficientului Z este de 2,58.
Se calculeaza .
Intrucat nu se accepta ipoteza nula, adica valoarea coeficientului de corelatie difera in mod semnificativ de zero.
BIBLIOGRAFIE
Catoiu, Iacob(coordonator)-Metode si tehnici utilizate in cercetarile de marketing.Aplicatii, Editura Uranus,Bucuresti, 1999
Catoiu,Iacob(coordonator)-Cercetari de marketing,Editura Uranus,k Bucuresti, 2002
Chelcea, Septimiu-Metodologia cercetarii sociologice:metode cantitative si calitatice, Editura Economica, Bucuresti,2001
Florescu,C.,Malcomete,P.,Pop,N.Al-Marketing.Dictionar explicativ, Editura Economica, 2000
Gherasim, Toader, Gherasim, Adrian-Cercetari de marketing, Editura Economica, Bucuresti, 2003
Kotler, Ph.-Managementul marketingului, Editura Teora, 2003
Lefter, C.-Cercetarea de marketing.Teorie si practica, Editura Lux Libris, Brasov, 1996
Olteanu, V. -Management-marketing , Editura Ecomar, Bucuresti,2003
Popescu, Ioana Cecilia-Metode cantitative utilizate in cercetarile de marketing, Editura ASE, Bucuresti, 2000
Prutianu,Stefan, Anastasiei,Bogdan,Jijie,Tudor-Cercetarea de marketing.Studiul pietei pur si simplu, Editura POLIROM, Iasi, 2002
Rotariu, Traian, Ilut, Petre-Ancheta sociologica si sondajul de opinie.Teorie si practica, Editura POLIROM Iasi, 1999
Politica de confidentialitate |
.com | Copyright ©
2025 - Toate drepturile rezervate. Toate documentele au caracter informativ cu scop educational. |
Personaje din literatura |
Baltagul – caracterizarea personajelor |
Caracterizare Alexandru Lapusneanul |
Caracterizarea lui Gavilescu |
Caracterizarea personajelor negative din basmul |
Tehnica si mecanica |
Cuplaje - definitii. notatii. exemple. repere istorice. |
Actionare macara |
Reprezentarea si cotarea filetelor |
Geografie |
Turismul pe terra |
Vulcanii Și mediul |
Padurile pe terra si industrializarea lemnului |
Termeni si conditii |
Contact |
Creeaza si tu |