Fiabilitatea statistică. Nivel de semnificație statistică

FIABILITATE STATISTICĂ

- engleză credibilitate/validitate, statistic; german Validitate, statistische. Consecvența, obiectivitatea și lipsa de ambiguitate într-un test statistic sau într-un q.l. set de măsurători. D. s. poate fi testat prin repetarea aceluiași test (sau chestionar) pe același subiect pentru a vedea dacă se obțin aceleași rezultate; sau prin compararea diferitelor părți ale unui test care ar trebui să măsoare același obiect.

antinazi. Enciclopedia Sociologiei, 2009

Vedeți ce înseamnă „FIABILITATE STATISTICĂ” în alte dicționare:

    FIABILITATE STATISTICĂ- engleză credibilitate/validitate, statistic; german Validitate, statistische. Consecvența, obiectivitatea și lipsa de ambiguitate într-un test statistic sau într-un q.l. set de măsurători. D. s. poate fi verificat prin repetarea aceluiași test (sau... Dicţionarîn Sociologie

    În statistică, o valoare este numită semnificativă din punct de vedere statistic dacă probabilitatea apariției ei întâmplătoare sau chiar valori mai extreme este scăzută. Aici, prin extremă, înțelegem gradul de abatere a statisticilor testului de la ipoteza nulă. Diferența se numește... ...Wikipedia

    Fenomenul fizic al stabilității statistice este că, pe măsură ce dimensiunea eșantionului crește, frecvența unui eveniment aleatoriu sau valoarea medie mărime fizică tinde către un număr fix. Fenomenul statisticilor... ... Wikipedia

    FIABILITATEA DIFERENȚELOR (Asemănări)- procedură statistică analitică de stabilire a nivelului de semnificație a diferențelor sau asemănărilor dintre eșantioane în funcție de indicatorii (variabilele) studiați... Modern proces educațional: concepte și termeni de bază

    RAPORTARE, STATISTICĂ Marele dicţionar de contabilitate

    RAPORTARE, STATISTICĂ- o formă de observare statistică de stat, în care organele relevante primesc de la întreprinderi (organizații și instituții) informațiile de care au nevoie sub formă de documente de raportare legal stabilite (rapoarte statistice) pentru... Dicționar economic mare

    O știință care studiază metodele de observare sistematică a fenomenelor de masă ale vieții sociale umane, alcătuind descrieri numerice ale acestora și prelucrarea științifică a acestor descrieri. Astfel, statistica teoretică este o știință... ... Dicţionar Enciclopedic F. Brockhaus și I.A. Efron

    Coeficientul de corelare- (Coeficientul de corelație) Coeficientul de corelație este un indicator statistic al dependenței a două variabile aleatoare Definirea coeficientului de corelație, tipuri de coeficienți de corelație, proprietăți ale coeficientului de corelație, calcul și aplicare... ... Enciclopedia investitorilor

    Statistici- (Statistică) Statistica este o știință teoretică generală care studiază schimbările cantitative în fenomene și procese. Statistici de stat, servicii statistice, Rosstat (Goskomstat), date statistice, statistici interogări, statistici vânzări,... ... Enciclopedia investitorilor

    Corelaţie- (Corelație) Corelația este o relație statistică între două sau mai multe variabile aleatoare Conceptul de corelație, tipuri de corelație, coeficient de corelație, analiză de corelație, corelație de preț, corelarea perechilor valutare pe Conținutul Forex... ... Enciclopedia investitorilor

Cărți

  • Cercetare în matematică și matematică în cercetare: Culegere metodologică privind activitățile de cercetare studenților, Borzenko V.I.. Colecția prezintă evoluții metodologice, aplicabil în organizație activitati de cercetare elevii. Prima parte a colecției este dedicată aplicării unei abordări de cercetare în...

Ce crezi că face „cealaltă jumătate” a ta specială și semnificativă? Are legătură cu personalitatea ei sau cu sentimentele tale pe care le ai pentru această persoană? Sau poate cu simplul fapt că ipoteza despre caracterul aleatoriu al simpatiei tale, după cum arată studiile, are o probabilitate mai mică de 5%? Dacă considerăm că ultima afirmație este de încredere, atunci site-urile de întâlniri de succes nu ar exista în principiu:

Când efectuați testări separate sau orice altă analiză a site-ului dvs., neînțelegerea „semnificației statistice” poate duce la interpretarea greșită a rezultatelor și, prin urmare, la acțiuni incorecte în procesul de optimizare a conversiilor. Acest lucru este valabil pentru miile de alte teste statistice efectuate în fiecare zi în fiecare industrie existentă.

Pentru a înțelege ce este „semnificația statistică”, trebuie să vă scufundați în istoria apariției acestui termen, să-l cunoașteți sens adevăratși înțelegeți cum această „nouă” veche înțelegere vă va ajuta să interpretați corect rezultatele cercetării dumneavoastră.

Puțină istorie

Deși omenirea folosește statistica pentru a rezolva diverse probleme timp de multe secole, înțelegerea modernă a semnificației statistice, testarea ipotezelor, randomizarea și chiar Design of Experiments (DOE) a început să prindă contur abia la începutul secolului al XX-lea și este indisolubil legată de numele lui Sir Ronald Fisher (Sir Ronald Fisher, 1890-1962):

Ronald Fisher a fost un biolog evoluționist și statistician care avea o pasiune deosebită pentru studiul evoluției și selecției naturale la animale și floră. De-a lungul ilustrei sale cariere, a dezvoltat și popularizat multe instrumente statistice utile pe care le folosim și astăzi.

Fisher a folosit tehnicile pe care le-a dezvoltat pentru a explica procese din biologie, cum ar fi dominanța, mutațiile și deviațiile genetice. Putem folosi aceleași instrumente astăzi pentru a optimiza și îmbunătăți conținutul resurselor web. Faptul că aceste instrumente de analiză pot fi folosite pentru a lucra cu obiecte care nici măcar nu existau la momentul creării lor pare destul de surprinzător. Este la fel de surprinzător că oamenii obișnuiau să efectueze calcule complexe fără calculatoare sau computere.

Pentru a descrie rezultatele unui experiment statistic ca având o mare probabilitate de a fi adevărate, Fisher a folosit cuvântul „semnificație”.

De asemenea, una dintre cele mai interesante dezvoltări ale lui Fisher poate fi numită ipoteza „fiului sexy”. Conform acestei teorii, femeile preferă bărbații promiscui sexual (promiscui), deoarece acest lucru va permite fiilor născuți din acești bărbați să aibă aceeași predispoziție și să producă mai mulți descendenți (rețineți că aceasta este doar o teorie).

Dar nimeni, chiar și oamenii de știință geniali, nu este imun de a face greșeli. Defectele lui Fisher încă îi afectează pe specialiști până în prezent. Dar amintiți-vă cuvintele lui Albert Einstein: „Cine nu a greșit niciodată nu a creat nimic nou”.

Înainte de a trece la următorul punct, rețineți: semnificația statistică este atunci când diferența dintre rezultatele testelor este atât de mare încât diferența nu poate fi explicată prin factori aleatori.

Care este ipoteza ta?

Pentru a înțelege ce înseamnă „semnificația statistică”, trebuie mai întâi să înțelegeți ce este „testarea ipotezei”, deoarece cei doi termeni sunt strâns legați.
O ipoteză este doar o teorie. Odată ce ați dezvoltat o teorie, va trebui să stabiliți un proces pentru a colecta suficiente dovezi și pentru a colecta efectiv acele dovezi. Există două tipuri de ipoteze.

Mere sau portocale - care este mai bine?

Ipoteza nula

De regulă, aici mulți oameni se confruntă cu dificultăți. Un lucru de reținut este că o ipoteză nulă nu este ceva ce trebuie dovedit, cum ar fi, de exemplu, să demonstrezi că o anumită modificare pe un site web va duce la o creștere a conversiilor, ci invers. Ipoteza nulă este o teorie care afirmă că dacă faci vreo modificare a site-ului, nu se va întâmpla nimic. Iar scopul cercetătorului este să infirme această teorie, nu să o demonstreze.

Dacă ne uităm la experiența soluționării infracțiunilor, unde anchetatorii formează și ipoteze cu privire la cine este infractorul, ipoteza nulă ia forma așa-numitei prezumții de nevinovăție, concept conform căruia acuzatul este prezumat nevinovat până la proba vinovăției. într-o instanță de judecată.

Dacă ipoteza nulă este că două obiecte sunt egale în proprietățile lor și încercați să demonstrați că unul este mai bun (de exemplu, A este mai bun decât B), trebuie să respingeți ipoteza nulă în favoarea alternativei. De exemplu, comparați unul sau altul instrument de optimizare a conversiilor. În ipoteza nulă, ambele au același efect (sau nici un efect) asupra țintei. În mod alternativ, efectul unuia dintre ele este mai bun.

Ipoteza dvs. alternativă poate conține o valoare numerică, cum ar fi B - A > 20%. În acest caz, ipoteza nulă și alternativa pot lua următoarea formă:

Un alt nume pentru ipoteza alternativă este ipoteza cercetării, deoarece cercetătorul este întotdeauna interesat să demonstreze această ipoteză particulară.

Semnificația statistică și valoarea p

Să revenim din nou la Ronald Fisher și la conceptul său de semnificație statistică.

Acum că aveți o ipoteză nulă și o alternativă, cum puteți demonstra una și infirma pe cealaltă?

Deoarece statisticile, prin însăși natura lor, implică studiul unei anumite populații (eșantion), nu poți fi niciodată 100% sigur de rezultatele obținute. Un bun exemplu: rezultatele alegerilor diferă adesea de rezultatele sondajelor preliminare și chiar ale grupurilor de ieșire.

Dr. Fisher a vrut să creeze o linie de demarcație care să vă permită să știți dacă experimentul dvs. a fost un succes sau nu. Așa a apărut indicele de fiabilitate. Credibilitatea este nivelul pe care îl luăm pentru a spune ceea ce considerăm „semnificativ” și ceea ce nu. Dacă „p”, indicele de semnificație, este de 0,05 sau mai puțin, atunci rezultatele sunt de încredere.

Nu vă faceți griji, de fapt nu este atât de confuz pe cât pare.

Distribuția de probabilitate gaussiană. De-a lungul marginilor sunt valorile mai puțin probabile ale variabilei, în centru sunt cele mai probabile. Scorul P (zona umbrită în verde) este probabilitatea ca rezultatul observat să apară întâmplător.

Distribuția normală de probabilitate (distribuția Gauss) este o reprezentare a tuturor valorilor posibile ale unei anumite variabile pe un grafic (în figura de mai sus) și frecvențele acestora. Dacă faci cercetările corect și apoi trasezi toate răspunsurile pe un grafic, vei obține exact această distribuție. Conform distribuției normale, veți primi un procent mare de răspunsuri similare, iar opțiunile rămase vor fi situate la marginile graficului (așa-numitele „cozi”). Această distribuție a valorilor se găsește adesea în natură, motiv pentru care este numită „normală”.

Folosind o ecuație bazată pe eșantionul și rezultatele testelor, puteți calcula ceea ce se numește „statistică de testare”, care va indica cât de mult se abate rezultatele dvs. De asemenea, vă va spune cât de aproape sunteți ca ipoteza nulă să fie adevărată.

Pentru a vă ajuta să vă înțelegeți, utilizați calculatoare online pentru a calcula semnificația statistică:

Un exemplu de astfel de calculatoare

Litera „p” reprezintă probabilitatea ca ipoteza nulă să fie adevărată. Dacă numărul este mic, va indica o diferență între grupurile de testare, în timp ce ipoteza nulă ar fi că acestea sunt aceleași. Grafic, va părea că statistica dvs. de testare va fi mai aproape de una dintre cozile distribuției dvs. în formă de clopot.

Dr. Fisher a decis să stabilească pragul de semnificație la p ≤ 0,05. Cu toate acestea, această afirmație este controversată, deoarece duce la două dificultăți:

1. În primul rând, faptul că ați dovedit că ipoteza nulă este falsă nu înseamnă că ați dovedit ipoteza alternativă. Toată această semnificație înseamnă doar că nu poți dovedi nici A, nici B.

2. În al doilea rând, dacă scorul p este 0,049, va însemna că probabilitatea ipotezei nule va fi de 4,9%. Acest lucru poate însemna că rezultatele testelor dvs. pot fi atât adevărate, cât și false în același timp.

Puteți utiliza sau nu scorul p, dar atunci va trebui să calculați probabilitatea ipotezei nule de la caz la caz și să decideți dacă este suficient de mare pentru a vă împiedica să faceți modificările planificate și testate. .

Cel mai comun scenariu pentru efectuarea unui test statistic astăzi este stabilirea unui prag de semnificație de p ≤ 0,05 înainte de a rula testul în sine. Asigurați-vă că vă uitați îndeaproape la valoarea p atunci când verificați rezultatele.

Erori 1 și 2

A trecut atât de mult timp încât erorile care pot apărea atunci când se utilizează metrica semnificației statistice au primit chiar propriile nume.

Erori de tip 1

După cum sa menționat mai sus, o valoare p de 0,05 înseamnă că există o șansă de 5% ca ipoteza nulă să fie adevărată. Dacă nu o faceți, veți face greșeala numărul 1. Rezultatele spun că noul dvs. site web v-a crescut ratele de conversie, dar există o șansă de 5% să nu fie așa.

Erori de tip 2

Această eroare este opusul erorii 1: acceptați ipoteza nulă atunci când este falsă. De exemplu, rezultatele testelor vă spun că modificările aduse site-ului nu au adus îmbunătățiri, în timp ce au existat modificări. Ca urmare, pierzi ocazia de a-ți îmbunătăți performanța.

Această eroare este frecventă în testele cu o dimensiune insuficientă a eșantionului, așa că rețineți: cu cât eșantionul este mai mare, cu atât rezultatul este mai fiabil.

Concluzie

Poate că niciun termen nu este la fel de popular printre cercetători ca semnificația statistică. Atunci când rezultatele testelor nu sunt considerate semnificative din punct de vedere statistic, consecințele variază de la o creștere a ratelor de conversie până la prăbușirea unei companii.

Și din moment ce specialiștii în marketing folosesc acest termen atunci când își optimizează resursele, trebuie să știi ce înseamnă cu adevărat. Condițiile de testare pot varia, dar dimensiunea eșantionului și criteriile de succes sunt întotdeauna importante. Amintește-ți asta.

Semnificație statistică

Rezultatele obținute folosind o anumită procedură de cercetare sunt numite semnificativ statistic, dacă probabilitatea apariției lor aleatoare este foarte mică. Acest concept poate fi ilustrat cu exemplul de aruncare a unei monede. Să presupunem că moneda este aruncată de 30 de ori; Capetele au apărut de 17 ori și cozile au apărut de 13 ori. este semnificativ abaterea acestui rezultat de la cel așteptat (15 capete și 15 cozi), sau această abatere este întâmplătoare? Pentru a răspunde la această întrebare, puteți, de exemplu, să aruncați aceeași monedă de mai multe ori, de 30 de ori la rând și, în același timp, să observați de câte ori se repetă raportul dintre „capete” și „cozi” de 17:13. Analiza statistică ne salvează de acest proces obositor. Cu ajutorul acestuia, după primele 30 de aruncări ale unei monede, puteți estima numărul posibil de apariții aleatorii de 17 „capete” și 13 „cozi”. O astfel de evaluare se numește enunț probabilistic.

În literatura științifică de psihologie industrial-organizațională, o afirmație probabilistică în formă matematică este desemnată prin expresia r(probabilitate)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (pag< 0,01). Acest fapt este important pentru înțelegerea literaturii de specialitate, dar nu trebuie interpretat ca însemnând că este inutil să se efectueze observații care nu îndeplinesc aceste standarde. Așa-numitele rezultate ale cercetării nesemnificative (observații care pot fi obținute întâmplător) Mai mult una până la cinci ori din 100) poate fi foarte util în identificarea tendințelor și ca ghid pentru cercetările viitoare.

De asemenea, trebuie remarcat faptul că nu toți psihologii sunt de acord cu standardele și procedurile tradiționale (de exemplu, Cohen, 1994; Sauley & Bedeian, 1989). Problemele de măsurare sunt ele însele tema principală munca multor cercetători care studiază acuratețea metodelor de măsurare și premisele care stau la baza metode existenteși standarde, precum și dezvoltarea de noi medici și instrumente. Poate cândva în viitor, cercetările în această putere vor duce la modificări ale standardelor tradiționale de evaluare a semnificației statistice, iar aceste schimbări vor câștiga o acceptare pe scară largă. (A cincea divizie a Asociației Americane de Psihologie este un grup de psihologi specializați în studiul evaluării, măsurării și statisticilor.)

În rapoartele de cercetare, o afirmație probabilistică precum r< 0,05, din cauza unora statistici, adică un număr care se obține ca urmare a unui anumit set de proceduri matematice de calcul. Confirmarea probabilistică se obține prin compararea acestor statistici cu datele din tabele speciale care sunt publicate în acest scop. În cercetarea psihologică industrial-organizațională, statistici precum r, F, t, r>(a se citi „chi pătrat”) și R(a se citi „plural” R").În fiecare caz, statisticile (un număr) obținute din analiza unei serii de observații pot fi comparate cu numerele dintr-un tabel publicat. După aceasta, puteți formula o declarație probabilistică despre probabilitatea obținerii aleatoare a acestui număr, adică să trageți o concluzie despre semnificația observațiilor.

Pentru a înțelege studiile descrise în această carte, este suficient să aveți o înțelegere clară a conceptului de semnificație statistică și nu neapărat să cunoaștem cum sunt calculate statisticile menționate mai sus. Cu toate acestea, ar fi util să discutăm o ipoteză care stă la baza tuturor acestor proceduri. Aceasta este presupunerea că toate variabilele observate sunt distribuite aproximativ normal. În plus, la citirea rapoartelor privind cercetarea psihologică industrial-organizațională, deseori se întâlnesc alte trei concepte care joacă un rol important - în primul rând, corelația și comunicarea corelațională, în al doilea rând, variabila determinantă/predictivă și „ANOVA” (analiza varianței), în - în al treilea rând, un grup de metode statistice sub denumirea generală „meta-analiza”.

Ipotezele sunt testate folosind analize statistice. Semnificația statistică este găsită folosind valoarea P, care corespunde probabilității unui eveniment dat presupunând că o afirmație (ipoteza nulă) este adevărată. Dacă valoarea P este mai mică decât un nivel specificat de semnificație statistică (de obicei 0,05), experimentatorul poate concluziona în siguranță că ipoteza nulă este falsă și poate continua să ia în considerare ipoteza alternativă. Folosind testul t al lui Student, puteți calcula valoarea P și puteți determina semnificația pentru două seturi de date.

Pași

Partea 1

Configurarea experimentului

    Definiți-vă ipoteza. Primul pas în evaluarea semnificației statistice este să alegeți întrebarea la care doriți să răspundeți și să formulați o ipoteză. O ipoteză este o afirmație despre datele experimentale, distribuția și proprietățile lor. Pentru orice experiment, există atât o ipoteză nulă, cât și una alternativă. În general, va trebui să comparați două seturi de date pentru a determina dacă sunt similare sau diferite.

    • Ipoteza nulă (H 0) afirmă de obicei că nu există nicio diferență între două seturi de date. De exemplu: acei elevi care citesc materialul înainte de curs nu primesc note mai mari.
    • Ipoteza alternativă (H a) este opusul ipotezei nule și este o afirmație care trebuie susținută de date experimentale. De exemplu: acei elevi care citesc materialul înainte de oră obțin note mai mari.
  1. Setați nivelul de semnificație pentru a determina cât de mult trebuie să difere distribuția datelor față de normal înainte de a putea fi considerată un rezultat semnificativ. Nivel de semnificație (numit șiα (\displaystyle \alpha)

    • -level) este pragul pe care îl definiți pentru semnificația statistică. Dacă valoarea P este mai mică sau egală cu nivelul de semnificație, datele sunt considerate semnificative statistic. Nivel de semnificație (numit și De regulă, nivelul de semnificație (valoarea
    • ) este considerată a fi 0,05, caz în care probabilitatea de a detecta o diferență aleatorie între diferite seturi de date este de numai 5%.
    • Cu cât nivelul de semnificație este mai mare (și, în consecință, cu cât valoarea P este mai mică), cu atât rezultatele sunt mai fiabile.
    • Dacă doriți rezultate mai fiabile, reduceți valoarea P la 0,01. De obicei, valorile P mai mici sunt utilizate în producție atunci când este necesar să se identifice defectele produselor. În acest caz, este necesară o fiabilitate ridicată pentru a vă asigura că toate piesele funcționează conform așteptărilor.
  2. Pentru majoritatea experimentelor de ipoteză, un nivel de semnificație de 0,05 este suficient. Decideți ce criteriu veți folosi:

    • Dacă nu sunteți sigur dacă datele sunt deasupra sau sub valorile grupului de control, utilizați un test cu două cozi. Acest lucru vă va permite să determinați semnificația în ambele direcții.
    • Dacă știți în ce direcție datele ar putea cădea în afara distribuției normale, utilizați un test cu o singură coadă. În exemplul de mai sus, ne așteptăm ca notele elevilor să crească, așa că poate fi folosit un test cu o singură coadă.
  3. Determinați dimensiunea eșantionului folosind puterea statistică. Puterea statistică a unui studiu este probabilitatea ca, având în vedere dimensiunea eșantionului, să se obțină rezultatul așteptat. Un prag de putere comun (sau β) este de 80%. Analiza puterii statistice fără date anterioare poate fi o provocare, deoarece necesită unele informații despre mediile așteptate în fiecare grup de date și abaterile standard ale acestora. Utilizați un calculator online de analiză a puterii pentru a determina dimensiunea optimă a eșantionului pentru datele dvs.

    • De obicei, cercetătorii efectuează un mic studiu pilot care furnizează date pentru analiza statistică a puterii și determină dimensiunea eșantionului necesară pentru un studiu mai mare și mai complet.
    • Dacă nu puteți efectua un studiu pilot, încercați să estimați posibile medii pe baza literaturii de specialitate și a rezultatelor altor persoane. Acest lucru vă poate ajuta să determinați dimensiunea optimă a eșantionului.

    Partea 2

    Calculați abaterea standard
    1. Scrieți formula pentru abaterea standard. Abaterea standard arată cât de multă răspândire există în date. Vă permite să concluzionați cât de apropiate sunt datele obținute dintr-un anumit eșantion. La prima vedere, formula pare destul de complicată, dar explicațiile de mai jos vă vor ajuta să o înțelegeți. Formula este următoarea: s = √∑((x i – µ) 2 /(N – 1)).

      • s - abaterea standard;
      • semnul ∑ indică faptul că toate datele obținute din eșantion trebuie adăugate;
      • x i corespunde valorii i-a, adică un rezultat separat obţinut;
      • µ este valoarea medie pentru un grup dat;
      • N este numărul total de date din eșantion.
    2. Găsiți media în fiecare grupă. Pentru a calcula abaterea standard, trebuie mai întâi să găsiți media pentru fiecare grup de studiu. Valoarea medie este indicată cu litera greacă µ (mu). Pentru a găsi media, adunați pur și simplu toate valorile rezultate și împărțiți-le la cantitatea de date (dimensiunea eșantionului).

      • De exemplu, pentru a găsi nota medie pentru un grup de studenți care învață înainte de oră, luați în considerare un mic set de date. Pentru simplitate, folosim un set de cinci puncte: 90, 91, 85, 83 și 94.
      • Să adunăm toate valorile împreună: 90 + 91 + 85 + 83 + 94 = 443.
      • Să împărțim suma la numărul de valori, N = 5: 443/5 = 88,6.
      • Astfel, media pentru acest grup este de 88,6.
    3. Scădeți fiecare valoare obținută din medie. Următorul pas este de a calcula diferența (x i – µ). Pentru a face acest lucru, scădeți fiecare valoare obținută din valoarea medie găsită. În exemplul nostru, trebuie să găsim cinci diferențe:

      • (90 – 88,6), (91 – 88,6), (85 – 88,6), (83 – 88,6) și (94 – 88,6).
      • Ca rezultat, obținem următoarele valori: 1,4, 2,4, -3,6, -5,6 și 5,4.
    4. Patratează fiecare valoare obținută și adună-le. Fiecare dintre cantitățile tocmai găsite ar trebui să fie pătrată. Acest pas va elimina toate valorile negative. Dacă după acest pas mai aveți numere negative, atunci ați uitat să le pătrați.

      • Pentru exemplul nostru, obținem 1,96, 5,76, 12,96, 31,36 și 29,16.
      • Adunăm valorile rezultate: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Împărțiți la dimensiunea eșantionului minus 1.În formulă, suma se împarte la N – 1 datorită faptului că nu ținem cont populatia generala, și luați un eșantion din toți studenții pentru evaluare.

      • Scăderea: N – 1 = 5 – 1 = 4
      • Împărțire: 81,2/4 = 20,3
    6. Elimina rădăcină pătrată. După ce împărțiți suma la dimensiunea eșantionului minus unu, luați rădăcina pătrată a valorii găsite. Acesta este ultimul pas în calcularea abaterii standard. Există programe statistice care, după introducerea datelor inițiale, efectuează toate calculele necesare.

      • În exemplul nostru, abaterea standard a notelor acelor elevi care citesc materialul înainte de oră este s =√20,3 = 4,51.

      Partea 3

      Determinați semnificația
      1. Calculați varianța dintre cele două grupuri de date.Înainte de acest pas, ne-am uitat la un exemplu pentru un singur grup de date. Dacă doriți să comparați două grupuri, ar trebui, evident, să luați date de la ambele grupuri. Calculați abaterea standard pentru al doilea grup de date și apoi găsiți varianța dintre cele două grupuri experimentale. Varianta se calculează folosind următoarea formulă: s d = √((s 1 /N 1) + (s 2 /N 2)).

În orice situație științifică și practică a unui experiment (sondaj), cercetătorii pot studia nu toți oamenii (populația generală, populația), ci doar un anumit eșantion. De exemplu, chiar dacă studiem un grup relativ mic de oameni, cum ar fi cei care suferă de o anumită boală, este încă foarte puțin probabil să avem resursele adecvate sau nevoia de a testa fiecare pacient. În schimb, este obișnuit să testați un eșantion din populație, deoarece este mai convenabil și necesită mai puțin timp. Dacă da, de unde știm că rezultatele obținute din eșantion sunt reprezentative pentru întregul grup? Sau, pentru a folosi terminologia profesională, putem fi siguri că cercetarea noastră descrie corect întregul populatie, eșantionul pe care l-am folosit?

Pentru a răspunde la această întrebare, este necesar să se determine semnificația statistică a rezultatelor testului. Semnificație statistică (Nivel semnificativ, prescurtat Sig.), sau /7-nivel de semnificație (nivelul p) - este probabilitatea ca acest rezultat reprezintă corect populația din care a fost eșantionat studiul. Rețineți că aceasta este numai probabilitate- este imposibil de spus cu o garanție absolută că acest studiu descrie corect întreaga populație. În cel mai bun caz, nivelul de semnificație poate doar concluziona că acest lucru este foarte probabil. Astfel, se pune inevitabil următoarea întrebare: ce nivel de semnificație trebuie să fie înainte ca un rezultat dat să poată fi considerat o caracterizare corectă a populației?

De exemplu, la ce valoare a probabilității ești dispus să spui că astfel de șanse sunt suficiente pentru a-ți asuma un risc? Ce se întâmplă dacă șansele sunt 10 din 100 sau 50 din 100? Ce se întâmplă dacă această probabilitate este mai mare? Dar cote ca 90 din 100, 95 din 100 sau 98 din 100? Pentru o situație care implică risc, această alegere este destul de problematică, deoarece depinde de caracteristicile personale ale persoanei.

În psihologie, se crede în mod tradițional că o șansă de 95 sau mai mult din 100 înseamnă că probabilitatea ca rezultatele să fie corecte este suficient de mare pentru ca acestea să fie generalizabile la întreaga populație. Această cifră a fost stabilită în procesul activității științifice și practice - nu există nicio lege conform căreia ar trebui să fie aleasă ca ghid (și într-adevăr, în alte științe, uneori se aleg și alte valori ale nivelului de semnificație).

În psihologie, ei operează cu această probabilitate de mai multe ori. într-un mod neobişnuit. În loc de probabilitatea ca eșantionul să reprezinte populația, probabilitatea ca eșantionul nu reprezinta populatia. Cu alte cuvinte, este probabilitatea ca relația sau diferențele observate să fie aleatoare și nu o proprietate a populației. Deci, în loc să spună că există o șansă de 95 din 100 ca rezultatele unui studiu să fie corecte, psihologii spun că există o șansă de 5 din 100 ca rezultatele să fie greșite (la fel cum o șansă de 40 din 100 ca rezultatele să fie corecte înseamnă o șansă de 60 din 100 în favoarea incorectitudinii lor). Valoarea probabilității este uneori exprimată ca procent, dar mai des este scrisă ca zecimal. De exemplu, 10 șanse din 100 sunt exprimate ca o fracție zecimală de 0,1; 5 din 100 este scris ca 0,05; 1 din 100 - 0,01. Cu această formă de înregistrare, valoarea limită este 0,05. Pentru ca un rezultat să fie considerat corect, nivelul său de semnificație trebuie să fie de mai jos acest număr (rețineți că aceasta este probabilitatea ca rezultatul greşit descrie populația). Pentru a scoate terminologia din drum, să adăugăm că „probabilitatea ca rezultatul să fie incorect” (care se numește mai corect nivel de semnificație) notată de obicei printr-o literă latină r. Descrierile rezultatelor experimentale includ, de obicei, o declarație rezumată, cum ar fi „rezultatele au fost semnificative la nivelul de încredere (pag(p) mai puțin de 0,05 (adică mai puțin de 5%).

Astfel, nivelul de semnificație ( r) indică probabilitatea ca rezultatele Nu reprezinta populatia. În mod tradițional în psihologie, rezultatele sunt considerate a reflecta în mod fiabil imaginea de ansamblu dacă valoarea r mai puțin de 0,05 (adică 5%). Cu toate acestea, aceasta este doar o afirmație probabilistică și deloc o garanție necondiționată. În unele cazuri, această concluzie poate să nu fie corectă. De fapt, putem calcula cât de des s-ar putea întâmpla acest lucru dacă ne uităm la magnitudinea nivelului de semnificație. La un nivel de semnificație de 0,05, de 5 din 100 de ori rezultatele sunt probabil să fie incorecte. 11a la prima vedere pare că acest lucru nu este foarte obișnuit, dar dacă vă gândiți bine, atunci 5 șanse din 100 sunt la fel cu 1 din 20. Cu alte cuvinte, într-unul din 20 de cazuri rezultatul va fi incorect. Astfel de șanse nu par deosebit de favorabile, iar cercetătorii ar trebui să se ferească de a se comite erori de primul tip. Acesta este numele pentru eroarea care apare atunci când cercetătorii cred că au găsit rezultate reale, dar de fapt nu au găsit. Eroarea opusă, care constă în faptul că cercetătorii cred că nu au găsit un rezultat, dar de fapt există unul, se numește erori de al doilea tip.

Aceste erori apar deoarece nu poate fi exclusă posibilitatea ca analiza statistică efectuată. Probabilitatea de eroare depinde de nivelul de semnificație statistică a rezultatelor. Am observat deja că pentru ca un rezultat să fie considerat corect, nivelul de semnificație trebuie să fie sub 0,05. Desigur, unele rezultate sunt de un nivel mai scăzut și nu este neobișnuit să găsiți rezultate de până la 0,001 (o valoare de 0,001 indică faptul că rezultatele au o șansă de 1 din 1000 de a greși). Cum valoare mai mică p, cu atât este mai puternică încrederea noastră în corectitudinea rezultatelor.

În tabel 7.2 arată interpretarea tradițională a nivelurilor de semnificație cu privire la posibilitatea de inferență statistică și rațiunea deciziei despre prezența unei relații (diferențe).

Tabelul 7.2

Interpretarea tradițională a nivelurilor de semnificație utilizate în psihologie

Pe baza experienței cercetării practice, se recomandă: pentru a evita pe cât posibil erorile de primul și al doilea tip, atunci când se trag concluzii importante, trebuie luate decizii cu privire la prezența diferențelor (legăturilor), concentrându-se pe nivel. r semnul n.

Test statistic(Test statistic - este un instrument de determinare a nivelului de semnificație statistică. Aceasta este o regulă decisivă care asigură că o ipoteză adevărată este acceptată și o ipoteză falsă este respinsă cu mare probabilitate.

Criterii statistice denotă şi metoda de calcul un anumit numărși acel număr în sine. Toate criteriile sunt utilizate cu un singur scop principal: a determina nivelul de semnificație datele pe care le analizează (adică, probabilitatea ca datele să reflecte un efect adevărat care reprezintă corect populația din care este extras eșantionul).

Unele teste pot fi utilizate numai pentru date distribuite normal (și dacă trăsătura este măsurată pe o scară de interval) - aceste teste sunt de obicei numite parametrice. Folosind alte criterii, puteți analiza datele cu aproape orice lege de distribuție - sunt numite neparametric.

Criteriile parametrice sunt criterii care includ parametrii de distribuție în formula de calcul, i.e. medii și varianțe (testul t al lui Student, testul F al lui Fisher etc.).

Criteriile neparametrice sunt criterii care nu includ parametrii de distribuție în formula de calcul a parametrilor de distribuție și se bazează pe operarea cu frecvențe sau ranguri (criteriul Q criteriul Rosenbaum U Mana - Whitney

De exemplu, când spunem că semnificația diferențelor a fost determinată de testul t al lui Student, ne referim că metoda testului t al lui Student a fost folosită pentru a calcula valoarea empirică, care este apoi comparată cu valoarea tabelată (critică).

Prin raportul dintre valorile empirice (calculate de noi) și cele critice ale criteriului (tabelar) putem judeca dacă ipoteza noastră este confirmată sau infirmată. În cele mai multe cazuri, pentru a recunoaște diferențele ca fiind semnificative, este necesar ca valoarea empirică a criteriului să depășească valoarea critică, deși există criterii (de exemplu, testul Mann-Whitney sau testul semnului) în care trebuie să aderăm la regula opusă.

În unele cazuri, formula de calcul pentru criteriu include numărul de observații din eșantionul studiat, notat ca p. Folosind un tabel special, determinăm ce nivel de semnificație statistică a diferențelor îi corespunde o anumită valoare empirică. În majoritatea cazurilor, aceeași valoare empirică a criteriului poate fi semnificativă sau nesemnificativă în funcție de numărul de observații din eșantionul studiat ( n ) sau din așa-numitul numărul de grade de libertate , care este notat ca v (g>) sau cum df (Uneori d).

știind n sau numărul de grade de libertate, folosind tabele speciale (cele principale sunt date în Anexa 5) putem determina valorile critice ale criteriului și putem compara valoarea empirică obținută cu acestea. Aceasta se scrie de obicei astfel: „când n = 22 de valori critice ale criteriului sunt t St = 2.07" sau "la v (d) = 2 valori critice ale testului Student sunt = 4,30”, etc.

De obicei, se acordă în continuare preferință criteriilor parametrice, iar noi aderăm la această poziție. Sunt considerate a fi mai fiabile și pot oferi mai multe informații și analize mai profunde. În ceea ce privește complexitatea calculelor matematice, la utilizarea programelor de calculator această complexitate dispare (dar unele altele par, totuși, destul de depășite).

  • În acest manual nu luăm în considerare în detaliu problema statisticii
  • ipotezele (nule - R0 și alternativă - Hj) și deciziile statistice luate, întrucât studenții la psihologie studiază acest lucru separat la disciplina „Metode matematice în psihologie”. În plus, trebuie remarcat faptul că atunci când se elaborează un raport de cercetare (lucru de curs sau teza, publicații) ipotezele statistice și soluțiile statistice, de regulă, nu sunt date. De obicei, la descrierea rezultatelor, este indicat criteriul, sunt date statisticile descriptive necesare (medii, sigma, coeficienți de corelație etc.), valori empirice ale criteriilor, grade de libertate și, în mod necesar, nivelul p de semnificație. . Apoi se formulează o concluzie semnificativă cu privire la ipoteza testată, indicând (de obicei sub forma unei inegalități) nivelul de semnificație atins sau neatins.