Metoda korelační analýzy: příklad. Korelační analýza je ...
Ve vědeckém výzkumu,potřebu nalézt vazbu mezi výrobními a faktorovými proměnnými (výtěžnost kultury a množství srážek, výška a hmotnost osoby v homogenních skupinách podle pohlaví a věku, tepová frekvence a tělesná teplota atd.).
Druhým jsou znaky, které přispívají ke změně těch, které jsou s nimi spojeny (první).
Koncept korelační analýzy
Existuje mnoho definic pojmu. Na základě výše uvedeného lze konstatovat, že korelační analýza - metoda používaná k testování hypotéz o statistické významnosti dvou nebo více veličin, v případě, že výzkumný pracovník je schopen je změřit, ale nemění.
Existují další definicekoncepty. Korelační analýza - statistickou metodou zpracování dat obsahuje: učení korelační koeficienty mezi proměnnými. V tomto případě jsou porovnány korelační koeficienty mezi jediným párem nebo množinou dvojic prvků, ke stanovení statistické vztahy mezi nimi. Korelační analýza - metoda pro studium statistické závislosti mezi náhodné proměnné s případnou přítomností přísné funkčního charakteru, kde dynamika náhodné proměnné vede k očekávání dalších dynamiky.
Koncept falešnosti korelace
Při provádění korelační analýzy,že může být provedeno ve vztahu k jakémukoli souboru charakteristik, které jsou často vzájemně absurdní. Někdy nemají mezi sebou žádný kauzální vztah.
V tomto případě mluví o falešné korelaci.
Problémy korelační analýzy
Na základě výše uvedených definic můžeteformulovat následující úkoly popsané metody: získat informace o jedné z neznámých proměnných pomocí jiného; určuje těsnost vztahu mezi sledovanými proměnnými.
Korelační analýza zahrnuje určení vztahu mezi studovanými rysy a proto úkoly korelační analýzy mohou být doplněny o následující:
- identifikace faktorů, které mají největší dopad na výsledek;
- identifikace dříve nevysvětlených příčin vazeb;
- konstrukce korelačního modelu s jeho parametrickou analýzou;
- studium významnosti komunikačních parametrů a odhad jejich intervalu.
Korelace mezi korelační analýzou a regresí
Podmínky použití
Efektivní faktory závisí na jednomněkolik faktorů. korelační metoda analýzy může být použita v případě, že existuje velký počet pozorování na hodnoty efektivních a faktorových ukazatelů (faktory), by měly být kvantifikovány a odráží ve zvláštních zdrojích studované faktory. První se může stanovit běžnou zákonem - v tomto případě výsledek korelační analýzy jsou korelační koeficient v Pearsonova, nebo pokud se symptomy neposlouchají tohoto zákona, za použití Spearmanův koeficient pořadové korelace.
Pravidla pro výběr koeficientů analýzy korelace
Při použití této metody je to nutnéurčit faktory, které mají vliv na výkonnostní ukazatele. Jsou vybrány s ohledem na skutečnost, že mezi ukazateli musí předložit příčinné vztahy. V případě, že korelační modelu vícefaktorové vybrány ty, které mají významný vliv na výslednou indikátoru, nezahrnuje výhodné, jakož i vzájemně závislé faktory spárované s korelačním koeficientem větší než 0,85, v korelační modelu, v nichž komunikace s účinným parametrem je non-přímý nebo funkční v přírodě.
Zobrazit výsledky
Výsledky korelační analýzy mohou být prezentovány v textových a grafických formách. V prvním případě jsou reprezentovány jako korelační koeficient, ve druhém - ve formě rozptylu.
Pokud mezi parametry bodu neexistuje žádná korelacena schématu jsou umístěny chaoticky, průměrný stupeň komunikace je charakterizován větším stupněm uspořádání a je charakterizován více či méně jednotnou vzdáleností značených značek od mediánu. Silná vazba má tendenci k přímce a pro r = 1 bodový graf je sudý. Inverzní korelace se liší od směru grafu vlevo nahoře vpravo dole, přímka od levého dolního do pravého horního rohu.
Trojrozměrná reprezentace diagramu rozptylu (rozptylu)
Kromě tradičních 2D-reprezentace diagramů rozptylu v současné době používají 3D zobrazení grafické znázornění korelační analýzy.
Rovněž se používá matice diagramu rozptylu,který zobrazuje všechny spárované grafy na jednom obrázku ve formátu matice. Proměnné n obsahují matici n řádků a n sloupců. Diagram umístěný na průsečíku i-té řady a j-té sloupce je grafem proměnných Xi ve srovnání s Xj. Takže každý řádek a sloupec je jeden rozměr, jedna buňka zobrazuje rozptylový diagram dvou rozměrů.
Odhad těsnosti komunikace
Těsnost korelačního vztahu je určena zkorelační koeficient (r): silný - r = ± 0,7 až ± 1, střední - r = ± 0,3 až ± 0,699, slabý - r = 0 až ± 0,299. Tato klasifikace není přísná. Obrázek ukazuje trochu odlišný schéma.
Příklad použití metody korelační analýzy
Ve Velké Británii byla provedena zajímavá studie. Je věnována vztahu kouření s rakovinou plic a byla provedena korelační analýzou. Toto pozorování je uvedeno níže.
Profesní skupina | kouření | úmrtnost |
Zemědělci, lesníci a rybáři | 77 | 84 |
Horníci a lomy | 137 | 116 |
Výrobci plynu, koksu a chemikálií | 117 | 123 |
Výrobci skla a keramiky | 94 | 128 |
Pracovníci pecí, kovárenských, odlévacích a válcovacích strojů | 116 | 155 |
Pracovníci elektrotechniky a elektroniky | 102 | 101 |
Strojírenství a příbuzné profese | 111 | 118 |
Dřevozpracující výroba | 93 | 113 |
Kožené zboží | 88 | 104 |
Textilní pracovníci | 102 | 88 |
Výrobci pracovního oděvu | 91 | 104 |
Pracovníci v oblasti potravin, nápojů a tabáku | 104 | 129 |
Výrobci papíru a tisku | 107 | 86 |
Výrobci jiných výrobků | 112 | 96 |
Stavitelé | 113 | 144 |
Umělci a dekoratéři | 110 | 139 |
Ovladače stacionárních motorů, jeřábů apod. | 125 | 113 |
Pracovníci jinde neuvedení | 133 | 146 |
Dopravní a komunikační pracovníci | 115 | 128 |
Pracovníci skladu, skladovatelé, balírny a pracovníci plnicích strojů | 105 | 115 |
Pracovníci úřadu | 87 | 79 |
Prodejci | 91 | 85 |
Zaměstnanci sportovních a rekreačních služeb | 100 | 120 |
Administrátoři a manažeři | 76 | 60 |
Profesionálové, technici a umělci | 66 | 51 |
Začínáme korelační analýzu. Řešení je lepší začít s jasností grafickou metodou, pro kterou budeme vytvářet rozptylový diagram (rozptyl).
Prokazuje přímé spojení. Na základě pouze grafické metody je však obtížné učinit jednoznačný závěr. Proto provádíme korelační analýzu. Příklad výpočtu korelačního koeficientu je uveden níže.
Použití softwaru (například MSExcel bude popsáno níže), určujeme korelační koeficient, který je 0,716, což znamená silný vztah mezi sledovanými parametry. Definovat statistické platnost získaných hodnot odpovídající tabulky, pak musíme odečíst 25 ze dvou dvojic hodnot, a tak se získá 23 a tento řádek v tabulce jsou kritické Rp = 0,01 (v této lékařské údaje se používají přísnější ve zbývajících případech p = 0,05), což je 0,51 pro danou korelační analýzu. Příklad ukázal, že r je větší než r kritické, hodnota korelačního koeficientu je považována za statisticky spolehlivou.
Použití softwaru při provádění korelační analýzy
Popsaný typ zpracování statistických datlze implementovat pomocí softwaru, zejména MS Excel. Analýza korelace v aplikaci Excel zahrnuje výpočet následujících parametrů pomocí funkcí:
1. Korelační koeficient se určuje pomocí funkce CORREL (pole 1, pole 2). Array1,2 je buňka rozsahu hodnot produkčních a faktorových proměnných.
Lineární koeficient korelace je také nazýván korelačním koeficientem Pearson, a proto od aplikace Excel 2007 můžete použít funkci PEARSON se stejnými poli.
Grafické znázornění korelační analýzy v aplikaci Excel se provádí pomocí panelu "Diagramy" s výběrem "Bodové schéma".
Po uvedení počátečních dat získáme graf.
2. Vyhodnocení významu párového korelačního koeficientu pomocí Studentova t-testu. Vypočtená hodnota t-testu je porovnáván s tabulkovou (kritickou) hodnotoutohoto ukazatele z odpovídající tabulky hodnot uvažovaného parametru, přičemž se zohlední daná úroveň významnosti a počet stupňů volnosti. Toto hodnocení se provádí pomocí funkce TIRE (pravděpodobnost, stupeň_spravedlnosti).
3. Matrice koeficientů korelace párů. Analýza se provádí pomocí „Analýza dat“ znamená, ve kterém je zvolen „korelace.“ Statistické vyhodnocení koeficientů korelace párů se provádí při porovnání jeho absolutní hodnoty s tabulkovou (kritickou) hodnotou. Při překročení vypočtený koeficient korelace nad těmito páry může být rozhodující říci, s ohledem na předem stanovený stupeň pravděpodobnosti, že nulová hypotéza lineárního spojovacího významu není odmítnut.
Na závěr
Použití v metodě vědeckého výzkumukorelační analýza umožňuje určit vztah mezi různými faktory a ukazateli výkonnosti. V tomto případě je třeba vzít v úvahu, že vysoký korelační koeficient může být získán z absurdního páru nebo souboru dat a tento druh analýzy musí být proveden na dostatečně velkém souboru dat.
Po získání vypočtené hodnoty r, itje žádoucí porovnat ji s kritickým kritériem, aby se potvrdila statistická jistota určité hodnoty. Korelační analýza může být provedena ručně pomocí vzorců nebo pomocí softwarových nástrojů, zejména MS Excel. Zde je také možné vytvořit diagram rozptylu (rozptylu) za účelem vizualizace vztahu mezi studovanými korelačními faktory a výsledným znakem.