Koepisyenteng korelasyon ni Pearson

Mula sa Wikipedia, ang malayang ensiklopedya

Sa estadistika, ang Koepisyenteng Korelasyon ni Pearson (KKP), Koepisyenteng Pearson produkto-sandaling korelasyon (KPPSK),[1] o Pearson's r at karaniwang tinutukoy na r) ay isang sukat ng korelasyon (dependiyensiyang linyar) sa pagitan ng dalawang mga bariabulong X at Y na nagbibigay ng halaga sa pagitan ng +1 at -1 ng inklusibo. Ito ay malawak na ginagamit sa mga agham bilang isang sukat ng lakas ng dependiyensiyang linyar(pagsalalay) sa pagitan ng dalawang mga bariabulo. Ito ay binuo ni Karl Pearson mula sa katulad ngunit kaunting ibang ideya na ipinakilala ni Francis Galton noong mga 1880.[2][3]

Ilang mga hanay ng mga puntong(xy) na may koepisyenteng korelasyong Pearson ng x at y para sa bawat hanay. Pansinin na ang korelasyon ay nagpapakita ng pagiging maingay at direksiyon ng relasyong linyar(itaas na row) ngunit hindi ang lihis ng relasyon(gitna) o hindi ang maraming mga aspeto ng mga relasyong hindi linyar(ilalaim). N.B: ang pigura sa gitna ay may isang lihis na o ngunit sa kasong ito, ang koepisyenteng korelasyon ay hidni matukoy dahil ang bariansa ng Y ay sero.

Depinisyon[baguhin | baguhin ang wikitext]

Ang koepisyenteng korelasyon ni Pearson sa pagitan ng dalawang bariabulo ay inilalarawan bilang ang kobariansa ng dalawang mga baribulong hinati ng produkto ng mga pamantayang paglihis ng mga ito. Ang anyo ng depinisyon ay kinasasangkutan ng sandaling produkto na ang mean(unang sandali sa orihin) ng produkto ng isinaayos na mean na mga randomang bariabulo.

Para sa isang populasyon[baguhin | baguhin ang wikitext]

Ang koepisyenteng korelasyon ni Pearson kapag nilalapat sa isang populasyon ay karaniwang kinakatawan ng letrang Griyengong ρ (rho) at maaaring tukuyin bilang koepisyenteng korelasyon ng populasyon o koepisyenteng populasyong korelasyong Pearson. Ang pormula para sa ρ ay:

Para sa isang sampol[baguhin | baguhin ang wikitext]

Ang koepisyenteng korelasyon ni Pearson kapag nilalapat sa isang sampol ay karaniwang kinakatawan ng letrang r at maaaring tukuyin bilang koepisyenteng korelasyon ng sampol o ang koepisyenteng sampol na korelasyong Pearson. Maaaring makamit ang isang pormula para sa r sa pamamagitan ng paghahali ng mga pagtatantiya ng mga kobariansa at bariansa batay sa sampol na estadistikal sa pormula sa itaas. Ang pormula para sa r ay:

Ang isang katumbas na ekspresyon ay nagbibigay ng koepisyenteng korelasyon bilang mean ng mga produkto ng mga pamantayang iskor. Batay sa sampol na estadistikal ng pinares na datos (XiYi), ang koepisyenteng korelasyon ng sampol ay

kung saan ang

ang respektibong pamantayang iskor, mean ng sampol at pamantayang paglihis ng sampol.

Mga sanggunian[baguhin | baguhin ang wikitext]

  1. "The human disease network", Albert Barabasi et al., Plos.org
  2. J. L. Rodgers and W. A. Nicewander. Thirteen ways to look at the correlation coefficient. The American Statistician, 42(1):59–66, February 1988.
  3. Stigler, Stephen M. (1989). "Francis Galton's Account of the Invention of Correlation". Statistical Science. 4 (2): 73–79. doi:10.1214/ss/1177012580. JSTOR 2245329.