Regresyong analisis

Mula sa Wikipedia, ang malayang ensiklopedya

Sa estadistika, ang regresyong analisis ay kinabibilangan ng maraming mga pamamaraan para sa pagmomodelo at pagsisiyasat ng ilang mga bariabulo kapag ang pokus ay nasa relasyon sa pagitan ng dependiyenteng bariabulo at isa o higit pang mga independiyenteng bariabulo. Sa mas spesipiko, ang regresyong analisis ay nakakatulong sa isa na maunawaan kung paanong ang tipikal na halaga ng dependiyenteng bariabulo ay nagbabago samantalang ang ibang mga independiyenteng bariabulo ay ginawang hindi nagbabago. Sa mas karaniwan, ang regresyong analisis ay nagtatantiya ng ekspektasyong kondisyonal ng dependiyenteng bariabulo sa ibinigay na mga independiyenteng bariabulo — na ang aberaheng halaga ng dependiyenteng bariabulo kapag ang mga independiyenteng bariabulo ay hindi nagbabago. Sa mas hindi karaniwang, ang pokus ay nasa kwantile o ibang pang parametrong lokasyon ng distribusyong kondisyonal ng dependiyenteng bariabulo sa ibinigay na mga independiyenteng bariabulo. Sa lahat ng mga kaso, ang pinupuntiryang pagtatantiya ay ang punsiyon ng mga independiyenteng bariabulo na tinatawag na punsiyong regresyon. Sa regresyong analisis, interesante rin na ilarawan ang bariasyon ng dependiyenteng bariabulo sa palibot ng punsiyong regresyon na maaaring ilarawan ng distribusyong probabilidad. Ang regresyong analisis ay malawak na ginagamit sa paghuhula at pagfo-forecast kung saan ang paggamit nito ay may mahalagang pagsanib sa pagkatuto ng makina. Ang regresyong analisis ay ginagamit rin upang maunawaan kung alin sa mga independiyenteng bariabulo ay nauugnay sa dependiyenteng bariabulo at upang galugarin ang mga anyo ng mga relasyong ito. Sa mga restriktadong sirkunstansiya, ang regresyong analisis ay maaaring gamitin upang ihinuha ang relasyong nagsasanhi sa pagitan ng mga bariabulong dependiyente at independiyente. Gayunpaman, ito ay maaaring tumungo sa mga ilusyon o mga maling relasyon kaya ang pag-iingat ay pinapayo.[1] Ang isang malaking katawan ng mga pamamaraan sa pagsasagawa ng regresyong analisis ay pinaunlad. Ang mga pamilyar na pamamaraan gaya ng regresyong linyar at ordinaryong maliit na mga kwadrado ay parametriko dahil ang punsiyong regresyon ay inilalarawan sa mga termino ng isang may hangganang bilang ng mga hindi alam na paremetro na tinatantiya mula sa datos. Ang regresyong hindi parametriko ay tumutukoy sa mga pamamaraan na pumapayag sa punsiyong regresyon na lumagay sa isang tinukoy na hanay ng mga punsiyon na maaaring walang hangganang dimensiyonal. Ang pagganap ng mga pamamaraang regresyong analisis sa pagsasanay ay nakasalalay sa anyo ng prosesong paglikha ng datos at kung paano ito umuugnay sa pakikitungong regresyong ginagamit. Dahil sa ang tunay na anyo ng prosesong lumilikha ng datos ay hindi alam, ang regresyong analisis ay kadalasang nakasalalay sa isang bahagi sa paggawa ng mga pagpapalagay tungkol sa proseso. Ang mga pagpapalagay na ito ay minsang masusubok kung ang isang malaking halaga ng datos ay makukuha. Ang mga modelong regresyon para sa paghula ay kadalasang magagamit kahit ang mga pagpapalagay ay katamtamang nalabag bagaman ang mga ito ay maaaring hindi gumanap ng optimal. Gayunpaman, sa maraming mga aplikasyon lalo na sa maliit na mga epekto o mga tanong ng pagsasanhi batay sa datos na pang-obserbasyon, ang mga pamamaraang regresyon ay nagbibigay ng mga nakaliligaw na resulta.[2][3]

Mga sanggunian[baguhin | baguhin ang wikitext]

  1. Armstrong, J. Scott (2012). "Illusions in Regression Analysis". International Journal of Forecasting (forthcoming).
  2. David A. Freedman, Statistical Models: Theory and Practice, Cambridge University Press (2005)
  3. R. Dennis Cook; Sanford Weisberg Criticism and Influence Analysis in Regression, Sociological Methodology, Vol. 13. (1982), pp. 313-361