All thing of the world!

Oracle CORR_* 설명 : 오라클 함수 본문

IT/Oracle DBMS

Oracle CORR_* 설명 : 오라클 함수

WorldSeeker 2021. 4. 3. 14:24

1. 함수의 목적 

    Oracle CORR_*란 CORR_S와 CORR_K함수를 동시에 설명하기 위해 *로 표현한 것이다. 
    CORR함수와 동일하게 상관계수를 반환하며,
    - CORR_K 함수는 Kendall's tau-b 상관관계를 지원하며
    - CORR_S 함수는 
Spearman's rho 상관관계를 지원한다.


   리턴값은 -1~1까지 올수 있다. 결국 상관계수는 -1~1까지의 값을 가질 수 있다는 말과 동일한다.
   1이라면 완전한 상관관계를 가지고 있다고 보는 것이다.

* 상관계수란? 
      데이터 분석에 많이 사용하는 개념으로 두 변수 사이의 상관도를 숫자로 표현한 것이다. 두 변수 X가 변량에 따라 Y도 같이 변한다면 상관도가 있는 것이며, 상관계수가 +이면 양의상관, -이면 음의상관이다.   (자세한 것은 구글링이나 네이버링을 참고)


2. 샘플을 통한 개념 퀵뷰
   

 
1)  CORR_S 샘플 :  salary와 commission_pct/employee_id간의  Spearman's rho 상관계수를 구한다

SELECT COUNT(*) count,
CORR_S(salary, commission_pct) commission,
CORR_S(salary, employee_id) empid
FROM employees;


COUNT COMMISSION EMPID
---------- ---------- ----------
107      .735837022    -.04473016


2) CORR_K 샘플 :  salary와 commission_pct/employee_id간의  Kendall's tau-b 상관계수를 구한다

SELECT CORR_K(salary, commission_pct, 'COEFFICIENT') coefficient,
CORR_K(salary, commission_pct, 'TWO_SIDED_SIG') two_sided_p_value
FROM employees;

COEFFICIENT  TWO_SIDED_P_VALUE
----------- -----------------
.603079768   3.4702E-07


3. 사용방법  


4. 함수 PARAMETER 설명
 
[expr1][expr2]
상관분석 대상이 되는 두 변수를 입력하는 곳으로 숫자형 데이터를 입력값을 가지며, 문자라도 숫자로 변경이 가능한 문자는 내부적으로 변환하여 입력된다.
첫번째의 데이터타입이 다르다면 가장 높은 우선 순위의 데이터타입으로 내부적으로 변환하고, 리턴 데이터 타입도 역시 내부적으로 변환한 데이터 타입에 맞게 반환한다
.

[세번째 인수]
세번째 인수는 varchar2형식의 리턴 밸류타입을 정의하는 인수이며, 생략가능하며 디폴트값은 COEFFICIENT다. 5가지의 형식은 아래와 같다.

1) COEFFICIENT : 상관계수(Coefficient of correlation)
2) ONE_SIDED_SIG : Positive one-tailed significance of the correlation
3) ONE_SIDED_SIG_POS : ONE_SIDED_SIG와 동일
4) ONE_SIDED_SIG_NEG : Negative one-tailed significance of the correlation
5) TWO_SIDED_SIG : Two-tailed significance of the correlation

 

Comments