All thing of the world!

concat 설명 : python pandas 함수 본문

IT/python

concat 설명 : python pandas 함수

WorldSeeker 2022. 3. 27. 10:40

1. 함수의 목적

    pandas 함수로, 둘 이상의 데이터프레임(dataframe)을 이어 붙이는데 사용하는 함수.

   

2. 샘플을 통한 개념 퀵뷰

3. 사용방법 

        pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)

 

 

4. 함수 PARAMETER 설명
 
[objs] : a sequence or mapping of Series or DataFrame objects

이어 붙일 데이터 프레임을 [df1, df2]의 형태로 입력한다.

 

[axis] : {0/’index’, 1/’columns’}, default 0

연결할 축의 기준. 0이면 행을, 1이면 열을 기준.

 

[join] : {‘inner’, ‘outer’}, default ‘outer’

연결할 다른 축의 인덱스를 처리하는 방법.

 

[ignore_index] : bool, default False

연결시 index(0 , 1, 2 등의 행 인덱스) 사용여부.

 

[keys] : sequence, default None

다층 인덱스가 전달된 경우 전달된 키의 index를 보존하여 계층 인덱스를 구성한다.

샘플표현 참고

 

[names] : list, default None

keys인수로 생성된 다층 인덱스 레벨의 명칭을 지정

 

[verify_integrity] : bool, default False

연결된 새로운 축에 중복 항목이 포함되어 있는지 확인한다. 이 동작은 매우 느릴 수 있다.

 

[sort] : bool, default False

join이 'outer'일 때 바깥쪽 축이 정렬되지 않았을 경우 정렬을 수행한다. 

1.0.0버전부터는 default값이 false로 변경됨.

 

[copy] : bool, default True

false 설정하면 copy하지 않음

 

 

5. 다양한 샘플표현

 

1) ignore_index 옵션을 True로 설정하여 기존 인덱스를 지우고 인덱스를 새로 생성

2) keys 옵션을 사용하여 계층적 인덱스를 추가

3) name 옵션을 사용하여 인덱스 라벨에 이름 추가


1) DataFrame 객체를 겹치는 열을 유추하여 결합, 유추가 불가능한 것은 NaN 값으로 채워짐.

2) join 옵션을 inner를 전달하여 동일한 컬럼명만 존재하는 것을  반환

3) axis=1 설정하여, x축을 따라 DataFrame 개체를 수평으로 결합

4) verify_integrity 옵션을 사용하여 결과에 중복 인덱스 값이 포함되지 않도록 함

 

끝.

Comments