전체 글 (31) 썸네일형 리스트형 머신 러닝 스터디 - Decision tree Data가 주어질 때 어떤 조건을 만족하는지(If … then …)에 따라 데이터를 분류하고, 이를 반복함으로써 데이터에 대한 분류/회귀를 수행하는 방법. 결과적으로 나무를 거꾸로 뒤집어 놓은 모양의 그래프가 나오기 때문에 Decision tree라는 이름을 갖게 되었다. 핵심 개념 불순도: 해당 범주안에 서로 다른 데이터가 얼마나 섞여 있는지를 의미함. 분기가 잘 되었다면 같은 속성의 데이터들이 같은 범주안에 포함될 것이므로 불순도가 낮아진다. 엔트로피(Entropy): 불순도를 수치화하는 개념. 아래와 같은 수식으로 표현 가능 $$ E = - \sum_{i=1}^{k} p_i \log p_i$$ 지니 계수(Gini index): 엔트로피와 유사하게 불순도를 수치화하는 개념. K개 클래스에 걸친 총 분.. 이전 1 ··· 8 9 10 11 다음