[인공지능 및 기계학습 개론] 3.1 Optimal Classification

AI/인공지능 및 기계학습 개론

[인공지능 및 기계학습 개론] 3.1 Optimal Classification

신라면순한맛 2022. 8. 20. 23:36

이번 포스팅에서는 Optimal Classification에 대해서 알아보도록 하겠습니다.

http://www.edwith.org/machinelearning1_17/lecture/10585

[LECTURE] 3.1. Optimal Classification : edwith

- 신승재

www.edwith.org

기본적으로 Classifier는 측정값과 실제값의 차이를 최소화하여 misclassification 확률을 최소화 하려고 하죠. 즉, 아래의 식을 만족하는 $f^*$를 optimal classifier라고 합니다. $$ f^*\coloneqq\argmin_f P(f(X)\neq Y) $$ 이렇게 하게끔 하는 classifier는 여러 종류가 있을텐데, 그 중에서 Bayes Classifier란 input features $X\in\mathbb{R}^n$과 class label $Y\in\{1,\ldots,K\}$에 대해, 주어진 input $X=x$가 어느 class에 속할 때 가장 큰 확률을 갖는지를 알려주는 classifier입니다. $$ f^{\text{Bayes}}(x)\coloneqq\argmax_{y=1,\ldots,K} P(Y=y | X=x) $$ 이 때 Bayes theorem에 의하면 Bayes classifier가 maximize하려는 대상을 다음과 같이 써낼 수 있습니다.: $$ P(Y=y|X=x)=\frac{P(X=x|Y=y)P(Y=y)}{P(X=x)} $$ 따라서 이를 기준으로 Bayes Classifier를 다시 써보면 다음과 같습니다. 이 때 분모의 $P(X=x)$ term은 $y$에 대한 의존성이 없기 때문에 최대화 시키는 데 있어서는 무관한 값이라 없앤 것을 볼 수 있습니다.: $$ f^{\text{Bayes}}(x)=\argmax_{y=1,\ldots,K} P(Y=y | X=x)=\argmax_{y=1,\ldots,K} P(X=x | Y=y)P(Y=y) $$ 이렇게 분해 했을 때 강의에서는 $P(X=x|Y=y)$를 class conditional density라고 하고, $P(Y=y)$를 class prior라고 부르고 있습니다.

끝으로 risk에 대한 얘기를 하며 아래 그림을 설명하시는데요.

Classification을 한다고 했을 때 nice하게 하는 방법이라면, 주어진 input에 대해 애매하게 구분하는게 아니라 확실하게 구분하는 것일 것입니다. 그런 의미에서 그림에서의 점선으로 분류를 하는 것보다는 실선으로 분류하는 것이 더 낫다고 할 수 있겠습니다. (하지만 이 말이 logistic regression이 항상 절대적으로 linear regression보다 좋다는 뜻은 아닙니다.)

그리고 위 그림에서 중간쯤에 한 점으로 모이는 부분이 있는데, 저 부분을 decision boundary라고 합니다. Decision boundary를 기준으로 왼쪽에서는 초록색을 따라 판별하는 것이 유리할 것이고, 오른쪽에서는 빨간색을 따라 판별하는 것이 유리할 것입니다.

더 나아가서 점선과 실선을 비교해보면, 왼쪽에서 초록색을 택한다고 했을 때 빨간색 점선과 실선 아래의 영역은 각각 error로써 작용하게 될텐데, 이 때 점선이 만들어내는 error 영역이 실선이 만들어내는 영역보다 더 큰 것을 알 수가 있습니다. 즉, 파란색 반달모양의 영역이 바로 두 classifier의 성능차이가 되는 것입니다. Optimal classifier라면 이러한 error를 최소화 하는 방향으로 설계가 될 것입니다.

이번 포스팅은 여기서 마치고, 다음 포스팅에서 뵙겠습니다.

'AI > 인공지능 및 기계학습 개론' 카테고리의 다른 글

[인공지능 및 기계학습 개론] 3.3 Naive Bayes Classifier (0)	2022.08.22
[인공지능 및 기계학습 개론] 3.2 Conditional Independence (0)	2022.08.21
[인공지능 및 기계학습 개론] 2.5 Linear Regression (0)	2022.08.19
[인공지능 및 기계학습 개론] 2.4 Entropy and Information Gain (0)	2022.08.18
[인공지능 및 기계학습 개론] 2.3. Introduction to Decision Tree (0)	2022.08.16

현재글[인공지능 및 기계학습 개론] 3.1 Optimal Classification

수학공부를 비롯한 여러 공부를 하며 알게 된 내용을 기록하고 공유합니다. Latex이 섞여있는 글은 PC환경에서 봐주세요. 구독하시면 업데이트 내용을 빠르게 확인하실 수 있습니다. (블로그 주소 .com 뒤에 /m이 있으면 모바일 주소여서 latex이 rendering되지 않습니다.)

Numpy, Finance, 일상, Python, 대수기하, algebraic geometry, 일기, 경제용어700선, Machine_Learning, linear_algebra, category, 학부수학, 수학의즐거움, 돌비시네마, cnn, deep_learning, mathematics, 문일철, set_theory, abelian group,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

수학 기록지