앞으로 시간이 될 때마다 edwith에 공개되어 있는 문일철 교수님의 인공지능 및 기계학습 개론 수업을 듣고 리뷰 할 생각입니다. 이미 많은 분들이 리뷰를 하셨지만, 저는 저만의 스타일로 정리를 해두고자 합니다.
http://www.edwith.org/machinelearning1_17/lecture/10574
첫 시간은 motivation 및 가장 기초가 되는 개념들을 다루는 시간이었습니다. Machine learning하면 항상 같이 나오는 단어들이 있죠.:
- Machine Learning
- Deep Learning
- Data Mining
- Knowledge Discovery
- Artificial Intelligence
- ...
물론 다 비슷하면서도 다른 단어들이지만 항상 같이 등장하는 것 같습니다. 이런 용어들은 이미 아는 사람들에게는 너무나 익숙하지만, 처음 볼 때는 하나하나가 너무나 어렵게 느껴지기 마련입니다. 처음부터 다 완벽히 알려고 노력할 필요는 없을 것 같습니다. 일단 machine learning과 직접적으로 많이 나오는 용어에 대해서만 간략히 설명하자면,
- Artificial Intelligence (AI, 인공지능)
- 인공지능 분야를 모두 아울러 이르는 말. AI 기술을 이루는 주요 테크닉으로 Machine Learning이 있음.
- 인공지능 분야를 모두 아울러 이르는 말. AI 기술을 이루는 주요 테크닉으로 Machine Learning이 있음.
- Machine Learining (기계학습)
- 굉장히 거칠게 얘기하자면, 주어진 input과 기대되는 output이 있을 때, 보통은 이 관계(함수)를 사람이 직접 찾았었음.
- 그런데 이 관계를 직접 찾지 않고, 적당한 알고리즘을 거쳐, 수많은 input과 output 사이의 관계를 찾아내는 것을 Machine Learning 이라고 함.
- 보통 여기서 말하는 적당한 알고리즘은 통계적인 관점이 많음.
- 당연히 양질의 data가 많으면 많을수록 좋기에, 이쪽 얘기를 할 때 Big Data (빅데이터) 얘기가 같이 안 나올 수가 없는 것!
- Deep Learning (딥러닝)
- Machine Learning의 한 분야로 주어진 input과 기대되는 output 사이의 관계를 신경망 학습을 통해서 찾아내는 것을 Deep Learning이라고 부름.
- 거칠게 표현하면 보통 우리가 생각하는 것을 모방했다고 함. 예를 들어 사과라는 이미지를 상상해보면, 우리는 사과를 각자의 방식대로 떠올리는데, 이 때 사과의 색은 빨간 색이지 검은 색은 아니기에 아마도 둘 중 하나라면 빨간색 쪽으로 더 weight를 줄 것이고, 사과의 크기를 생각해보면 주먹만한지 농구공만한지 결정하라 했을 때 주먹만한 쪽으로 더 weight를 줄 것임. 이처럼 weight의 개념이 들어가는 것이 deep learning이라 생각하면 됨.
정도로 얘기할 수 있겠습니다. 거칠게라는 말을 강조한 이유는 위에 설명한 말만으로 저 단어들이 완벽히 묘사가 되지는 않기 때문입니다. 이정도의 감을 잡고 접근하시면 좋겠다는 생각이 들어 위와 같이 소개해보았습니다. 그리고 위와 같은 포함관계 때문에 보통 deep learning을 얘기할 때에는 machine learning이라고 하지는 않으며, machine learning이라고 하면 deep learning이 아닌 다른 methodology를 가리키는 경우가 많습니다. 이 강의에서는 별다른 언급 없으면 machine learning으로 통틀어 얘기하겠다고 하시네요.
Machine Learning에는 너무나 많은 application이 있으며 이미 우리의 생활에 다양하게 응용이 되고 있습니다. 예를 들어 스팸메일을 구분하는 알고리즘이나, 시계열 분석, 이미지 데이터 분석, 자연어 처리 등이 그 예입니다. 단어만 들어보면 완전 미래 기술이라 안쓰일 것 같은데, 사실 우리는 이미 알게 모르게 쓰고 있는 것입니다.
Machine Learning에는 크게
- Supervised Learning (지도학습)
- Unsupervised Learning (비지도학습)
- Reinforcement Learning (강화학습)
- ...
으로 구분됩니다. 위의 세 가지에 대해서만 소개하자면,
- Supervised Learning
- 정답(Label)이 있는 data에 적용하는 방법론임.
- 예를 들어 사진을 주고 이것이 강아지냐 아니냐를 구분하는 분류기라고 한다면, 이 분류기를 학습 시킬 때 강아지 사진을 보여주고는 이건 강아지야, 다른 것을 보여주고는 이건 강아지가 아니야, 라고 학습을 시킬 것. 이렇게 학습 시키고 난 후 훈련할 때 썼던 이미지 중 하나가 아닌 새로운 이미지를 넣었을 때, 그 이미지가 강아지인지 아닌지를 판별해낼 것.
- Unsupervised Learning
- 따로 정답이 있지 않은 data에 대해 Clustering(군집화)등을 하는 방법론임.
- 적당한 알고리즘을 통해 주어진 data를 적당한 덩어리 단위로 구분해내는 것. 이 중에서 필요한 덩어리에 대해서만 다루면 되기에 유용함.
- Reinforcement Learning
- 굉장히 거칠게 얘기하자면 보상체계가 있는 방법론이라 생각하면 편함.
- 예를 들어, 플레이어가 가운데 서 있는데, 왼쪽에는 불이 나고 있고 오른쪽에는 불을 끌 수 있는 물이 있다면, 우리는 당연히 물로 가려고 할 것임. 이 과정을 잘 생각해보면, 우리는 불로 가는 것이 마이너스고, 물로 가까이 가는 것이 플러스여서, 물을 받아서 불이 있는 곳으로 가야 불을 온전히 끌 수 있다는 사실을 아는 것. 이렇게 불로 가까이 가면 보상을 마이너스로 주고, 물로 가까이 가면 확실하게 보상을 주어서, 비슷한 상황이 왔을 때에는 바로 물로 갈 수 있도록 유도하는 것이 강화학습인 것임.
위의 설명으로 크게크게 감을 잡으셨길 바랍니다.
이번 포스팅은 여기서 마치겠습니다.
'AI > 인공지능 및 기계학습 개론' 카테고리의 다른 글
[인공지능 및 기계학습 개론] 2.2 Introduction to Rule Based Algorithm (0) | 2022.08.15 |
---|---|
[인공지능 및 기계학습 개론] 2.1 Rule Based Machine Learning Overview (0) | 2022.08.15 |
[인공지능 및 기계학습 개론] 1.4 Probability and Distribution (0) | 2022.08.13 |
[인공지능 및 기계학습 개론] 1.3 MAP (0) | 2022.08.12 |
[인공지능 및 기계학습 개론] 1.2 MLE (0) | 2022.08.12 |