인공지능 정보

"딥러닝"의 본질 (Nature of Deep learning)

파요요요 2022. 7. 2. 19:09

이번 글에서는 필자 생각하는 "딥러닝의 본질"에 관해서 이야기해 보고자 합니다.

 

일단 본격적인 이야기에 앞서서, 딥러닝에 대한 사전 지식이 없는 분들을 위해서

"딥러닝이 이뤄지는 과정"에 대해 간략하게 알아보고

본론인 "딥러닝의 본질"에 대한 이야기를 해보겠습니다.

목차 :

1. 간략하게 알아보는 딥러닝(Deep learning)

2. 필자가 생각하는 "딥러닝의 본질(Nature of Deep learning)"


1. 간략하게 알아보는 딥러닝(Deep learning)

코세라 앤드류 응 교수님의 수업 - 딥러닝이 이뤄지는 과정

 

자료는 딥러닝이 이루어지는 수학적 과정을 한눈에 볼 수 있도록 만들어진 자료입니다.

 

위 자료를 참고하며, 딥러닝이 이뤄지는 과정을 짧게 요약해보겠습니다.

 

1. 학습 데이터(숫자)를 대충 곱하고 대충 더해가고, 숫자들을 걸러서 학습 인공지능을 만들어줍니다.

2. 그렇게 만든 학습 인공지능을 이용하여, 학습 데이터가 정답인지 아닌지 예측해 봅니다.

3. 실제 데이터의 정답과 학습 인공지능이 예측한 값의 차이를 구해줍니다.

---> 여기서는 지도 학습이라서, 사람이 직접 하나하나 실제 데이터의 정답을 입력해 줘야 됩니다 ㅎㅎ

4. 그러한 차이를 최소화하도록, 아까 대충 곱하고 더한 것들을 "정성스럽고 잘" 곱하고 더해줍니다.

참고) ------->

어떻게 고쳐 나갈지에 대한 방향을 알려주는 것이 "역전파 과정"이고,

수정해서 잘 곱해주고 잘 더해줘서 예측 값을 구하고 실제와의 차이를 구해주는 것이 "순전파 과정"입니다.

5. 이 과정을 계속 반복해서, 최대한 실제 정답과 인공지능의 예측이 가깝도록 계속해서 모델을 수정해 줍니다.

---> 수정한다는 의미는 얼마나 곱해줄지, 얼마나 더해줄지를 의미함.

6. 그렇게 만들어진 "정성스럽고 잘 만들어진 인공지능 "을 테스트 과정을 통해 실험한 뒤,

다시 수정하여 최종 인공지능 모델을 완성해 줍니다.

---> 테스트 과정은 학습 과정과는 다른 데이터로 실험하기에, 훈련과는 또 다른 결과가 결과가 나옵니다.


2. 필자가 생각하는 "딥러닝의 본질(Nature of Deep learning)"

 

이제 본격적으로 제가 생각하는 "딥러닝의 본질"에 대해서 이야기해보겠습니다.

 

제가 생각하는 현재 딥러닝의 본질 "데이터를 최대하게 포함하는 적당한 범위 그리기"입니다.

글자로는 잘 와닿지 않으니, 그림과 함께 이야기해보겠습니다.

 

딥러닝의 본질(Nature of Deep learning)
 
 

검은색 점들 학습 데이터를 의미하고,

노란색 원은 학습을 통해서 만들어진 딥러닝 알고리즘(모델)을 뜻한다고 생각합니다.

인공지능이 판단하기에 정답이라고 생각하는 데이터의 범위를 나타낸 것이죠.

예를 들어서 딥러닝 인공지능이 어떤 데이터를 예상한다고 하면,

데이터가 저 노란색 원 안에 위치한다면 정답, 밖에 있다면 오답이라고 판단하게 되는 것이죠.

 

+++ 데이터가 노란 원의 중앙에 가까울수록, 정답에 대한 인공지능의 예측값이 높아지게 됩니다.

3차원으로 표현한 딥러닝의 본질

만약, 3차원으로 표현하면 이런 느낌이 됩니다.

 

이러한 관점에서 딥러닝의 본질을 바라보면, 딥러닝의 한계점도 확실하게 이해가 됩니다.

예를 들어서,

노란색 원에 속해있지 않은 검은색 점들도 사실은 정답인 데이터들입니다.

 

그렇지만 현재 딥러닝은 데이터에 대해 이해하고 파악해서 정답들을 구별해 내는 것이 아닌,

수많은 정답들을 가장 "잘" 포함하는 범위 그리기에 불과한 기술이기에

원밖에 사실 정답이었던 데이터를 오답으로 판별하게 되는 것이죠.

 

---> 그래서 상황이 정해져 있는 바둑이나 스타크래프트 같은 게임 영역에서는 탁월한 효과를 발휘합니다.

물론,

실제 딥러닝에서는 2~3차원이 아닌 수백수천 차원이고 데이터의 수도 어마어마하기에,

단순히 저 그림처럼 단순하게 범위를 그리지는 않습니다.

그러나,

"정답을 가장 많이 포함하는 적당한 범위 그리기"라는 현 딥러닝의 본질은 변하지 않는다고 생각합니다.

 

이런 관점에서 딥러닝을 바라보면,

실제 딥러닝을 사용하여 산업현장에서 활용되는 딥러닝 인공지능의 판단을 전적으로 신뢰할 수 없습니다.

 

왜냐하면 이해가 아닌 통계로 판단하는 그들의 판단에 대해서 "왜 그렇게 판단했냐는 근거"를 알 수 없고,

가끔은 정답인 것도 오답으로 판단하기 때문입니다.

그렇기에,

인간은 현재 이러한 인공지능의 불확실한 판단에 대해서 전적으로 신뢰해서는 안 된다고 생각합니다.

--> 완전 자율주행, 의료 판단, 사법 판단, 언론 기사 작성, 유튜브 알고리즘 등등

딥러닝의 본질에 대한 관점은 오직 저의 "개인적 판단"이며, 결코 학계 주류의 의견이 아님을 밝힙니다.

딥러닝에 대한 저의 이해도는 아직 한참 멀었기에,

글의 내용에 대한 의구심이나 비판에 대해서 정말 환영합니다!

혹시나 글의 내용이 잘못된 경우에는 수정-삭제를 하도록 하겠습니다.


이상으로 딥러닝의 본질에 대한 이번 글을 마치도록 하겠습니다.

긴 글 읽어 주셔서 감사드립니다!

 

반응형