어제는 대기업의 경력자 채용에 활용되는 'AI인터뷰'에 대한 기사가 눈에 띄어서 AI와 러닝머신 그리고 딥러닝까지 사전적 의미부터 내용까지 간략히 알아 보았습니다. 오늘은 AI에서 이용하는 대표적인 이론인 러닝머신과 딥러닝에 대해 가볍게 한번 더 알아보고자 합니다.(전문적이고 기술적인 부분은 제외합니다.)
딥러닝이 AI 분야에 이바지한 주요 사건
년도 | 주요 사건 |
1996년 | - 체스대결에서 '딥블루'가 세계 체스 챔피언인 '가리 카스파 로프'를 이기고 승리함 |
2011년 | - 퀴즈쇼인 제퍼디 쇼에서 IBM 컴퓨터 프로그램인 '왓슨'이 퀴즈의 최고수들을 압도적으로 이김 |
2012년 |
- 이미지 인식 콘테스트 *ILSVRC에서 딥러닝을 이용한 Supervision 이 월등한 성능으로 1위를 차지함 |
- 구글이 개발한 딥러닝 기반 인공지능이 유튜브 영상에서 고양이를 인식함 | |
2014년 | - 애플 시리(Siri)의 음성 인식 시스템이 딥러닝을 이용하도록 변경 |
2016년 | - 구글 알파고(AlphaGo)가 세계 정상급 바둑 기사 이세돌과 대결해 5전 4승 1패로 승리함 |
- 아우디와 BMW의 자동 운전 기술에 딥러닝 적용함 |
[*ILSVRC : The ImageNet Large Scale Visual Recognition Challenge http://www.image-net.org/challenges/LSVRC/]
인공지능은 SF영화나 애니메이션 등에서 예전부터 볼 수 있었던 개념으로 사람이 인공지능에게 다양한 지식을 가르친다는 전제로 만들었습니다. 산업용 로봇 등에서 많이 활용했습니다. 사실 머신러닝은 우리 주변에 널리 퍼져 있는데, 검색엔진에 검색어를 입력하면 머신러닝은 검색 결과 가운데 어느 것을 보여 줄지 계산해 냅니다. 이메일을 읽을 때도 스팸 메일이 거의 보이지 않는 것도 머신러닝이 스팸메일을 걸러냈기 때문이지요.
그 외에도 아마존과 넷플릭스에서도 우리들 각자가 좋아할 만한 상품 등을 적절히 추천해 주고, 페이스북이나 트위터 역시 머신러닝을 이용해 우리에게 보여 줄 최신 정보를 보여줍니다. 컴퓨터를 사용할 때마다 어딘가에서 머신러닝이 관여한다고 보면 됩니다. 전통적으로 컴퓨터에 일을 시키는 유일한 방법은 세세한 사항까지 공들여 설명하는 알고리즘을 작성하는 것이었습니다.
하지만, 학습자라 불리는 머신러닝 알고리즘은 이와는 다르게 스스로 데이터를 이용해 추론하면서 일을 하는데, 데이터가 많으면 많을수록 더 훌륭하게 일을 해냅니다. 즉 컴퓨터가 스스로 자기 프로그램을 짜기 때문에 우리가 컴퓨터 프로그램을 작성하지 않아도 되지요. 머신러닝은 이렇게 손가락 하나 까닥하지 않아도 우리가 원하는 것을 세상이 감지하여 그에 맞게 변하도록 해주는데, 이런 일이 가능한 것은 머신러닝의 하는 일이 근본적으로 예측이기 때문입니다.
머신러닝의 5가지 마스터 알고리즘
◎ 머신러닝 분야에서 경쟁하는 학습적 분류
학습적 분류 | 내 용 | 마스터 알고리즘 | |
1 | 기호주의(symbolist) | - 학습을 연역으로 보며 철학과 심리학, 논리학에서 아이디어를 얻음 | 역연역법 (inverse deduction) |
2 | 연결주의(connectionist) | - 두뇌를 분석하고 모방하며 신경과학과 물리학에서 영감을 얻음 | 역전파 (backpropagation) |
3 | 진화주의(evolutionary) | - 컴퓨터에서 진화를 모의시험하며 우전학과 진화생물학에 의존함 | 유전자 프로그래밍 (genetic programming) |
4 | 베이즈주의(Bayesian) | - 학습이 확률 추론의 한 형태라고 믿으며 통계학에 뿌리를 둠 | 베이즈 추정 (Bayesian inference) |
5 | 유추주의(analogizer) | - 유사성(similarity) 판단을 근거로 추정하면서 배우며 심리학과 수학적 최적화의 영향을 받음 | 서포트 벡터 머신 (support vector machine) |
※ 실제 위 다섯가지 마스터 알고리즘은 특정작업에는 훌륭하지만, 다른 일에는 그렇지 않다는 점이 문제입니다. 그러므로 이 다섯가지 마스터 알고리즘의 핵심 특성을 모두 지닌 단일화 알고리즘, 즉 최종 알고리즘이 요청됩니다. 이 최종 알고리즘이 존재한다면 그것은 세상의 모든 지식, 과거와 현재, 미래의 모든 지식을 데이터에서 얻어 낼 것입니다.
신경망과 딥러닝
신경망은 딥러닝의 출발점으로 우선 신경망을 설명하려면 생물학에서 다루는 뉴런을 이야기 해야 합니다.
▶ 뉴런이란?
1. 뉴런은 네트워크를 형성합니다.
2. 여러 뉴런에 전달되는 신호의 합이 일정 크기(임계값)를 넘지 않으면, 뉴런은 전혀 반응하지 않습니다.
3. 여러 뉴런에 전달되는 신호의 합이 일정 크기(임계값)를 넘으면 뉴런이 반응하며, 다른 뉴런에 일정 강도의 신호를 전달합니다.
4. 2와 3에서 여러 뉴런에 전달되는 신호의 합은 신호마다 가중치가 다릅니다.
뉴런의 작용을 수학적으로 추상화해 일정 단위의 인위적인 네트워크로 표현 한 것이 신경망으로 즉, 뇌를 형성하는 뉴런의 집합체를 수학 모델로 나타낸 것입니다.
신경망 기반 인공지능은 사람이 단순히 데이터를 제공할 뿐이지만, 데이터를 받은 신경망은 네트워크 관계 속에서 '스스로 필요한 것을 배우고 이해'하려 합니다.
뉴런의 반응 구조를 정리해보면,
1. 다른 여러 뉴런의 '신호 합'이 뉴런의 입력입니다.
2. '신호 합'이 뉴런 고유의 임계값보다 크면 반응합니다.
3. 뉴런의 출력 신호는 반응했는지를 0과 1의 디지털 신호로 표현합니다. 복수의 출력 신호가 있더라도 반응 여부를 0과 1이라는 값으로 표현할 뿐입니다.
입력 신호 없음: x = 0 / 입력 신호 있음 x = 1
출력 신호 없음: y = 0 / 출력 신호 있음 y = 1
신경망과 딥러닝에 대해 짧게 살펴봤는데, 딥러닝 역사에는 여러 기술들이 출현하고 적용되면서 오늘에 이르렀습니다. 그 중에 큰 획을 그은 연구가 2014년에 발표된 굿펠로우의 생성적 적대신경망(GAN)으로 그 전까지는 데이터를 분석하기 위한 기술은 많이 발전했으나 데이터를 합성하기 위한 기술은 그렇지 못했습니다. 그러나 이 '생성적 적대신경망'은 마치 해커와 화이트 해커가 경쟁하며 발전하는 것과 같은 원리로 학습이 된다고 합니다. GAN의 출현은 데이터를 합성하는 생성적 모델의 열풍을 촉발한 계기가 되었다는데 중요 의미가 있고, 이후 활발한 연구들이 이루어졌습니다.
현재 생성적 모델들은 학습 데이터로분터 배운 지식을 이용해 학습 데이터와 유사한 영상, 텍스트, 음성 등을 합성합니다.생성적 모델들은 각 학습 데이터에 대한 정답이 없어도 데이터만으로도 학습이 가능하기 때문에 최근 활발히 연구되고 있는 '*비지도 학습'의 핵심기반 기술이기도 합니다. 이렇게 딥러닝의 빠른 발전에는 딥러닝의 확장성과 유연성이 있는데, 실제 머신러닝 분야에서 오랫동안 발전해 온 수 많은 기술과 개념들이 딥러닝에 결합됨으로써 개선을 이루었다고 합니다.
[*비지도 학습(Unsupervised Learning): 머신러닝이 데이터를 학습하는 방법 중 하나로 알고리즘이 자체적으로 이해해야 하는 레이블이 지정되지 않음. 데이터의 분류나 레이블이 전혀 없어 유사성에 따라 사물을 그룹화하여 데이터에 숨겨진 구조와 패턴을 찾는 방식으로 결과는 없고 데이터의 순수한 분석만 있음.]
앞으로 딥러닝이 가져올 인공지능의 세계가 우리의 미래를 더욱 밝게 만들어 주기를 기대하면서 이상으로 마치겠습니다.~ ^^
'IT 이야기' 카테고리의 다른 글
하나의 핸드폰에 2개의 번호 e심 서비스 (0) | 2022.09.03 |
---|---|
6G 이동통신과 양자기술 (0) | 2022.08.20 |
취업면접도 AI가 하네.. (0) | 2022.08.08 |
5G보다 50배 빠른 6G (0) | 2022.08.04 |
4차 산업과 해커톤 (0) | 2022.08.03 |
댓글