바둑 썸네일형 리스트형 보상을 통해 학습하는 머신러닝 기술 2편 지난 시간에는 강화학습의 정의와 등장 배경 그리고 머신러닝 분야 중의 하나인 강화학습(Reinforcement Learning)에 대해 알아봤습니다. ● 보상을 통해 학습하는 머신러닝 기술 1편: http://blog.lgcns.com/1692 그렇다면 이번 시간에는 강화학습의 머신러닝 기술을 토대로 발전하고 있는 다양한 사례와 앞으로의 동향에 대해 알아보겠습니다. 강화학습 기술의 적용사례 1. 게임 게임은 강화학습이 발전하게 된 토대를 만들어 주었고 지금도 강화학습 알고리즘의 테스트베드로 많이 쓰입니다. ● 딥마인드 알파고전편에서 설명했듯이 바둑에서 이세돌을 4:1로 이기면서 강화학습이 관심을 받게 된 계기를 만들었습니다. 2017년 5월에는 커제를 3:0으로 격파하고 그 후 딥마인드에서 공식적으로 은.. 더보기 보상을 통해 학습하는 머신러닝 기술 1편 2016년 3월, 전 세계가 주목한 세기의 대결이 펼쳐졌습니다. 구글의 딥마인드(DeepMind)에서 만든 인공지능 바둑 프로그램 알파고(AlphaGo)가 바둑 세계 챔피언 이세돌에게 도전장을 내민 것인데요. 바둑은 경우의 수가 약 2x10,170으로 우주 전체 원자 수보다 많은 보드게임입니다. 따라서 당연히 사람들은 이세돌이 승리할 것으로 생각했지만 결과는 놀라웠습니다. 알파고가 이세돌을 4:1로 제압한 것인데요. 컴퓨터가 인간을 이길 수 없는 마지막 보류라고 여겨졌던 바둑마저 컴퓨터에 챔피언의 자리를 내어준 것입니다. 그리고 1년 후 알파고 마스터라는 이름으로 커제와 대결했고 커제는 단 1승도 거두지 못했습니다. 이 대국을 마지막으로 알파고는 공식적으로 은퇴를 선언했고 이세돌은 알파고에 1승을 거둔 .. 더보기 부족한 데이터로 하는 머신러닝! ‘전이 학습’ 인공지능(AI)에 많은 관심을 두지 않는 사람이라도, '알파고 제로(AlphaGo Zero)' 대한 소식은 접하지 않았을까 생각합니다. 알파고는 미지의 영역이라고 여겨진 AI 기술을 본격화하는 계기가 되었기에, 기존 알파고의 강화 버전인 알파고 제로는 대단한 관심사가 될 수밖에 없겠죠. 본래 알파고는 수많은 바둑 기보를 토대로 기본적인 실력을 갖춘 정책망을 서로 대국하게 하는 방식으로 바둑을 익힌 AI입니다. 하지만, 알파고 제로는 기보 데이터를 익히지 않은 상태에서 바둑을 습득했습니다. 인간의 지식을 포함하지 않고도 AI가 발전할 수 있다는 걸 보여준 겁니다. 이런 알파고의 훈련 방식을 '강화 학습(Reinforcement Learning)'이라고 합니다. l 강화 학습으로 학습한 알파고 제로(출처: .. 더보기 인간과 기계의 대결 시작! 누가 진검 승부 승자가 될까? 인간과 인공지능 알파고와의 바둑 대결은 인간의 패로 결론이 났습니다. 알파고는 인공지능 알고리즘으로 설계된 로봇 바둑기사였는데요. 수많은 빅데이터를 순식간에 분석해서 수많은 바둑의 수를 통해 인간의 생각을 미리 읽어냈습니다. 그럼, 다양한 분야에 영향을 미치는 인공지능 로봇은 어떤 것이 있는지 알아보겠습니다. 재테크 로봇의 등장! 이제 재테크에도 ‘인공지능 로봇 트레이더’ ‘LOXM’가 등장합니다. 세계 최대 투자은행(IB) JP모건이 ‘인공지능 투자로봇’을 현장에 투입한다고 합니다. 이 인공지능은 최적의 주식 매매 타이밍을 찾아내 이익을 극대화할 방법을 알려주며, 수십억 건에 달하는 실제 거래 사례를 토대로 주식을 사고, 파는 시점을 자문해주고 수많은 뉴스를 분석해 호재와 악재가 주가에 미칠 영향까지 .. 더보기 이전 1 다음