인간 없이 스스로 바둑을 정복한 새로운 알파고, “알파고 제로”

구글의 딥마인드 부서에서 개발한 알파고는 5 월부터 공식적으로 인간을 상대로 한 대결들을 중단했습니다. 그러나 이제 알파고의 새로운 버전인 “알파고 제로”가 나왔습니다.

알파고 제로는 탄산 음료 이름처럼 들리지만, 인간이 가지고 있지 않은 기술로 알고리즘을 개발할 수 있기 때문에 알파고를 뛰어넘는 혁신을 보여줄 것으로 예상되고 있습니다.

알파고는 인간 전문가의 움직임을 연구하고 자체적으로 대항하여 강화 학습이라는 기술로 바둑에서 우위를 점했습니다. “알파고 제로”는 강화 학습만을 통해 전적으로 스스로 훈련하며 바둑을 배웠습니다.

바둑 기보를 한번도 보지 않으며, 인간과의 대결도 없이 스스로 바둑을 학습하여 알파고와의 상대로 100대 0 이라는 기록으로 완전히 제압했다고 한다.

이것은 초인적인 기술을 가진 인공지능의 개발에 중요한 영향을 미칠 수 있기 때문에 상당히 흥미롭습니다. 딥마인드 연구원들은 새로운 Nature 논문에서 설명했듯이 인공 지능을 인간의 의사 결정에 훈련시키는 것도 매우 좋지만 인간으로부터 파생된 데이터는 “종종 비싸고 신뢰할 수 없거나 단순하게 적용할 수 없다”고 합니다.

“신뢰할 수 있는 데이터를 사용할 수 있는 경우에도 이런 방식으로 훈련된 시스템의 성능 한도를 보여줄 수 있습니다”라고 연구진은 썼다. 반대로 강화 학습 시스템은 원칙적으로 인간의 능력을 뛰어 넘을 수 있는 경험과 인력이 부족한 영역에서 활동하도록 훈련 받았습니다. ”

또한 알파고 제로는 단 며칠 만에 여러 기술을 혼자 개발했지만, 초기 알파고는 인간을 뛰어넘기 위해 수 개월간의 학습기간을 가졌습니다.

딥마인드의 CEO 인 하사비스/Demis Hassabis는 BBC와의 인터뷰에서 “완전한 인공 지능을 만드려면 아직 먼길이 남아있지만, 현재 우리가 마주하고 있는 문제에 적용하여 도움을 주기에 충분하다고 생각하기 때문에 앞으로 더 기대된다”고 말했다.

 

main image source from Gizmodo.com.au

MIT Technology Review

더버지 기사

본문원본

Advertisements

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

w

%s에 연결하는 중