메인 받아 들여 쓰다 Google 인공 지능 '알파 고 제로'가 학습 방법에 대한 재설정을 방금 눌렀습니다.

Google 인공 지능 '알파 고 제로'가 학습 방법에 대한 재설정을 방금 눌렀습니다.

내일의 별자리

걷거나, 말하거나, 자전거를 타거나, 운전하는 법을 (모호하게) 기억하십니까? 지저분하고 실수로 가득했지만 그렇게 배운 기술은 그대로 유지되었습니다. 살아있는 시스템 밖에서는 '실제 경험'을 받아들이고 인공 지능을위한 끈적하고 적응 가능한 행동을 개발할 수있을만큼 강력한 알고리즘을 구성하는 것이 어려웠습니다.

음, Alpha Go Zero가 방금 해냈습니다.

'그것은 빈 슬레이트에서 시작하여 인간의 지식이나 인간 데이터, 기능, 예, 또는 인간의 개입없이 자기 플레이를 통해서만 스스로를 파악합니다. 첫 번째 원칙에서 바둑 게임을하는 방법을 발견합니다. '라고 DeepMind의 David Silver 교수는 말합니다.

AI는 이전보다 더 똑똑하고 능력이 뛰어난 여러 번의 반복 작업을 수행했습니다. 이전 버전은 이전 게임의 방대한 데이터베이스를 승리로 향하는 알고리즘과 함께 사용했습니다. 그 접근 방식은 세계 챔피언 프로 바둑 선수의 패배로 이어졌습니다. 포커에서 AI Libratus는 최근에 인간 게임 데이터 대신 셀프 플레이를 통해 학습함으로써 세계 최고의 포커 플레이어를 거의 2 백만 달러로 스키닝했습니다.

공주와 레이 j 순 가치

이제이 최신 버전의 Alpha Go에서 인공 지능 프로그램은 그 자체 사람의 배경없이 Go를 플레이하는 방법.

수백만 건의 게임 시뮬레이션을 실행하면서 처음부터 월드 챔피언 버전 자체를이기는 방법을 배우는 데 40 일이 걸렸습니다. 이는 바둑뿐만 아니라 새로운 지식이 발견되는 방식에 있어서도 진정한 판도를 바꿉니다. 귀하의 도메인 전문성은 얼마나 정확하거나 완전합니까? 거기 많이 더 많은 것을 발견 할 수 있습니다. Alpha Go Zero로 배우는이 매혹적인 실험이 우리에게 말해주는 것입니다.

Silver는 다음과 같은 YouTube 게시물에서 '알파 고의 아이디어는 나가서 인간을 물리 치는 것이 아니라 실제로 과학을 수행하는 것이 무엇을 의미하는지 발견하는 것입니다. 프로그램이 지식이 무엇인지 스스로 배울 수 있습니다. 성취.

Alpha Go Zero Deep Mind 팀은이를 제 1 원칙 인 'tabula rasa'(blank slate) 학습이라고 부릅니다.

'당신이 달성 할 수 있다면 Tabula rasa 학습, Go 게임에서 다른 도메인으로 이식 할 수있는 에이전트가 있고 현재 게임의 세부 사항이 있으면 어디서나 적용 할 수있는 매우 일반적인 알고리즘이 있습니다. '라고 그는 말합니다. . 그것은 개념을 확장 할 때 도발적인 아이디어입니다. 어려운 문제를 체계적으로 해결하고 우리 문명의 집단 지식보다 빠르게 배울 수있는 강력한 학습 알고리즘 세트로 무엇을 할 수 있는지 생각해보십시오. . . 수십 년이 아닌 며칠 만에.

엘비스 코스텔로는 누구와 결혼했습니까?

현재 가장 중요한 점은 '알고리즘이 사용 가능한 컴퓨팅이나 데이터보다 훨씬 더 중요하다'는 것입니다. 이것만으로도 알려진 세계를 확장하는 방법에있어 게임 체인저가됩니다. Alpha Go는 약 2,500 만 달러의 하드웨어로 실행되지만 (정확히 가벼운 시스템은 아닙니다) AI 전문가가 오랫동안 더 깨끗하고 더 나은 데이터 세트를 만들기 위해 노력해 왔습니다. 오늘날 많은 빅 데이터 세트는 인공 지능을 정확하게 훈련 시키기에는 너무 시끄럽고 (잘못된 데이터로 가득 찬) 것으로 간주됩니다. AI가 데이터에서 학습하고 데이터가 나쁘면 학습하지 않습니다. 큰 문제.

깨끗한 데이터가 필요하지 않고 경험 만 있으면 인공 지능이 스스로 훈련 할 수 있다면 어떨까요?

이것이 Alpha Go Zero의 흥미로운 업적입니다. 틈새, 규칙 기반 게임 세계에 있지만 화학, 교통, 생물학, 약리학, 여행, 물류 및 제조와 같은 물리적 규칙으로 작업하는 모든 산업에 큰 영향을 미칩니다. 규칙을 매우 유연하게 설계 할 수있어 광범위한 경험에서 작업 할 수 있고 방향성이 높아 항상 Alpha Go Zero와 같은 더 강력한 기술을 만들 수 있다면 시스템을 지배하는 인공 지능을 달성 할 수 있습니다. 이러한 시스템은 외부 데이터가 필요하지 않고 데이터 정리 문제가 없으며 인간의 속도 저하가 필요하지 않습니다. 그렇기 때문에 구글의 모회사 인 알파벳이 인공 지능에 투자하고 빠른 속도로 인공 지능에 투자하고있다. (Amazon은 최신 AI 인수 BodyLabs와 같은 인공 지능에도 투자하고 있습니다.)

빈센트 허버트 순 가치는 얼마입니까

Deep Mind 교수 인 David Silver는 '우리가 프로그램이 높은 수준의 성과를 달성하는 것을 보았다는 사실은 인류에게 가장 어렵고 영향력있는 문제를 해결할 수 있다는 것을 의미합니다.'라고 말합니다.

이 게시물은 AI Libratus가 최근 사람이 입력 한 데이터가 아닌 셀프 플레이를 포함하는 전략을 사용하여 최고의 포커 플레이어를 이겼 음을 명확히하기 위해 업데이트되었습니다.