90분의 훈련 후 로봇 도박 탁구를 시청하세요
탁구를 치는 로봇은 인간에 대항하여 랠리를 유지할 수 있지만 많은 초보 플레이어와 마찬가지로 더 멋진 그림을 시도하는 동안 고군분투합니다.
독일 Tübingen 대학의 Yapeng GAO, Jonas Tebbe 및 Andreas Zell은 탁구 라켓으로 준비된 디지털 로봇 팔이 탁구공을 디지털 탁구 책상 전체로 되돌리려고 시도하는 랩톱 시뮬레이션 설계를 사용하여 시작했습니다.
연구원들은 가제트 학습 규칙 세트가 라켓의 속도와 방향이 공이 가는 경로에 어떻게 영향을 미치는지 알아내기 위해 이 시뮬레이션을 실행했습니다.
시행착오를 통해 학습하는 이 일련의 규칙이 확실하게 공으로 돌아가야 하면 연구원들은 실제 책상 뒤에 위치한 실제 로봇 팔의 움직임을 제어하도록 규칙을 설정했습니다(그림).
가제트는 카메라를 사용하여 매 7밀리초마다 실제 공의 영역을 음악으로 지정했으며 일련의 규칙은 표시기를 처리하고 공을 치고 되돌리기 위해 로봇 팔을 이동할 위치를 결정했습니다.
전송된 규칙 집합을 통해 로봇 팔이 가정된 영역의 중앙값 24.9cm 내부로 그림을 재생할 수 있다는 표시기. Tebbe는 랩톱 시뮬레이션이 실제 생활에서 전체를 구성할 수 없기 때문에 규칙 집합이 시뮬레이션과 함께 실행되는 동안보다 정확도가 거의 나빠지지 않습니다.
디지털 시뮬레이션 내부와 실제 세계 내부의 학교 교육을 포함하는 전체 프로세스는 단 1.5시간이 소요되어 알고리즘이 완전히 새로운 상황에서 수행하는 방법을 얼마나 신속하게 발견할 수 있는지 보여줍니다.
그러나 로봇이 인간 플레이어와 반대로 적절하게 달성했음에도 불구하고 빠른 사진을 사용하고 놀랍게도 느린 사진을 사용하여 걸려 넘어졌습니다. Tebbe는 "공이 느린 경우 로봇은 추가 속도를 생성하기를 원합니다."라고 말합니다. 그렇게 하려고 애쓰다 공이 라켓에서 자주 미끄러졌습니다.
영국 셰필드 대학의 조나단 에이트켄(Jonathan Aitken)은 "매우 빠른 시간 동안 가제트를 교육함으로써 로봇은 서브의 변화에 적절히 대처할 수 있고 무작위 정책의 사용을 반환할 수 있습니다."라고 말했습니다. 연구 내에서 걱정하지 마십시오.
Aitken은 일련의 규칙이 무너지고 느린 그림을 반환하는 것에 놀랐습니다. 덧붙여 그는 정해진 룰의 부족함보다는 로봇 가제트의 기계적 장벽으로 인해 가끔씩 사진을 찍느라 애를 먹었다는 설렘을 드러낸다.
로봇 팔에는 다양한 장벽이 있습니다. 예를 들어, 로봇 팔이 라켓을 지정된 자세로 유지할 수 없기 때문에 백스핀 사진을 재생하는 데 어려움을 겪습니다. 이러한 사진을 수행해야 했습니다. 그러나 그러한 문제와 상관없이 그는 로봇이 뛰어난 선수라고 믿습니다.
"이제 더 이상 일반 인간 플레이어보다 나쁘지 않습니다."라고 그는 말합니다. "이미 나랑 동급이야."
참조: arxiv.org/abs/2109.03100
참고: 이 정보는 인간의 지식 때문에 100% 사실이 아닐 수 있습니다.
이 게시물이 마음에 드시면 저에게 투표하고, 저를 팔로우하고, 제 블로그를 방문하십시오. 여기에 사진과 다른 멋진 게시물이 있으면 좋겠습니다.