금요일, 11월 15, 2024

새로운 접근 방식을 통해 봇은 가짜 데이터 세트를 사용하여 더 빨리 학습할 수 있습니다.

날짜:

로봇이 인간이 배우는 것과 같은 방식으로 학습하도록 하기 위해 미시간 대학의 엔지니어들은 학습을 수행했습니다. 로봇이 부드러운 소재로 작업할 수 있는 방법 개발, 향상된 성능과 함께 로프 및 직물과 같은. 시뮬레이션에서 더 큰 훈련 데이터 세트는 동일한 작업을 수행하는 물리적 로봇보다 로봇이 엔진 블록 주위에 밧줄을 감는 성공률을 두 배로 늘리고 40% 이상 개선했습니다. 새로운 방법은 새로운 재료로 작업하고 새로운 환경에서 작동하는 로봇의 학습 시간을 단 몇 주에서 몇 시간으로 단축할 수 있습니다.

“이 작업은 로봇 정비사가 쉽게 수행해야 하는 작업 중 하나입니다.”라고 UM의 로봇 공학 부교수인 Dimitri Berenson이 설명합니다. “그러나 오늘날의 방법으로 익숙하지 않은 호스나 벨트를 다루는 방법을 배우려면 엄청난 양의 데이터가 필요하며, 이는 며칠 또는 몇 주 동안 수집될 것입니다.” 그 시간 동안 로봇은 이 로프를 조작하여 호스가 얼마나 많은 방식으로 움직이고 꼬일 수 있는지 이해하게 되었습니다. 길고 긴 과정입니다.

이 시간을 줄이기 위해 팀은 최적화 알고리즘을 변경하여 한 조건에서 관찰된 역학이 다른 조건에서 어떻게 복제되는지 예측하는 것과 같이 우리 인간이 하는 일부 일반화를 컴퓨터가 수행할 수 있도록 했습니다. 한 예에서 로봇은 장애물이 가득한 표면에 실린더를 밀어 넣었습니다. 시운전 동안 실린더는 아무 것도 치지 않았지만 다른 경우에는 실린더가 다른 실린더에 부딪쳐서 진행 중인 실린더를 움직였습니다. 실린더가 아무 것도 치지 않으면 트랙이 다른 실린더에 부딪히지 않는 테이블 어디에서나 이 동작을 반복할 수 있습니다. 이것은 인간에게 자명하지만 봇은 해당 데이터를 수집해야 합니다. 시간이 많이 걸리는 실험을 실행하는 대신 엔지니어의 소프트웨어는 로봇이 동일한 방식으로 사용할 수 있는 첫 번째 실험의 원시 결과에서 변형을 생성할 수 있습니다.

조작된 데이터를 생성하기 위해 엔지니어는 관련성, 다양성 및 타당성이라는 세 가지 특성에 중점을 두었습니다. 예를 들어, 움직이는 실린더가 테이블에 초점을 맞추면 바닥에 대한 정보는 관련이 없습니다. 이 데이터도 유효해야 하므로 동일한 공간을 차지하는 두 개의 실린더가 있는 시뮬레이션은 유효하지 않으며 봇이 이것이 불가능하다는 것을 알 수 있도록 지정해야 합니다.

엔지니어는 로프의 유도 위치를 사용하여 데이터 세트를 가상 환경의 다른 위치로 확장하고 로프가 초기 실험에서와 동일한 방식으로 동작하도록 하여 로프를 시뮬레이션하기 위해 발견한 내용을 테스트에 적용했습니다. 전통적인 훈련 방법을 사용하면 로봇이 새로운 방법을 사용하는 동안 48%의 시간 동안 엔진 블록 주위에 밧줄을 감아 이 성공률을 70%까지 높일 수 있다는 것을 보여주었습니다.

관련 기사

무료 VPN: 스마트폰 사용자에게 필수적인 도구

오늘날 무료 VPN은 스마트폰 사용자들에게 필수적인 도구로 자리 잡았습니다. 안전한 인터넷 연결을 보장하면서 비용 부담 없이 강력한 기능을...

한 국 에 서 인 기 있 는 카지노사이트, 그 이 유 는 무 엇 일 까?

한 국 에 서  카지노사이트 가  많 은  주 목 을  받 으 며  인 기 를  끌...

대한배드민턴협회의 횡령과 경영실패를 폭로하다

파리 올림픽 배드민턴 여자 단식 우승자 안세영이 8월 7일 인천국제공항을 통해 입국해 취재진에게 인사하고 있다. 연합문화부는 올림픽...

북한 여자축구대표팀이 왜 좋은가 – DW – 2024년 11월 6일

북한 여자팀이 U-20 월드컵에서 또 우승했다. 이번이 지금까지 세 번째입니다. 이는 독일과 미국에 이어 토너먼트에서 3회 우승을 차지한...