금요일, 1월 10, 2025

새로운 접근 방식을 통해 봇은 가짜 데이터 세트를 사용하여 더 빨리 학습할 수 있습니다.

날짜:

로봇이 인간이 배우는 것과 같은 방식으로 학습하도록 하기 위해 미시간 대학의 엔지니어들은 학습을 수행했습니다. 로봇이 부드러운 소재로 작업할 수 있는 방법 개발, 향상된 성능과 함께 로프 및 직물과 같은. 시뮬레이션에서 더 큰 훈련 데이터 세트는 동일한 작업을 수행하는 물리적 로봇보다 로봇이 엔진 블록 주위에 밧줄을 감는 성공률을 두 배로 늘리고 40% 이상 개선했습니다. 새로운 방법은 새로운 재료로 작업하고 새로운 환경에서 작동하는 로봇의 학습 시간을 단 몇 주에서 몇 시간으로 단축할 수 있습니다.

“이 작업은 로봇 정비사가 쉽게 수행해야 하는 작업 중 하나입니다.”라고 UM의 로봇 공학 부교수인 Dimitri Berenson이 설명합니다. “그러나 오늘날의 방법으로 익숙하지 않은 호스나 벨트를 다루는 방법을 배우려면 엄청난 양의 데이터가 필요하며, 이는 며칠 또는 몇 주 동안 수집될 것입니다.” 그 시간 동안 로봇은 이 로프를 조작하여 호스가 얼마나 많은 방식으로 움직이고 꼬일 수 있는지 이해하게 되었습니다. 길고 긴 과정입니다.

이 시간을 줄이기 위해 팀은 최적화 알고리즘을 변경하여 한 조건에서 관찰된 역학이 다른 조건에서 어떻게 복제되는지 예측하는 것과 같이 우리 인간이 하는 일부 일반화를 컴퓨터가 수행할 수 있도록 했습니다. 한 예에서 로봇은 장애물이 가득한 표면에 실린더를 밀어 넣었습니다. 시운전 동안 실린더는 아무 것도 치지 않았지만 다른 경우에는 실린더가 다른 실린더에 부딪쳐서 진행 중인 실린더를 움직였습니다. 실린더가 아무 것도 치지 않으면 트랙이 다른 실린더에 부딪히지 않는 테이블 어디에서나 이 동작을 반복할 수 있습니다. 이것은 인간에게 자명하지만 봇은 해당 데이터를 수집해야 합니다. 시간이 많이 걸리는 실험을 실행하는 대신 엔지니어의 소프트웨어는 로봇이 동일한 방식으로 사용할 수 있는 첫 번째 실험의 원시 결과에서 변형을 생성할 수 있습니다.

조작된 데이터를 생성하기 위해 엔지니어는 관련성, 다양성 및 타당성이라는 세 가지 특성에 중점을 두었습니다. 예를 들어, 움직이는 실린더가 테이블에 초점을 맞추면 바닥에 대한 정보는 관련이 없습니다. 이 데이터도 유효해야 하므로 동일한 공간을 차지하는 두 개의 실린더가 있는 시뮬레이션은 유효하지 않으며 봇이 이것이 불가능하다는 것을 알 수 있도록 지정해야 합니다.

엔지니어는 로프의 유도 위치를 사용하여 데이터 세트를 가상 환경의 다른 위치로 확장하고 로프가 초기 실험에서와 동일한 방식으로 동작하도록 하여 로프를 시뮬레이션하기 위해 발견한 내용을 테스트에 적용했습니다. 전통적인 훈련 방법을 사용하면 로봇이 새로운 방법을 사용하는 동안 48%의 시간 동안 엔진 블록 주위에 밧줄을 감아 이 성공률을 70%까지 높일 수 있다는 것을 보여주었습니다.

관련 기사

Bit Octopus, 한글 지원 및 독특한 기술로 국내시장에서 큰 인기를 끌며 거래의 새로운 시대를 선도하다

중국 홍콩 — 글로벌 핀테크 시장에서 Bit Octopus가 빠른 속도로 한국 금융 무대에 등장하고 있습니다! 업계 최초로 역전...

Battletoads/Double Dragon이 Nintendo의 Switch Online 라이브러리에 진출하고 있습니다.

NES 및 SNES 콘솔 시대에 자랐다면 이 게임이 이후 최고의 비디오 게임 중 하나라는 사실을 알고 기뻐할 것입니다....

White Fragility 저자 Robin DiAngelo에 대한 표절 고소가 기각되었습니다. 서적

지난달 'White Fragility'를 비롯해 인종차별에 관한 여러 책을 쓴 로빈 디안젤로(Robin DiAngelo)를 대상으로 제기된 표절 고소장이 기각됐다.DiAngelo의 2004년...

2024 한국영화제, 우정을 다룬 영화 5편

크리스토퍼 퍼넬(Christopher Purnell) - Philstar.com2024년 9월 18일 | 오후 7시 14분 마닐라, 필리핀 - 올해 한국영화제는 한국과 필리핀...