OpenAI와 Google은 YouTube 동영상의 텍스트를 복사하여 AI 모델을 훈련시켰으며 잠재적으로 콘텐츠 제작자의 저작권을 침해했다고 합니다. 뉴욕 타임즈. AI 시스템에 제공할 수 있는 데이터의 양을 최대화하기 위한 OpenAI, Google 및 Meta 회사의 노력을 설명하는 이 보고서에는 해당 회사의 관행에 대해 알고 있는 여러 사람이 인용되어 있습니다. 이는 YouTube CEO Neil Mohan이 인터뷰에서 다음과 같이 말한 지 불과 며칠 만에 나온 것입니다. 블룸버그 오리진스 OpenAI는 새로운 텍스트-비디오 생성기인 Sora를 교육하기 위해 YouTube 비디오를 사용했다고 주장합니다. 플랫폼 정책에 위배됩니다.
에 따르면 뉴욕 타임즈OpenAI는 음성 인식 도구인 Whisper를 사용하여 백만 시간이 넘는 YouTube 동영상을 복사한 후 GPT-4를 훈련하는 데 사용했습니다. 정보 저는 이전에 OpenAI가 YouTube 비디오와 팟캐스트를 사용하여 AI 시스템을 훈련했다고 보고했습니다. OpenAI의 책임자인 Greg Brockman도 해당 팀의 구성원 중 한 명인 것으로 알려졌습니다. 구글 대변인 맷 브라이언트(Matt Bryant)는 구글 규정에 따라 “유튜브 콘텐츠를 무단으로 클리핑하거나 다운로드하는 것”은 허용되지 않는다고 말했다. 뉴욕 타임즈또한 회사는 OpenAI의 그러한 사용을 알지 못했다고 말했습니다.
그러나 보고서는 Google이 AI 모델을 훈련하기 위해 YouTube 동영상을 사용하고 있었기 때문에 OpenAI에 대해 알고 있었지만 아무런 조치도 취하지 않은 Google 내부 사람들이 있었다고 주장합니다. 구글은 말했다 뉴욕 타임즈 이는 동의한 콘텐츠 제작자의 동영상에만 적용됩니다. Engadget은 의견을 얻기 위해 Google과 OpenAI에 연락했습니다.
그만큼 뉴욕 타임즈 보고서는 또한 구글이 AI 모델과 제품을 교육하기 위해 구글 독스, 구글 시트 등 공개적으로 사용 가능한 광범위한 콘텐츠를 사용하도록 2023년 6월에 개인정보 보호정책을 개정하도록 팀에 요청했다고 주장합니다. 명확성을 위해 Google이 밝힌 변경 사항은 7월에 게시되었습니다. 브라이언트가 말했다. 뉴욕 타임즈 이러한 유형의 데이터는 Google의 베타 기능 테스트에 등록한 사용자의 허가가 있는 경우에만 사용되며 회사는 “이러한 언어 변경을 기반으로 한 추가 유형의 데이터에 대한 교육을 시작하지 않았습니다.” 변경 사항으로 인해 이 데이터가 사용될 수 있는 예로 Bard가 추가되었습니다.
정정, 2024년 4월 6일 오후 3시 45분(ET): 이 기사는 원래 Google이 2022년 6월에 개인정보처리방침을 업데이트했다고 보도했습니다. 정책 업데이트는 실제로 2023년에 이루어졌습니다. 오류가 발생한 점 사과드립니다.
“트위터를 통해 다양한 주제에 대한 생각을 나누는 아 동율은 정신적으로 깊이 있습니다. 그는 맥주를 사랑하지만, 때로는 그의 무관심함이 돋보입니다. 그러나 그의 음악에 대한 열정은 누구보다도 진실합니다.”