이번 주말에 있었던 국제 장애인의 날에 대한 최근 보도에 이어 Microsoft는 월요일에 Android에서 Seeing AI 앱을 출시했습니다. 구글 플레이 스토어를 통해.
그 소식이었어 블로그 게시물에 공유됨 창립자 Saqib Sheikh가 작성했습니다.
수년간 iOS에서 독점적이었던 후 Android로 이전한 것 외에도 Seeing AI의 이 새 버전은 이제 18개 언어로 번역되었습니다. 마이크로소프트는 내년에 그 숫자를 36개로 두 배로 늘릴 계획이다. 또한 Android 앱에는 이미지에 대한 더욱 풍부한 대체 텍스트 설명과 같이 최근 iOS에 도입된 몇 가지 기능이 추가되었습니다. “추가 정보” 버튼을 탭하면 이전보다 훨씬 더 자세하게 이미지에 대한 설명이 표시되며, 분명히 AI를 사용하여 텍스트를 생성합니다. 이미지 설명 외에도 문서를 스캔한 후 문서에 대한 정보를 얻기 위해 내장된 챗봇과 대화하는 기능이 있습니다. 예를 들어 사용자는 Seeing AI를 사용하여 영수증에 있는 항목의 가격, 레스토랑 메뉴의 항목에 대해 질문하거나 이와 같은 기사를 요약할 수 있습니다.
Seeing AI는 2017년에 처음 출시되었습니다. 소프트웨어의 목표는 셰이크를 포함한 시각 장애가 있는 사람들이 물리적 세계를 탐색할 수 있도록 돕는 것입니다. 사람은 메뉴, 영수증 등과 같은 물리적인 물체에 카메라를 비추거나 사진을 찍기만 하면 통화, 문서, 심지어 주변 사람들까지 이해할 수 있습니다. 높은 수준에서 AI Vision은 Be My Eyes와 거의 동일한 목적을 가지고 있습니다. Be My Eyes는 인간 구성 요소를 사용하여 영수증 등을 읽는 데 도움을 주는 반면, Seeing AI는 소프트웨어를 사용하여 이를 수행합니다. 기본 개념은 동일합니다. Be My Eyes와 Seeing AI는 시각 장애인이 일상 생활에 접근할 수 있도록 돕고자 합니다.
Seeing AI(그리고 Be My Eyes)가 물리적 세계를 더 쉽게 탐색하기를 원한다는 생각은 AI가 그 어느 때보다 더 스마트하고 유능하게 성장하면서 실제로 좋은 일을 할 수 있는 능력을 보여주는 대표적인 예입니다. 마찬가지로 OpenAI의 ChatGPT 기술과 같은 챗봇은 연구 수행 용이성 측면에서 장애인에게 도움이 될 수 있는 실질적인 잠재력을 가지고 있습니다. 예를 들어, 학교 기사에 대한 정보를 인터넷에 검색하는 것은 나쁜 것이 아니지만 현실은 문자 그대로 그렇게 하는 과정입니다. 아마도 나쁜. 알기 위해서는 많은 인지적 부하가 필요하다 무엇 그리고 어떻게 정보를 검색하려면 엄청난 양의 시각 및 운동 에너지가 필요합니다. 솔직히 모든 사람이 오랜 시간 동안 유지할 수는 없습니다. 예를 들어 누군가 학교 프로젝트에 대한 연구를 수행하기 위해 ChatGPT가 제공하는 Bing 검색을 사용할 수 있습니다. 이는 사소한 일이 아니며 학문적으로 부정직한 것으로 간주되어서는 안 됩니다. 즉, 챗봇의 지원이 장애인이 작업을 완료하는 데 완전히 참여할 수 있는 유일한 방법이라는 것은 꽤 그럴듯합니다.
셰이크는 자신의 게시물에서 전 세계적으로 30억 명 이상의 안드로이드 사용자가 있으며 Seeing AI를 플랫폼에 도입하면 “맹인 및 시각 장애인 커뮤니티의 훨씬 더 많은 사람들이 이 기술을 활용할 수 있는 능력을 제공하게 될 것”이라고 말했습니다. 그들의 일상.” 그는 팀이 특히 인공 지능의 성장과 함께 고객 피드백을 듣고 통합하여 Android 앱을 정기적으로 개선하기 위해 최선을 다하고 있다고 덧붙였습니다.