이슈

오픈 AI의 GPT-4o 무료 출시 음성비서 기능 대폭 강화

hyeon :) 2024. 5. 14. 15:58

GPT-4o 오픈AI의 음성비서 기능 강화


오픈AI는 최근에 GPT-4o라는 새로운 멀티모달 모델을 선보였습니다. 이 모델은 음성 비서 기능을 강화하였으며, 'o’는 '옴니(omni)'를 의미하며, 모든 것을 포괄한다는 의미를 가지고 있습니다.

최근 보고서를 작성할때도 Chat GPT를 잘 사용하고 있었는데 음성 비서 기능 강화 모델이 나왔다니 더 기대되네요. 가능하다면 스마트폰과 연계되면 좋을텐데 가능했으면 싶네요.

GPT-4o 첫공개 소식
GPT-4o의 첫공개 소식 (출처 - KBS 뉴스 스크린샷)

반응형

 

 

 

 

 

 

GPT-4o의 독특한 특징들


GPT-4o는 기존 모델에 비해 더욱 빠르고 경제적이라는 점이 강조되었습니다. 이 모델은 사용자가 질문을 하면, 최소 232밀리초, 평균 320밀리초 안에 오디오로 응답할 수 있습니다. 이는 사람의 반응 속도와 유사하며, 이는 기존 'GPT-4’의 5.4초에 비해 크게 단축된 시간입니다.

또한, 이 모델은 50개 이상의 다양한 언어를 지원하며, 거의 즉시 다른 언어로 번역이 가능합니다. 한국어를 포함한 20개 언어에 대한 토크나이저 압축을 개선했다고 발표하였습니다.

GPT-4o 첫공개 소식 (출처 - KBS 뉴스 스크린샷)

 

반응형

 

 

 

 

 

GPT-4o의 성능과 비용, 출시와 구글과의 경쟁


오픈AI는 GPT-4o가 'GPT-4 터보’보다 두 배 더 빠르며, 비용은 절반 수준이라고 밝혔습니다. 이 모델은 기존에 LMM을 구동하기 위해 텍스트와 이미지, 음성 부분을 따로 처리하는 것을 넘어, 모델 세 개를 하나로 통합하였다고 설명하였습니다.

GPT-4o의 출시는 빠르게 변화하는 AI 환경에서 지각변동을 계속 일으킬 것으로 예상됩니다. 특히 GPT-4o는 14일 구글의 연례 개발자 회의(I/O) 하루 전에 출시되었습니다. 마이크로소프트는 오픈AI에 대규모 투자를 통해, 검색 시장을 장악하고 있는 구글에 도전하고 있습니다.

반응형

GPT-4o 첫공개 소식
GPT-4o 첫공개 소식 (출처 - KBS 뉴스 스크린샷)



해당 모델은 음성, 텍스트, 이미지 등 다양한 형태의 데이터를 처리하며, 빠른 반응 속도와 향상된 성능을 제공합니다. 이러한 발전으로 최근 스마트폰의 음성 비서들에 적용이 되는 걸 기대하고 있는데 빠르게 적용되어 일상에서 많은 도움이 되면 좋겠네요. 아직은 스마트폰의 음성 비서들이 상태가 좋지는 않아서 ㅋㅋㅋ 더욱 기대중입니다.

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."