이슈

오픈 AI의 GPT-4o 무료 출시 음성비서 기능 대폭 강화

hyeon :) 2024. 5. 14. 15:58
반응형

GPT-4o 오픈AI의 음성비서 기능 강화


오픈AI는 최근에 GPT-4o라는 새로운 멀티모달 모델을 선보였습니다. 이 모델은 음성 비서 기능을 강화하였으며, 'o’는 '옴니(omni)'를 의미하며, 모든 것을 포괄한다는 의미를 가지고 있습니다.

최근 보고서를 작성할때도 Chat GPT를 잘 사용하고 있었는데 음성 비서 기능 강화 모델이 나왔다니 더 기대되네요. 가능하다면 스마트폰과 연계되면 좋을텐데 가능했으면 싶네요.

GPT-4o 첫공개 소식
GPT-4o의 첫공개 소식 (출처 - KBS 뉴스 스크린샷)

반응형

 

 

 

 

 

 

GPT-4o의 독특한 특징들


GPT-4o는 기존 모델에 비해 더욱 빠르고 경제적이라는 점이 강조되었습니다. 이 모델은 사용자가 질문을 하면, 최소 232밀리초, 평균 320밀리초 안에 오디오로 응답할 수 있습니다. 이는 사람의 반응 속도와 유사하며, 이는 기존 'GPT-4’의 5.4초에 비해 크게 단축된 시간입니다.

또한, 이 모델은 50개 이상의 다양한 언어를 지원하며, 거의 즉시 다른 언어로 번역이 가능합니다. 한국어를 포함한 20개 언어에 대한 토크나이저 압축을 개선했다고 발표하였습니다.

GPT-4o 첫공개 소식 (출처 - KBS 뉴스 스크린샷)

 

반응형

 

 

 

 

 

GPT-4o의 성능과 비용, 출시와 구글과의 경쟁


오픈AI는 GPT-4o가 'GPT-4 터보’보다 두 배 더 빠르며, 비용은 절반 수준이라고 밝혔습니다. 이 모델은 기존에 LMM을 구동하기 위해 텍스트와 이미지, 음성 부분을 따로 처리하는 것을 넘어, 모델 세 개를 하나로 통합하였다고 설명하였습니다.

GPT-4o의 출시는 빠르게 변화하는 AI 환경에서 지각변동을 계속 일으킬 것으로 예상됩니다. 특히 GPT-4o는 14일 구글의 연례 개발자 회의(I/O) 하루 전에 출시되었습니다. 마이크로소프트는 오픈AI에 대규모 투자를 통해, 검색 시장을 장악하고 있는 구글에 도전하고 있습니다.

반응형

GPT-4o 첫공개 소식
GPT-4o 첫공개 소식 (출처 - KBS 뉴스 스크린샷)



해당 모델은 음성, 텍스트, 이미지 등 다양한 형태의 데이터를 처리하며, 빠른 반응 속도와 향상된 성능을 제공합니다. 이러한 발전으로 최근 스마트폰의 음성 비서들에 적용이 되는 걸 기대하고 있는데 빠르게 적용되어 일상에서 많은 도움이 되면 좋겠네요. 아직은 스마트폰의 음성 비서들이 상태가 좋지는 않아서 ㅋㅋㅋ 더욱 기대중입니다.

반응형
"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."