Media90 – OpenAI baru saja mengumumkan model terbaru mereka, GPT-4o, yang dirancang khusus untuk mendukung ChatGPT.
Berbeda dengan pendahulunya, GPT-4, model ini menawarkan kemajuan signifikan dalam kemampuan multimodal, memungkinkannya untuk berinteraksi dengan teks, visual, audio, atau kombinasi dari ketiganya.
GPT-4o diibaratkan sebagai alat AI dengan mata dan telinga, mampu memahami dunia di sekitarnya dengan lebih baik. Bayangkan menggunakan Google Lens yang dilengkapi dengan chatbot AI generatif langsung di ponsel Anda.
OpenAI memperkirakan bahwa GPT-4o mampu menjawab pertanyaan audio dalam waktu hanya sekitar 0,2 detik. Ini berarti alat ini dapat memfasilitasi percakapan dwibahasa dua arah dengan cepat dan tanpa hambatan.
Keunggulan utama dari GPT-4o adalah penurunan signifikan dalam biaya API untuk pengembang, serta pengurangan dramatis dalam ukuran token untuk setiap permintaan. Hal ini berarti prosesnya akan lebih cepat dan lebih efisien.
GPT-4o tampaknya menjadi alternatif yang nyaman bagi alat seperti Google Gemini yang juga multimodal. Namun, ChatGPT dengan GPT-4o memiliki keunggulan kritis.
Berbeda dengan Nano Gemini yang memerlukan perangkat keras khusus, ChatGPT dapat diakses dari ponsel modern mana pun karena alirannya sepenuhnya berbasis cloud.
Visi ChatGPT dalam pengaplikasian GPT-4o sangat menjanjikan. Dalam video demo yang dirilis oleh OpenAI, GPT-4o mampu mengidentifikasi objek dunia nyata, mengajarkan matematika, mengenali orang dan lingkungannya dalam bingkai kamera, bahkan membuat lelucon ayah yang lucu.
Meskipun demikian, semua kemampuan multimodal yang mewah ini akan membutuhkan waktu untuk sepenuhnya tersedia di ponsel setiap pengguna.
Pada awalnya, GPT-4o hanya akan hadir dengan kemampuan teks dan gambar yang ditingkatkan. Namun, OpenAI berencana untuk terus menguji dan meningkatkan kemampuan audio dan penglihatan model ini.
Menariknya, GPT-4o akan tersedia untuk semua pengguna tanpa biaya alias gratis. Pengguna dengan langganan ChatGPT Plus akan mendapatkan akses prioritas ke kemampuan audio dan penglihatan dalam beberapa minggu mendatang, serta batas 5x lebih tinggi untuk percakapan yang didukung oleh model ini.
Dengan pengumuman GPT-4o, OpenAI membuka pintu menuju era baru dalam interaksi AI manusia, membawa ChatGPT ke tingkat yang lebih tinggi dalam pemahaman dunia multimodal.