TEKNO

Tampil Beda: OpenAI Rilis GPT-4o, AI Multimodal Siap Bersaing dengan AI Gemini Google

212
×

Tampil Beda: OpenAI Rilis GPT-4o, AI Multimodal Siap Bersaing dengan AI Gemini Google

Sebarkan artikel ini
OpenAI memperkenalkan GPT-4o, multimoda yang digadang-gadang bakal menghadapi AI Gemini Google
OpenAI memperkenalkan GPT-4o, multimoda yang digadang-gadang bakal menghadapi AI Gemini Google

Media90 – OpenAI baru saja mengumumkan model terbaru mereka, GPT-4o, yang dirancang khusus untuk mendukung ChatGPT.

Berbeda dengan pendahulunya, GPT-4, model ini menawarkan kemajuan signifikan dalam kemampuan multimodal, memungkinkannya untuk berinteraksi dengan teks, visual, audio, atau kombinasi dari ketiganya.

GPT-4o diibaratkan sebagai alat AI dengan mata dan telinga, mampu memahami dunia di sekitarnya dengan lebih baik. Bayangkan menggunakan Google Lens yang dilengkapi dengan chatbot AI generatif langsung di ponsel Anda.

OpenAI memperkirakan bahwa GPT-4o mampu menjawab pertanyaan audio dalam waktu hanya sekitar 0,2 detik. Ini berarti alat ini dapat memfasilitasi percakapan dwibahasa dua arah dengan cepat dan tanpa hambatan.

Keunggulan utama dari GPT-4o adalah penurunan signifikan dalam biaya API untuk pengembang, serta pengurangan dramatis dalam ukuran token untuk setiap permintaan. Hal ini berarti prosesnya akan lebih cepat dan lebih efisien.

Baca Juga:  Apple Mengungkap Fitur Baru iOS 18: Pelacakan Mata dan Aksesibilitas Lebih Lanjut!

GPT-4o tampaknya menjadi alternatif yang nyaman bagi alat seperti Google Gemini yang juga multimodal. Namun, ChatGPT dengan GPT-4o memiliki keunggulan kritis.

Berbeda dengan Nano Gemini yang memerlukan perangkat keras khusus, ChatGPT dapat diakses dari ponsel modern mana pun karena alirannya sepenuhnya berbasis cloud.

Visi ChatGPT dalam pengaplikasian GPT-4o sangat menjanjikan. Dalam video demo yang dirilis oleh OpenAI, GPT-4o mampu mengidentifikasi objek dunia nyata, mengajarkan matematika, mengenali orang dan lingkungannya dalam bingkai kamera, bahkan membuat lelucon ayah yang lucu.

Meskipun demikian, semua kemampuan multimodal yang mewah ini akan membutuhkan waktu untuk sepenuhnya tersedia di ponsel setiap pengguna.

Pada awalnya, GPT-4o hanya akan hadir dengan kemampuan teks dan gambar yang ditingkatkan. Namun, OpenAI berencana untuk terus menguji dan meningkatkan kemampuan audio dan penglihatan model ini.

Baca Juga:  Revolusi Teknologi: 4 Inovasi yang Berpotensi Menggeser Dominasi Ponsel Cerdas pada Era Mendatang

Menariknya, GPT-4o akan tersedia untuk semua pengguna tanpa biaya alias gratis. Pengguna dengan langganan ChatGPT Plus akan mendapatkan akses prioritas ke kemampuan audio dan penglihatan dalam beberapa minggu mendatang, serta batas 5x lebih tinggi untuk percakapan yang didukung oleh model ini.

Dengan pengumuman GPT-4o, OpenAI membuka pintu menuju era baru dalam interaksi AI manusia, membawa ChatGPT ke tingkat yang lebih tinggi dalam pemahaman dunia multimodal.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *