Dalam pengumuman yang menggemparkan dunia teknologi, OpenAI baru saja memperkenalkan model AI terbarunya yang dinamakan O3, bersama dengan versi ringannya O3 Mini. Pencapaian ini tidak hanya menandai kemajuan teknologi yang luar biasa, tetapi juga dianggap sebagai tonggak sejarah tercapainya Artificial General Intelligence (AGI) - kecerdasan buatan yang setara atau bahkan melampaui kemampuan manusia.
Mengapa O3 begitu istimewa? Mari kita telusuri secara mendalam kemampuan-kemampuan menakjubkan yang dimilikinya.
Dalam bidang pemrograman komputer, O3 menunjukkan kemampuan yang mencengangkan. Pada benchmark Sweet bench, sebuah standar pengujian yang menggunakan tugas-tugas pemrograman dunia nyata, O3 mencapai skor 71.7%. Angka ini jauh melampaui model-model sebelumnya. Yang lebih mengejutkan lagi, dalam tes coding kompetitif, O3 bahkan mengalahkan Mark, kepala peneliti OpenAI sendiri yang merupakan programmer handal.
Bayangkan sebuah sistem yang bisa menulis kode program lebih baik dari para ahli! Ini seperti memiliki programmer jenius yang bisa bekerja 24 jam sehari tanpa lelah. Sebagai contoh, dalam demonstrasi langsung, O3 berhasil membuat sistem yang bisa mengevaluasi kemampuannya sendiri - sebuah tugas yang sangat kompleks yang membutuhkan pemahaman mendalam tentang pemrograman.
Di bidang matematika, pencapaian O3 tidak kalah mengesankan. Model ini mendapat skor hampir sempurna (96.7%) dalam tes matematika kompetitif tingkat tinggi. Untuk memberikan gambaran, ini adalah soal-soal yang biasanya digunakan dalam olimpiade matematika - jenis soal yang bahkan membuat siswa-siswa jenius harus berpikir keras.
Dalam ujian sains tingkat PhD, O3 mencapai skor 87.7%, meningkat 10% dari model sebelumnya. Ini berarti O3 memiliki pemahaman setara atau bahkan melebihi seorang kandidat doktor dalam berbagai bidang ilmu pengetahuan. Para ahli PhD biasanya hanya mencapai skor sekitar 70% dalam bidang keahlian mereka.
Namun, pencapaian paling mengesankan O3 terlihat dalam Arc Prize - sebuah benchmark yang selama ini dianggap sebagai "holy grail" dalam pengujian kecerdasan AI. Selama 5 tahun terakhir, tidak ada sistem AI yang berhasil menaklukkan tes ini secara signifikan. Arc Prize dirancang untuk menguji kemampuan AI dalam memahami pola dan menerapkan pemahaman tersebut pada situasi baru - persis seperti cara manusia berpikir.
O3 berhasil mencapai skor 87.5% dalam Arc Prize, melampaui rata-rata kemampuan manusia yang berada di angka 85%. Sebagai contoh, dalam tes Arc Prize, AI harus bisa memahami pola-pola visual yang belum pernah dilihat sebelumnya dan memprediksi kelanjutannya - seperti mengisi kotak kosong dengan warna yang tepat atau memahami aturan transformasi bentuk geometris.
OpenAI juga memperkenalkan O3 Mini, versi yang lebih efisien dari O3. Meskipun ukurannya lebih kecil dan menggunakan sumber daya komputasi yang lebih sedikit, O3 Mini tetap menunjukkan performa yang mengagumkan. Model ini dirancang dengan tiga tingkat "pemikiran" - rendah, menengah, dan tinggi - yang bisa disesuaikan dengan kebutuhan pengguna, mirip seperti manusia yang bisa mengatur seberapa dalam mereka ingin berpikir tentang suatu masalah.
Saat ini, kedua model belum tersedia untuk umum. OpenAI membuka kesempatan bagi para peneliti keamanan untuk menguji model ini sampai 10 Januari. Langkah ini menunjukkan kehati-hatian OpenAI dalam memastikan keamanan dan keandalan teknologi mereka sebelum dirilis ke publik.
Pencapaian O3 ini dianggap sebagai bukti tercapainya AGI karena beberapa alasan. Pertama, kemampuannya yang melampaui manusia dalam berbagai bidang kritis seperti pemrograman, matematika, dan penalaran umum. Kedua, kemampuannya untuk belajar dan menerapkan pengetahuan pada situasi baru, mirip seperti kecerdasan manusia. Dan yang terpenting, kemampuannya untuk memecahkan Arc Prize - sebuah tes yang dirancang khusus untuk mengukur kecerdasan umum.
Perkembangan ini membuka berbagai kemungkinan baru dalam dunia teknologi dan kehidupan manusia. Bayangkan memiliki asisten yang bisa membantu memecahkan masalah kompleks dalam berbagai bidang, dari pengembangan software hingga penelitian ilmiah. Namun, seperti halnya setiap kemajuan teknologi besar, ini juga membawa tantangan dan pertanyaan baru tentang bagaimana kita akan berinteraksi dan hidup berdampingan dengan kecerdasan buatan yang semakin menyerupai manusia.
Sumber: https://youtu.be/CRuhyF3oj0c?si=jjIEimyyHBcqgQRI