Dapatkan analisis, berita, dan tutorial AI & Django terkini di sini. Jasa pembuatan web Hubungi kami untuk info lebih lanjut

Model Terbaru OpenAI yang Kontroversial - KISAH GPT 4.5 YANG MENGECEWAKAN SEKALIGUS MENAKJUBKAN

Model Terbaru OpenAI yang Kontroversial - KISAH GPT 4.5 YANG MENGECEWAKAN SEKALIGUS MENAKJUBKAN

Pada awal 2025, dunia teknologi kembali diguncang dengan peluncuran GPT-4.5, model bahasa terbaru dari OpenAI. Model yang dinanti-nantikan ini memunculkan reaksi yang sangat beragam dari komunitas teknologi - sebagian terpesona dengan kemampuan kreatifnya, sementara sebagian lain kecewa berat melihat kinerja teknisnya yang jauh dari harapan. Lebih mengejutkan lagi, harganya yang sangat mahal membuat banyak pengembang terkejut. Apa sebenarnya yang terjadi dengan GPT-4.5 ini?

Berdasarkan dua ulasan sumber yang mendalam dari para ahli teknologi, kita akan mengupas tuntas apa sebenarnya GPT-4.5, bagaimana cara pembuatannya, mengapa harganya bisa begitu mahal, dan apakah model ini benar-benar layak mendapat perhatian kita. Mari kita mulai perjalanan untuk memahami salah satu model AI paling kontroversial dalam beberapa tahun terakhir.

Apa itu GPT-4.5?

GPT-4.5 adalah model bahasa besar (LLM) terbaru dari OpenAI yang dirilis pada awal 2025. Berbeda dengan pendahulunya, GPT-4.5 diposisikan oleh OpenAI sebagai "model terbesar dan paling berpengetahuan" yang pernah mereka buat. Ini adalah poin penting - OpenAI tidak menyebutnya sebagai model "terpintar" atau "terbaik", melainkan "paling berpengetahuan", yang menunjukkan fokus utama pengembangan model ini.

Sam Altman, CEO OpenAI, menggambarkan GPT-4.5 sebagai "model pertama yang terasa seperti berbicara dengan orang yang bijaksana", menekankan bahwa model ini memiliki kemampuan yang lebih natural dalam berkomunikasi dan memberikan saran. Namun, ini juga yang menjadi titik kontroversi - apakah "terasa lebih natural" cukup untuk membenarkan kenaikan harga yang sangat drastis?

Satu hal yang pasti, GPT-4.5 adalah model "non-reasoning" terakhir dari OpenAI, yang berarti ke depannya mereka akan fokus pada model "reasoning" yang memiliki kemampuan untuk berpikir secara mandiri sebelum memberikan jawaban.

Cara Pembuatan GPT-4.5: Raksasa Berpengetahuan Luas

Meskipun OpenAI tidak memberikan detail teknis lengkap tentang cara pembuatan GPT-4.5, dari dokumen teknis dan penjelasan mereka, kita bisa mendapatkan gambaran umum tentang proses pembuatannya:

  1. Pre-training yang Masif: GPT-4.5 difokuskan pada tahap pre-training yang sangat besar, artinya model ini dilatih dengan dataset yang jauh lebih besar dari model-model sebelumnya. Pre-training adalah tahap di mana model "membaca" dan mempelajari pola dari triliunan kata dan dokumen di internet.

  2. Arsitektur Model yang Sangat Besar: Ukuran model GPT-4.5 jauh lebih besar dari pendahulunya. Meskipun OpenAI tidak mengungkapkan jumlah parameter pastinya, dari penjelasan mereka dan kinerja model ini, dapat disimpulkan bahwa GPT-4.5 memiliki parameter yang jauh lebih banyak dari GPT-4. Parameter ini adalah nilai-nilai yang digunakan model untuk membuat prediksi.

  3. Fokus pada Pengetahuan Umum dan Kemampuan Menulis: Berbeda dengan model seperti Claude 3.7 atau DeepSeek V3 yang mengoptimalkan kemampuan reasoning dan coding, GPT-4.5 tampaknya dioptimalkan untuk memiliki pengetahuan umum yang sangat luas dan kemampuan penulisan kreatif yang superior.

  4. Post-training untuk Keamanan dan Coding: Setelah pre-training, OpenAI melakukan "post-training" untuk meningkatkan kemampuan coding dan keamanan model, meskipun hasilnya tidak sebaik yang diharapkan.

  5. Kebutuhan Komputasi yang Sangat Besar: Dari informasi yang tersedia, pembuatan GPT-4.5 membutuhkan daya komputasi yang jauh lebih besar dari model-model sebelumnya, yang menjadi salah satu alasan di balik harganya yang sangat mahal.

Perlu dicatat bahwa menurut salah satu video, tim OpenAI sendiri mengakui kesulitan dalam membuat model sebesar GPT-4.5 berfungsi dengan baik, yang mengindikasikan bahwa mereka mungkin telah mencapai semacam "dinding" dalam pendekatan scaling (peningkatan ukuran) model yang selama ini mereka andalkan.

Kekuatan Utama GPT-4.5: Sang Penulis Kreatif

Meskipun banyak dikritik, GPT-4.5 memiliki beberapa kekuatan yang tidak bisa diabaikan:

  1. Penulisan Kreatif yang Superior: GPT-4.5 sangat menonjol dalam menulis konten kreatif. Dalam salah satu video, pembuat konten bahkan mengakui bahwa intro videonya ditulis oleh GPT-4.5 dan kualitasnya sangat baik. Model ini mampu menulis dengan gaya yang lebih natural dan manusiawi dibandingkan model-model lain.

  2. Vibe Check yang Lebih Baik: GPT-4.5, menurut penggunanya, memberikan "vibe check" yang lebih baik - artinya interaksi dengan model ini terasa lebih alami dan menyenangkan. Ini adalah aspek yang sulit diukur dengan benchmark tradisional tetapi sangat penting untuk pengalaman pengguna.

  3. Pengetahuan Umum yang Luas: Sebagai hasil dari pre-training yang sangat besar, GPT-4.5 memiliki pengetahuan umum yang sangat luas, yang membuatnya unggul dalam menjawab pertanyaan-pertanyaan umum dan menulis tentang berbagai topik.

  4. Kemampuan Multibahasa yang Baik: GPT-4.5 juga unggul dalam benchmark multibahasa, menunjukkan kemampuannya untuk bekerja dengan berbagai bahasa dunia.

  5. Manipulasi yang Efektif: Menariknya, dalam tes "Make Me Pay" di mana model harus meyakinkan model lain untuk melakukan pembayaran, GPT-4.5 berhasil meyakinkan 57% model lain, menunjukkan kemampuan persuasi yang tinggi.

Kelemahan Fatal GPT-4.5: Ketika Harga Tidak Sepadan

Meskipun memiliki beberapa kelebihan, GPT-4.5 juga memiliki berbagai kelemahan signifikan yang mengecewakan banyak pengembang:

  1. Kemampuan Coding yang Lemah: GPT-4.5 secara mengejutkan lemah dalam kemampuan coding, bahkan kalah dari model yang jauh lebih murah seperti Claude 3 Mini dan DeepSeek V3. Dalam benchmark SWE-Lancer, model ini hanya sedikit lebih baik dari GPT-4 dan jauh di bawah Claude 3.7.

  2. Kemampuan Matematika yang Mengecewakan: Dalam benchmark matematika seperti AM24, GPT-4.5 bahkan kalah dari Grok 3 Mini dan DeepSeek V3, yang sangat mengejutkan mengingat OpenAI dulunya selalu unggul dalam kemampuan matematika.

  3. Harga yang Sangat Mahal: Ini mungkin kelemahan paling signifikan - GPT-4.5 dibanderol dengan harga $150 per juta token output, yang merupakan 25 kali lipat harga Claude dan 750 kali lipat harga Gemini 2.0. Bahkan untuk input token saja, harganya $75 per juta token, yang 500 kali lebih mahal dari DeepSeek V3.

  4. Kebutuhan GPU yang Sangat Besar: OpenAI bahkan tidak bisa memberikan akses kepada pengguna Plus ($20/bulan) karena keterbatasan GPU, hanya pengguna Pro yang bisa mengakses GPT-4.5.

  5. Halusinasi yang Masih Ada: Meskipun OpenAI mengklaim GPT-4.5 "berhalusinasi lebih sedikit", dalam benchmark keamanan dan cyberseurity, model ini masih menunjukkan kelemahan yang signifikan.

Pertarungan Benchmark: GPT-4.5 vs Kompetitor

Mari kita lihat secara detail bagaimana GPT-4.5 dibandingkan dengan kompetitornya dalam berbagai benchmark:

  1. Benchmark Matematika (AM24):

    • DeepSeek V3: Lebih unggul dari GPT-4.5
    • Grok 3 Mini: Lebih unggul dari GPT-4.5
    • GPT-4.5: Hanya lebih baik dari GPT-4
  2. Benchmark Coding (SWE-Lancer dan Aider):

    • Claude 3.7: Jauh lebih unggul dari GPT-4.5
    • DeepSeek V3: Lebih unggul dari GPT-4.5 (48% vs 45% di Aider)
    • Claude 3 Mini: Lebih unggul dari GPT-4.5
    • GPT-4.5: Hanya sedikit lebih baik dari GPT-4
  3. Benchmark Sains:

    • GPT-4.5: Unggul dari DeepSeek V3 dan Grok 3 Mini
  4. Benchmark Multibahasa:

    • GPT-4.5: Unggul dari DeepSeek V3
  5. Benchmark Pull Request Internal OpenAI:

    • DeepSeek Research: Sangat unggul
    • GPT-4.5: Lebih baik dari GPT-4 tetapi masih jauh di bawah DeepSeek Research
  6. Benchmark Keamanan Cyber (CTF):

    • Level SMA: GPT-4.5 cukup baik
    • Level Kuliah: GPT-4.5 mulai kesulitan
    • Level Profesional: GPT-4.5 bahkan lebih buruk dari GPT-4

Yang mengejutkan dari benchmark-benchmark ini adalah bahwa model open source seperti DeepSeek V3 yang dirilis 2 bulan sebelum GPT-4.5 bisa mengungguli model OpenAI yang jauh lebih mahal dalam banyak tes penting. Ini menunjukkan bahwa strategi scaling OpenAI mungkin mulai mencapai batas efektivitasnya.

Misteri Harga Tinggi: Apakah Ini Pemerasan?

Salah satu hal yang paling mengejutkan dari GPT-4.5 adalah harganya yang sangat tinggi. Dengan $75 per juta token input dan $150 per juta token output, GPT-4.5 adalah model termahal yang pernah dirilis OpenAI. Beberapa perbandingan harga:

  • GPT-4.5: $150 per juta token output
  • Claude 3.7: $6 per juta token output (25x lebih murah)
  • Gemini 2.0: $0.20 per juta token output (750x lebih murah)
  • DeepSeek V3: $0.30 per juta token output (500x lebih murah)

Untuk memberikan konteks, penulisan sebuah novel lengkap dengan GPT-4.5 akan menghabiskan biaya sekitar $18, sedangkan dengan Gemini 2.0 hanya akan menghabiskan biaya beberapa sen saja.

Pertanyaannya: Apakah OpenAI sengaja mematok harga tinggi untuk mendapatkan untung besar?

Menurut pembuat video pertama, kemungkinan besar jawabannya adalah tidak. Dia percaya bahwa harga tinggi ini mencerminkan biaya sebenarnya untuk menjalankan model yang sangat besar ini. Argument dia adalah:

  1. Jika OpenAI ingin memaksimalkan keuntungan, mereka tidak akan membuat Claude 3 Mini dengan harga yang sangat murah.

  2. Pertumbuhan ukuran model dan data membutuhkan peningkatan komputasi secara logaritmik - artinya, untuk peningkatan kualitas 10%, dibutuhkan penggandaan komputasi dan data.

  3. GPT-4.5 adalah model terbesar yang pernah dibuat OpenAI, dan menjalankannya membutuhkan banyak GPU khusus yang sangat mahal.

Meskipun demikian, harga yang sangat tinggi ini tentu saja membuat banyak pengembang berpikir dua kali sebelum menggunakan GPT-4.5, apalagi dengan performa yang tidak lebih baik dari model yang jauh lebih murah dalam banyak tugas penting.

Apakah OpenAI Kehabisan Inovasi?

Salah satu kesimpulan menarik dari kedua video adalah spekulasi bahwa OpenAI mungkin mulai kehabisan inovasi. Beberapa indikasi:

  1. OpenAI sekarang sangat bergantung pada strategi "scaling" - membuat model yang lebih besar dengan data yang lebih banyak, tanpa inovasi arsitektur yang signifikan.

  2. DeepSeek terus meluncurkan makalah penelitian yang mengoptimalkan cara melatih dan menjalankan model, sementara OpenAI belum mempublikasikan terobosan penelitian signifikan baru-baru ini.

  3. Tim OpenAI sendiri mengakui kesulitan dalam membuat model sebesar GPT-4.5 berfungsi dengan baik.

  4. Beralih ke model "reasoning" mungkin adalah pengakuan bahwa strategi "scaling" saja tidak akan cukup untuk kemajuan berikutnya.

Mungkin inilah alasan mengapa Sam Altman menyebut GPT-4.5 sebagai model "non-reasoning" terakhir dari OpenAI - mereka perlu mengubah pendekatan fundamental mereka untuk tetap kompetitif di pasar yang semakin crowded dan inovatif.

Model Reasoning vs Non-Reasoning: Beda Pendekatan, Beda Hasil

Untuk memahami konteks GPT-4.5 dan masa depan AI, kita perlu memahami perbedaan antara model "reasoning" dan "non-reasoning":

Model Non-Reasoning (seperti GPT-4.5):

  • Langsung menghasilkan output berdasarkan pola yang dikenali dari data training
  • Sangat baik dalam tugas generatif seperti menulis kreatif
  • Cenderung lebih taat pada instruksi pengguna
  • Tidak melakukan "pemikiran" eksplisit sebelum memberikan jawaban
  • Contoh: GPT-4.5, GPT-4, kebanyakan model lama

Model Reasoning (seperti Claude 3.7):

  • Melakukan "pemikiran" eksplisit sebelum menghasilkan output
  • Lebih baik dalam tugas yang membutuhkan logika seperti matematika dan coding
  • Dapat "menipu diri sendiri" atau terlalu banyak berpikir dalam beberapa situasi
  • Membutuhkan prompting yang berbeda untuk hasil optimal
  • Contoh: Claude 3.7, DeepSeek Research, model masa depan OpenAI

Menariknya, pembuat video pertama menyebutkan bahwa beberapa pengembang bahkan beralih dari Claude 3.7 kembali ke Claude 3.5 untuk tugas coding karena Claude 3.7, meskipun menulis kode lebih baik, lebih cenderung "pergi ke tempat yang tidak seharusnya" dan membuat perubahan yang tidak diminta.

Untuk Siapa GPT-4.5 Dibuat?

Meskipun GPT-4.5 tampaknya mengecewakan bagi pengembang, model ini sebenarnya mungkin tidak ditargetkan untuk mereka. Berdasarkan kekuatan dan kelemahannya, GPT-4.5 tampaknya dibuat untuk:

  1. Penulis dan Kreator Konten: Kemampuan penulisan kreatif yang superior membuat GPT-4.5 sangat berguna untuk menulis artikel, cerita, atau konten pemasaran.

  2. Asisten Pribadi Premium: "Vibe check" yang lebih baik dan kemampuan komunikasi yang lebih natural membuat GPT-4.5 cocok sebagai asisten pribadi high-end.

  3. Pengguna yang Membutuhkan Pengetahuan Umum Luas: Untuk tugas-tugas yang membutuhkan pengetahuan umum yang luas dan beragam, GPT-4.5 bisa menjadi pilihan yang baik.

  4. Platform Pengembangan Model Masa Depan: Seperti yang disarankan oleh pembuat video pertama, GPT-4.5 mungkin lebih berperan sebagai batu loncatan untuk model masa depan OpenAI seperti GPT-5 daripada produk akhir yang dioptimalkan.

Yang jelas, jika Anda adalah pengembang software yang membutuhkan bantuan coding, GPT-4.5 bukanlah pilihan yang cost-effective - model seperti Claude 3.7 atau bahkan Claude 3 Mini akan memberikan hasil yang lebih baik dengan harga yang jauh lebih murah.

Masa Depan AI: Pelajaran dari GPT-4.5

Peluncuran GPT-4.5 memberikan beberapa pelajaran penting tentang arah perkembangan AI di masa depan:

  1. Strategi Scaling Memiliki Batas: Pendekatan OpenAI untuk membuat model yang lebih besar dengan lebih banyak data tampaknya mulai mencapai titik diminishing returns.

  2. Open Source Semakin Kompetitif: Model open source seperti DeepSeek V3 semakin mampu bersaing dengan model proprietary mahal, yang mengubah dinamika pasar.

  3. Spesialisasi vs Generalisasi: Alih-alih mencoba membuat model "terbaik dalam segala hal", kita mungkin akan melihat lebih banyak model yang dioptimalkan untuk kasus penggunaan spesifik.

  4. Reasoning adalah Masa Depan: Fokus OpenAI pada model "reasoning" untuk perkembangan selanjutnya menunjukkan pentingnya kemampuan ini untuk kemajuan AI.

  5. Biaya Akan Terus Menurun: Seperti yang dikatakan pembuat video pertama, biaya operasi model AI cenderung menurun sekitar 10x setiap tahun, sehingga model seperti GPT-4.5 akan menjadi jauh lebih terjangkau dalam beberapa tahun.

Menariknya, peluncuran GPT-4.5 bertepatan dengan "Open Source Week" dari DeepSeek, di mana mereka merilis lima repositori tentang efisiensi GPU dan optimasi, serta memberikan diskon 50% untuk semua API mereka. Ini menunjukkan bagaimana lanskap AI terus berubah dengan cepat, dengan pemain open source yang semakin agresif menantang dominasi pemain besar seperti OpenAI.

Kesimpulan: Perang AI Baru Dimulai

GPT-4.5 adalah model yang kontroversial - mengecewakan dalam beberapa hal, mengagumkan dalam hal lain. Ia mewakili titik penting dalam evolusi AI di mana strategi lama mulai mencapai batasnya dan pendekatan baru diperlukan.

Bagi pengguna umum, GPT-4.5 mungkin memberikan pengalaman yang lebih menyenangkan dan natural, tetapi dengan harga premium yang sangat tinggi. Bagi pengembang, model ini mungkin tidak sepadan dengan biayanya mengingat ada alternatif yang jauh lebih murah dengan kemampuan yang sebanding atau bahkan lebih baik untuk tugas-tugas tertentu.

Yang pasti, peluncuran GPT-4.5 menandai awal era baru persaingan AI - di mana open source dan proprietary bersaing ketat, di mana inovasi arsitektur menjadi sama pentingnya dengan ukuran model, dan di mana spesialisasi mungkin menjadi kunci keberhasilan.

Apakah OpenAI bisa bangkit kembali dengan model reasoning yang benar-benar revolusioner, atau apakah pemain seperti Anthropic (Claude) dan DeepSeek akan mengambil alih kepemimpinan? Hanya waktu yang akan menjawab, tetapi satu hal yang pasti: perang AI baru saja dimulai, dan kita semua akan mendapatkan manfaat dari persaingan ini.