Microsoft Meluncurkan Model AI Baru, Menantang OpenAI dan Google

9

Microsoft telah meluncurkan tiga model AI baru – sistem transkripsi ucapan (MAI-Transcribe-1), mesin penghasil suara (MAI-Voice-1), dan pembuat gambar yang ditingkatkan (MAI-Image-2) – yang menandakan tantangan langsung bagi para pemimpin industri seperti OpenAI dan Google. Model-model ini, yang sepenuhnya dibuat sendiri, menunjukkan komitmen Microsoft untuk mengembangkan kemampuan AI-nya sendiri dibandingkan hanya mengandalkan kemitraan distribusi.

Pergeseran Menuju Kemandirian AI

Langkah ini dilakukan setelah Microsoft menegosiasikan ulang kontraknya dengan OpenAI, menghapus pembatasan yang sebelumnya menghalangi pengembangan AI independen. Hal ini memungkinkan raksasa teknologi tersebut untuk mewujudkan “swasembada AI,” seperti yang dijelaskan oleh kepala AI Microsoft, Mustafa Suleyman. Model-model baru ini mencakup bidang-bidang komersial utama: mengubah ucapan menjadi teks, menghasilkan suara yang realistis, dan membuat gambar. Rilisan ini merupakan langkah pertama dalam upaya Microsoft untuk bersaing secara langsung dalam pengembangan model.

Kinerja dan Efisiensi Biaya

MAI-Transcribe-1, model ucapan-ke-teks, memimpin dalam akurasi dalam 25 bahasa, mengungguli Whisper-large-v3 OpenAI dan Gemini 3.1 Flash Google pada berbagai tolok ukur. Ini mencapai Tingkat Kesalahan Kata 3,8%, sekaligus menggunakan setengah GPU dibandingkan pesaing. MAI-Voice-1 menghasilkan audio yang terdengar alami selama 60 detik dalam satu detik dan menawarkan pembuatan suara khusus. MAI-Image-2 memberikan waktu pembuatan yang lebih cepat pada Foundry dan Copilot.

Implikasi Strategis

Model-model ini menjawab kekhawatiran investor mengenai belanja infrastruktur AI Microsoft yang besar. Mereka diberi harga secara agresif untuk menurunkan harga pokok penjualan Microsoft dan menawarkan harga yang kompetitif bagi pengembang. Langkah ini menempatkan Microsoft untuk melemahkan pesaing seperti Amazon dan Google sekaligus memperkuat posisinya sebagai platform pengembangan AI.

Tim Kecil, Hasil Besar

Model-model tersebut dibuat oleh tim yang beranggotakan kurang dari 10 insinyur, menantang narasi industri bahwa AI terdepan memerlukan tim riset yang besar. Pendekatan ramping ini menurunkan biaya pengembangan dan meningkatkan efisiensi. Microsoft menekankan inovasi model dan data dibandingkan jumlah karyawan.

Masa Depan: LLM Perbatasan

Suleyman mengonfirmasi bahwa Microsoft akan membangun model bahasa besar (LLM) untuk bersaing langsung dengan GPT OpenAI. Perusahaan ini berinvestasi pada klaster GPU dan berencana mencapai “swasembada AI” dalam 2-4 tahun ke depan. Terlepas dari tantangan yang ada, model-model baru Microsoft menunjukkan pernyataan yang jelas: perusahaan siap bersaing sebagai laboratorium AI papan atas.

Dorongan agresif Microsoft dalam pengembangan AI menggarisbawahi peralihan industri menuju kemampuan independen. Dengan menghadirkan model-model canggih dengan harga yang kompetitif, Microsoft bertujuan untuk mengamankan masa depan mereka dalam lanskap AI yang berkembang pesat.