Microsoft kembali bikin gebrakan di dunia kecerdasan buatan. Lewat divisi risetnya, Microsoft AI, raksasa teknologi ini resmi merilis tiga model AI terbaru yang mampu menghasilkan teks, suara, hingga gambar dalam satu ekosistem.
Baca Juga : Hati-hati Login Palsu! Hacker Pakai Domain .onmicrosoft.com untuk Menjebak Korban
Langkah ini menunjukkan keseriusan Microsoft dalam membangun multimodal AI stack miliknya sendiri. Meski masih memiliki hubungan erat dengan OpenAI, Microsoft tampaknya ingin memperkuat posisinya untuk bersaing langsung dengan lab AI lain di industri yang semakin padat.
Tiga Model AI Andalan Microsoft
Ada tiga model utama yang diperkenalkan, masing-masing dengan fungsi berbeda namun saling melengkapi:
- MAI-Transcribe-1
Model ini mampu mengubah suara menjadi teks dalam 25 bahasa berbeda. Menariknya, kecepatannya diklaim 2,5 kali lebih cepat dibandingkan layanan Azure Fast milik Microsoft sebelumnya. - MAI-Voice-1
Model ini berfokus pada pembuatan audio. Pengguna bisa menghasilkan 60 detik audio hanya dalam waktu 1 detik. Bahkan, model ini juga memungkinkan pembuatan suara kustom sesuai kebutuhan. - MAI-Image-2
Berbeda dari dua model sebelumnya, MAI-Image-2 digunakan untuk menghasilkan video. Model ini sebelumnya sudah diperkenalkan lebih dulu melalui MAI Playground pada 19 Maret.
Saat ini, ketiga model tersebut sudah tersedia di Microsoft Foundry. Sementara itu, untuk MAI-Transcribe-1 dan MAI-Voice-1 juga bisa diakses melalui MAI Playground.
Dikembangkan oleh Tim Superintelligence
Semua model ini dikembangkan oleh tim MAI Superintelligence, yaitu tim riset AI yang dipimpin oleh Mustafa Suleyman, CEO Microsoft AI. Tim ini sendiri baru dibentuk pada November 2025 dan langsung fokus pada pengembangan AI generasi berikutnya.
Dalam pernyataannya, Suleyman menegaskan bahwa Microsoft mengusung konsep Humanist AI. Artinya, pengembangan AI difokuskan pada kebutuhan manusia, cara komunikasi yang natural, serta penggunaan yang praktis dalam kehidupan sehari-hari.
Ia juga menyebutkan bahwa ke depannya akan ada lebih banyak model AI yang dirilis, baik melalui Foundry maupun langsung terintegrasi ke produk-produk Microsoft.
Strategi Harga Jadi Senjata Utama
Di tengah persaingan ketat pasar AI, Microsoft mencoba menawarkan nilai lebih dari sisi harga. Model-model ini diklaim lebih terjangkau dibandingkan layanan serupa dari Google maupun OpenAI.
Berikut gambaran harganya:
- MAI-Transcribe-1: mulai dari $0.36 per jam
- MAI-Voice-1: mulai dari $22 per 1 juta karakter
- MAI-Image-2: mulai dari $5 per 1 juta token (input teks) dan $33 per 1 juta token (output gambar)
Strategi ini bisa jadi daya tarik tersendiri, terutama bagi developer dan bisnis yang ingin menekan biaya operasional.
Tetap Bersama OpenAI, Tapi Lebih Mandiri
Menariknya, meskipun merilis model AI sendiri, Microsoft tetap menegaskan komitmennya terhadap kerja sama dengan OpenAI. Dalam wawancara dengan VentureBeat, Suleyman menyampaikan bahwa kemitraan tersebut masih menjadi bagian penting dari strategi perusahaan.
Namun, setelah adanya renegosiasi kerja sama, Microsoft kini memiliki ruang lebih besar untuk mengembangkan riset superintelligence secara mandiri.
Sebagai catatan, Microsoft telah menginvestasikan lebih dari $13 miliar ke OpenAI dan mengintegrasikan model-modelnya ke berbagai produk. Strateginya mirip seperti di industri chip: selain mengembangkan teknologi sendiri, Microsoft juga tetap bekerja sama dengan pihak lain.
Baca Juga : Microsoft Hapus Sebagian Fitur Copilot AI di Windows
Dengan langkah ini, Microsoft semakin menunjukkan ambisinya untuk menjadi pemain utama di industri AI. Bukan cuma ikut tren, tapi benar-benar membangun fondasi teknologi masa depan.


