radigfamedia.online - OpenAI telah memperkenalkan model AI terbaru bernama Sora, yang mampu membuat video hanya dengan perintah teks. Sora menggunakan pendekatan yang inovatif dan canggih dalam pembuatan video, menciptakan gelombang baru dalam teknologi ini.
Foto: OpenAI Sora (Ilustrasi) by urkmenportal |
Proses dimulai dengan video yang awalnya terlihat seperti derau statis. Namun, dengan kemampuan transformasinya, Sora secara bertahap menghilangkan derau tersebut dalam beberapa langkah, menghasilkan video berkualitas tinggi yang memukau.
Baca Juga: Mengungkap Misteri Vibranium: Bahan Anti Peluru yang Mengejutkan Dunia
Salah satu keunggulan utama dari Sora adalah kemampuannya untuk menghasilkan video secara menyeluruh atau memperluas video yang ada untuk membuatnya lebih panjang.
Sora menggunakan model pandangan ke depan pada banyak bingkai sekaligus, sehingga dapat menjaga konsistensi subjek video meskipun dalam beberapa saat subjeknya mungkin tidak terlihat.
Baca Juga: Dialog Fisikawan Terkenal: Kisah Einstein dan Oppenheimer yang Diabadikan Dalam Film
Mirip dengan model GPT yang terkenal, Sora juga menggunakan arsitektur transformator yang canggih, yang menghasilkan performa penskalaan yang superior dan memungkinkan Sora menghasilkan video dengan kualitas yang sangat tinggi.
Sebagai bagian dari pendekatan inovatifnya, Sora merepresentasikan video dan gambar sebagai kumpulan unit data yang lebih kecil yang disebut patch, mirip dengan yang digunakan dalam model GPT. Dengan memadukan cara merepresentasikan data ini, Sora dapat melatih transformator difusi pada data visual dengan berbagai durasi, resolusi, dan rasio aspek, membuka kemungkinan baru dalam pembuatan konten visual.
Baca Juga: Alan Turing: Menggali Kehidupan Sang Bapak Kecerdasan Buatan Dari Perang Hingga Tragedi Pribadi
Sora juga mengembangkan penelitian sebelumnya dalam model DALL-E dan GPT, memanfaatkan teknik recaptioning dari DALL-E 3. Teknik ini melibatkan pembuatan teks yang sangat deskriptif untuk data pelatihan visual.
Dengan pendekatan ini, model Sora dapat dengan setia mengikuti instruksi teks pengguna dalam menghasilkan video yang sesuai dengan keinginan.
Selain kemampuannya untuk menghasilkan video dari instruksi teks, Sora juga mampu mengambil gambar diam yang ada dan menghasilkan video darinya. Proses ini melibatkan animasi konten gambar dengan akurat dan memperhatikan detail kecil, menciptakan hasil yang menakjubkan.
Model ini juga dapat mengambil video yang ada dan memperluasnya atau mengisi frame yang hilang, memberikan fleksibilitas yang luar biasa dalam pembuatan konten visual.
Baca Juga: Para Capres Dianggap Kehilangan Substansi Dalam Gagasan Mereka Mengenai Teknologi Informasi
Secara keseluruhan, Sora berfungsi sebagai landasan bagi pengembangan model yang dapat memahami dan mensimulasikan dunia nyata.
Kemampuan ini dianggap sebagai tonggak penting dalam perjalanan menuju Artificial General Intelligence (AGI), menandakan langkah besar dalam pengembangan teknologi yang dapat menciptakan, memahami, dan mereplikasi konten visual dengan tingkat kualitas yang tinggi dan akurasi yang luar biasa.