Clock Magic Wand Quran Compass Menu
Image jok

Teks ke Video Generator Mudahkan Kita Bikin Video Cukup dengan Memasukkan Sejumlah Teks

Teknologi | Monday, 19 Feb 2024, 19:29 WIB
Gambar diam dari video yang dihasilkan oleh Sora dari OpenAI, seperti yang terlihat di situs web perusahaan. Foto: OpenAI via UPI.

OPEN AI, perusahaan di balik ChatGPT, telah meluncurkan model text-to-video yang akan menghasilkan video berdurasi hingga satu menit hanya berdasarkan input berupa teks.

Produk ini, yang diberi nama Sora, saat ini sedang dalam pengujian awal dengan sekelompok pengguna dan artis tertentu, dan mengikuti jejak Make-a-Video, yang telah dikembangkan oleh perusahaan induk Facebook, Meta.

Produk Meta tersebut diluncurkan pada Oktober 2022 tetapi hingga kini belum dirilis ke publik. Generator teks-ke-video lainnya saat ini sudah ada di pasaran, tetapi Sora, jika diluncurkan secara luas, akan menjadi salah satu pemain utama pertama dalam produk AI video untuk konsumen.

"Kami mengajarkan AI untuk memahami dan mensimulasikan dunia fisik yang sedang bergerak, dengan tujuan melatih model yang membantu orang memecahkan masalah yang membutuhkan interaksi di dunia nyata," kata OpenAI dalam sebuah pernyataan di situs web Sora, seperti dilannsir United Press International.

Saat ini, perusahaan ini juga telah merilis sebuah buku putih tentang pengembangannya.

OpenAI saat ini sedang mencari umpan balik dari beberapa seniman visual, desainer, dan pembuat film tentang bagaimana Sora dapat sangat membantu dan berguna bagi seniman kreatif.

Perusahaan akan menggunakan penelitian yang didapat dari pengguna awal untuk memberi tahu publik tentang kemampuan Sora dan kemampuan AI yang akan datang.

"Sora mampu menghasilkan adegan yang kompleks dengan banyak karakter, jenis gerakan tertentu, dan detail subjek dan latar belakang yang akurat," kata perusahaan itu. "Model ini tidak hanya memahami apa yang diminta pengguna dalam perintah, tetapi juga bagaimana hal-hal tersebut ada di dunia fisik." Demikian pernyataan OpenAI.

OpenAI menegaskan bahwa Sora memiliki pemahaman yang mendalam tentang bahasa, memungkinkannya untuk menafsirkan perintah dan menghasilkan karakter yang mengekspresikan emosi yang nyata. Nuansa akan menjadi ciri khas dari rilis baru perangkat lunak ini, mengatasi kelemahan yang ada dengan mensimulasikan detail adegan yang kompleks dan memahami sebab dan akibat.

"Sebagai contoh, seseorang mungkin menggigit sebuah kue, tetapi setelah itu, kue tersebut mungkin tidak memiliki bekas gigitan," jelas OpenAI.

"Model ini juga dapat mengacaukan detail spasial dari sebuah perintah, misalnya, mencampuradukkan kiri dan kanan, dan mungkin kesulitan untuk mendeskripsikan secara tepat peristiwa yang terjadi dari waktu ke waktu, seperti mengikuti lintasan kamera tertentu," sambungnya.

Perusahaan mengatakan bahwa mereka menjadikan keamanan sebagai ciri khas dari sistem baru ini, menjaga dari informasi yang salah, bias, dan konten kebencian, yang juga dihadapi oleh produsen AI lainnya.***

--

Disclaimer

Retizen adalah Blog Republika Netizen untuk menyampaikan gagasan, informasi, dan pemikiran terkait berbagai hal. Semua pengisi Blog Retizen atau Retizener bertanggung jawab penuh atas isi, foto, gambar, video, dan grafik yang dibuat dan dipublished di Blog Retizen. Retizener dalam menulis konten harus memenuhi kaidah dan hukum yang berlaku (UU Pers, UU ITE, dan KUHP). Konten yang ditulis juga harus memenuhi prinsip Jurnalistik meliputi faktual, valid, verifikasi, cek dan ricek serta kredibel.

Berita Terkait

 

Tulisan Terpilih


Copyright © 2022 Retizen.id All Right Reserved

× Image