modèle d'intelligence artificielle générative capable de créer des vidéos à partir d'instructions textuelles
OpenAI a présenté Sora, un nouveau modèle d'intelligence artificielle générative capable de créer des vidéos à partir d'instructions textuelles. Sora est un modèle de diffusion qui utilise une architecture de transformateur, similaire aux modèles GPT, pour générer des scènes réalistes et imaginatives, y compris des scénarios complexes avec plusieurs personnages et des types de mouvement spécifiques[1][2][3]. Le modèle peut également animer des images fixes, étendre des vidéos existantes et combler les images manquantes, produisant des vidéos jusqu'à une minute de long dans divers styles tels que photoréaliste, animé ou en noir et blanc[1][2].
Malgré ses capacités, Sora a des limites, telles que des difficultés à simuler des physiques complexes, à comprendre la cause et l'effet, et à maintenir les détails spatiaux avec précision. Par exemple, il pourrait ne pas montrer une marque de morsure sur un cookie après que quelqu'un ait pris une bouchée, ou il pourrait mélanger la gauche et la droite dans une scène[1][2].
OpenAI prend des précautions de sécurité avant de rendre Sora largement disponible. Ils travaillent avec des red teamers pour tester le modèle pour d'éventuels dommages, tels que la désinformation, le contenu haineux et les biais. Ils développent également des outils pour détecter le contenu trompeur et prévoient d'inclure des métadonnées C2PA à l'avenir pour garantir la provenance des vidéos générées par Sora[1][2][4][5].
Sora est actuellement disponible pour les red teamers et un groupe sélectionné d'artistes visuels, de designers et de cinéastes pour obtenir des retours. OpenAI s'engage auprès des décideurs politiques, des éducateurs et des artistes pour comprendre les préoccupations et identifier les cas d'utilisation positifs de la technologie. Ils soulignent que l'apprentissage de l'utilisation réelle est crucial pour créer et libérer des systèmes d'IA de plus en plus sûrs[1][2][3].
L'introduction de Sora suit le modèle de développement rapide d'OpenAI dans les outils d'IA générative, y compris ChatGPT, DALL-E 3, et maintenant Sora, qui représente une avancée significative dans la capacité de l'IA à générer du contenu vidéo[3].
Citations:
[1] https://openai.com/sora
[2] https://en.wikipedia.org/wiki/Sora_(text-to-video_model)
[3] https://youtube.com/watch?v=SkCz4LqzNF4
[4] https://www.nytimes.com/2024/02/15/technology/openai-sora-videos.html
[5] https://fox5sandiego.com/news/tech/ap-technology/ap-sora-is-chatgpt-maker-openais-new-text-to-video-generator-heres-what-we-know-about-the-new-tool/
[6] https://www.linkedin.com/news/story/openai-unfurls-ai-generated-videos-5947948/
[7] https://youtube.com/watch?v=Rftv7MyDtrw
[8] https://fr.euronews.com/next/2024/02/16/que-fait-sora-le-nouvel-outil-dia-cree-par-openai
USE THE RESOURCES HERE WITH ALL VIDEOS TO UPDATE THE PUBLICATION - https://www.datacamp.com/blog/openai-announces-sora-text-to-video-generative-ai-is-about-to-go-mainstream