며칠 전 메타가 텍스트를 입력받아 영상을 만들 수 있는 인공지능 시스템 'Make a video'를 공개했습니다. 지금은 예시를 볼 수 있는 사이트만 오픈되었고, 대중이 사용할 수 있는 시기는 아직 미정이라고 하네요.
메타는 달리(DALL-E)와 같은 텍스트-이미지 AI 모델을 사용해 단어와 이미지 사이의 연관성을 파악하고 추가로 레이블이 지정되지 않은 비디오 훈련 데이터를 적용해 메이커비디오 모델이 텍스트 또는 이미지 프롬프트가 시간과 공간에서 어디에 존재하는지 학습하도록 했다. 이어 현 이미지 다음에 올 이미지를 예측해 짧은 시간 동안 움직이는 장면을 표시했다.
메타는 사진 생성처럼 비디오 생성이 악용될 수 있다는 점을 인정했다. 따라서 메이커비디오의 모든 AI 생성 비디오 콘텐츠에 해당 비디오가 AI로 생성되었으며 실제 비디오가 아님을 알 수 있도록 워터마크를 포함한다고 밝혔다.
스쳐보면 진짜 찍은 영상 같기도 하고, 어떤 것들은 약간 섬찟하기도 합니다... 곰돌이나 고양이한테 사람 손이 달려있기도 해서요.😨
⬇️ A young couple walking in a heavy rain ⬇️
⬇️ A teddy bear painting a portrait ⬇️
⬇️ A dog wearing a Superhero outfit with red cape flying through the sky ⬇️