Si es disposa de dues càmeres, s’obté un sistema estereoscòpic o 3D, mentre que si se'n té més de dos, es poden aconseguir vistes que envoltin objectes. En MVC, en comptes de codificar cada vista per separat, s’aprofita la redundància o similitud entre escenes per codificar només una o diverses vistes de referència i, addicionalment, les diferències de les altres vistes respecte a les de referència, de manera que s’aconsegueix un factor de compressió molt elevat. Un dels primers codificadors de vídeo multivista és l’extensió MVC de l’estàndard H.264/MPEG-4 AVC desenvolupat conjuntament per la International Telecommunications Union (ITU-T) i la International Organization for Standardization (ISO/IEC JTC1).
f