Left

image

HUNMagyarul
Menu:
lsmaker.uw.hu
Leírások - A DV-től a DivX-ig

Leírások

A DV-től a DivX-ig

Elmélet

Mi a DV?

A DV több fogalmat is takar. Kézzel foghatóan egy videókazetta formátum, csakúgy mint a VHS. Ennek létezik egy miniDV változata (csakúgy, mint a VHS-nek a VHS-C), ami ugyanolyan szalagot használ, csak rövidebb a játékideje, és kisebb a kazetta. Ezt kifejezetten kicsi, digitális kamerákban alkalmatták. A DV szalagra a videó DV tömörítéssel kerül fel. Fontos megjegyezni, hogy a Sony az olcsóbb kategóriás DV kamkordereiben Digital8 (D8) formátumot használ. Ez lényegében azt jelenti, hogy a kamera régebbi Video8 illetve Hi8-as kazettákra rögzít digitális anyagot. Előnye, hogy lejáttsza az analóg kazettákat is. A D8-ra felírt adat semmiben sem különbözik a DV-től. Gyakorlatban annyi különbség van, hogy a DV-t gyorsabban tudják tekerni a kamerák. Visszatérve a DV-re, mint tömörítésre. Elég szigorúak a követelményei: 720x576-os felbontás, 25 képkocka másodpercenként, váltottsoros videó. A hang tömörítetlen PCM, lehet 32, 44, 48 KHz.16 illentve 12 bites, sztereó. A 32Khz, 12 bites hangból 2 sztereó sáv is lehetséges. Ez nem 4 csatorna, hanem 2x2. A kimeneten csak sztereó jelenik meg, és állítható milyen arányban keverje a két sávot.

A kép

A videó CBR (konstans bitrátájú) 25 Mbites (/másodperc). Ez azt jelenti, hogy minden másodpercben elhasznál 25 Megabitet (millió bit), függetlenül a kép összetettségétől, tartalmától. Ez azért szükséges, mert a DV-t szalaghoz találták ki, ahol lineáris az elérés, nem véletlenszerű, és a szalagsebességnek állandónak kell lenni, nem lehet "rángatni". A videó nem delta alapú (nem a változásokat tárolja le), minden képkocka önmagában hordozza a teljes képkocka megjelenítéséhez szükséges adatot. Ezért gyors a kitömörítés, és gyorsan lehet szerkeszteni is. A képpontokat YUV színtérben kezeli (nem RGB), ez még az analóg és fekete-fehér kompatibilitást segíti. Y = 0.299 R + 0.587 G + 0.114 B. U = 0.493 (B - Y). V = 0.877 (R - Y). Egy képpontot 4:2:0 (Y:U:V) formátumban tárol le. Az Y a fényerősséget, az U és V a színkülönbséget jelenti. Eredetileg a 24 bites videó azt jelenté, hogy mindhárom komponens 8:8:8 bitet kap (250Mbit). De csak az arányokat szoktuk megadni, ezért leosztották 2-vel, így 4:4:4 az arány. Az emberi szem sokkal érzékenyebb a fényerő-különbségre, mint a színekre. Ezért el is dobják a színinformáció felét. Így 4:2:2 (165Mbit) lesz. Ilyet használnak a JPEG, MPEG-ek. De így még mindig túl nagy az adatmennyiség tömörítetlenül. Ezért a színinformációk felét megint eldobják. Így lett 4:2:0. Ezután még egy kis veszteséges tömörítést ráeresztenek a képre, hogy végül elérjenek még 5:1-es tömörítést, 125Mbitből 25-öt gyártottak. És az eredmény? Sokszor igen kifogásolható, főleg ha manipulálni kell a képeket, ekkor hirtelen még jobban romlik a képminőség.  NTSC DV-nél 4:1:1-et használnak 720x480-as felbontás mellet... A Sony-féle DVCAM is csak 4:2:0-s (ill. 4:1:1 NTSC), de strapabíróbb a DV-nél és a profik számára fontos szolgáltatásai vannak (pl. locked audio), valamint a Panasonic-féle profi szabvány, a DVC Pro is csak 4:1:1, mindkettő 25Mbit-es. Ellenben a Panasonic-féle DVC Pro 50 szabvány 50 Mbit-et használ rögzítéskor, így lehetőség nyílik 4:2:2-es rögzítésre mind NTSC és PAL esetén is. Ha azt mondjuk, hogy 4:2:2 arányú a képpontok információtartalma, nem alacsonyabb bitmélységre kvantálják, hanem kevesebbszer, ritkábban tárolják el pl. a színinformációt. Tehát pl. egyszer 4:4:4 ír le egy képpontot, a következőt 4:0:0 és így tovább. Ezt átlagolva 4:2:2-t kapunk.

Ezért a profi kamerák nem DV-ben, hanem DVCAM (Sony) vagy DVCPro-ban (Panasonic) rögzítenek. Ekkor 4:2:2-es a fény-, színinformáció-arány, ami lényegesen jobb. De nagyobb helyet is foglal. Pl.

Mintaképek: (érdemes megfigyelni, hogy az átmenetek mennyivel lépcsősebbek lesznek 4:2:0-ban, hiszen gyakorlatilag a kvantálás alacsonyabb bitmélységre történik).

Komponensek 4:4:4 (tömörítetlen) 4:2:0 (DV)
Minden csatorna 4:4:4 4:2:0
Vörös (R) 4:4:4 4:2:0
Zöld (G) 4:4:4 4:2:0
Kék (B) 4:4:4 4:2:0
Világosság (Y) 4:4:4 4:2:0
Szín1 (U) 4:4:4 4:2:0
Szín2 (V) 4:4:4 4:2:0
Szín (H) 4:4:4 4:2:0
Színtelítettség (S) 4:4:4 4:2:0
Világosság (B) 4:4:4 4:2:0



A normál kép, a színcsatorna (Hue) fekete-fehérré alakítva, és a világosság csatorna (Y). Látszik, mennyire kockás a színcsatorna, mivel kisebb értékekre lett kvantálva, sokkal alacsonyabb bitrátával lett tömörítve.

A képpont képarány

AteljesDVfelbontás720x576.720/576=5/4=1,25. Mint tudjuk, a TV-k képaránya 4/3=1,333. Ez a két érték nem egyezik. A TV-k képpontjai nem 1:1 arányúak, mint a monitoroké, hanem 1,06666:1. Ha megtartjuk a sorok számát, akkora megfelelő vízszintes felbontás 768 lesz. 768/720= 1,06666. (Ha a vízszintes felbontást tartanánk meg, akkor540 lenne a sorok száma, de mivela forrás ilyenkor általában váltottsoros, interlace-es, ennek semmi értelme, mivel tönkrevágná a képet). Tehát mindig úgy kell átméretezni DV-t monitorra, mintha 4:3-as lenne. Ha monitoros képet pl. digitális fényképezővel készültet akarunk DV videóba szerkeszteni, akkor a programok általában tudják, hogy össze kell nyomni a képet. Rosszul járhatunk, ha mi kézzel összenyomjuk, majd a program újra ezt teszi, mert honnan tudhatná, hogy mi a képpontképaránya a képnek. Fontos itt megjegyezni, hogy a mindenhol emlegetett 1280x1024-es monitorfelbontás is hasonlóan 5:4 arányú. Ekkor figyelni kell, hogy a monitoron a kép ne legyen a szélekig kihúzva, mert akkor torzult lesz a kép. Hanem 5:4 arányúra kell "összenyomni". Javaslom inkább az 1280x960-as felbontás használatát, amennyiben támogatja mind a monitor, mind a videókártya. Ez pont a 640x480 kétszerese. Mindez persze a katódsugárcsöves monitorokra vonatkozik, ahol valóban 4:3 a képarány. Az újabb TFT monitorok felbontása gyakran 1280x1024 1:1 képpontképaránnyal, tehát a képarány 5:4! Ekkor természetesen 5:4 arányú felbontást kell használni, lehetőleg a monitor fizikai felbontását, mivel akkor a legélesebb a kép, se nagyobbat, se kisebbet!

A DV után

Egyes legújabb kézikamerák már képesek nagyobb felbontásban is rögzíteni. Ráadásul DV kazettára, az alacsonyabb költségek (fejlesztés, gyártás, használat) érdekében (HDV szabvány). Mindezt úgy érik el, hogy nem DV tömörítéssel, hanem MPEG2-ben rögzítenek konstans bitrátával. Ez azonban az utófeldolgozásban némi kompatibilitási gondot jelenthet, mivel a DV kártyák nem valószínű, hogy tudják fogadni az MPEG2 adatot, nem is beszélve a nem PAL szabványú képformátumról. Ezt az esetet tapasztalat híján nem boncolgatom tovább. Remélem gyorsan az alsóbb árkategóriába is átterjednek hasonló készülékek.

Az kártyák

A DV kártya példa a Canopus néhány kártyájára vonatkozik. Személyes tapasztalatom az EZDV-vel van, de a Raptor, Storm is hasonló ilyen téren, de tudásuk jóval több.

Hogyan kerülhet a szalagról a merevlemezre a videó? A kamerák FireWire interfészen át küldenek és fogadnak digitális videót. A Sony ezt iLink-nek nevezi, a hivatalos neve IEEE1394. Ez mind egy és ugyanaz. A számítógépnek tudni kell fogadni a jelet. Ehhez 2 típusú kártya jöhet szóba. A kifejezetten DV eszközökhöz való kártya (kamkorder, DV Walkman, D8 is!) illetve FireWire kártya (OHCI kompatibilis kártya). A kettő meglehetősen különbözik egymástól. Míg a DV kártya kizárólag DV eszközöket kezel, a FireWire kártyához szinte bármilyen eszkört csatlakozathatunk pl. DVD-író, scanner, profi digitális fényképezőgép, külső merevlemez... A DV kártyáknak általában kicsi, 4 pólusú DV csatlakozójuk van, mint a kamerákon, az OHCI kártyákon 6 pólusú. Csak annyi a különbség, hogy a plusz két érrel érzékeli a kártya, hogy van-e csatlakoztatva eszköz, míg a négypólusú gyakori időközönként rákérdez. A DV kártya kifejezetten drága, 30000 forinttól milliós nagyságrendekig terjed áruk. A FireWire kártyák ellenben jóval olcsóbbak, 4000 forinttól akár 40000 forintig is kapható, de lehet akár alaplapra integerált is. Itt gyakorlatilag a mellé adott szoftverek határozzák meg az árat, a kártya lehet ugyanaz. A DV kártyák zártabb rendszerűek, csak a saját szoftvereikkel működnek, esetleg néhány szoftverhez van plug-in, ellentétben a FireWire kártyákkal, ezek szinte minden szoftverrel együttműködnek, hiszen szabványos. Ezek után úgy tűnhet, hogy a DV kártyának semmi értelme. Pedig nagyon is van. A DV kártyák ugyanahhoz kevesebb erőforrást igényelnek, mint az OHCI-k. A DV kártyákban van egy kis videómemória, míg az OHCI-sben nincs, és tudhatnak valósidejű effekteket, a processzor nagyfokó kihasználása nélkül. A szerkesztés közben azonnal megjelenhet a kép a digitális (és analóg ha van) kimeneten. Frame (képkocka) pontos kameravezérlés. Locked audio. Bár hozzá kell tenni, hogy az OCHI szoftverek sokat fejlődtek az elmúlt néhány évben. Már az OHCI-vel is lehetséges framepontos vezérlés, mindez köszönhető a fejlődő szoftvereknek. A Canopus cég nemrég jelentett be olyan kártyát, ami mind DV-s, mind OHCI-s egyszerre.

Az áttöltés

Itt ketté is kellene választani a folyamatot. "DV" és "FireWire" kártya esetre. Sokan az áttöltés (capture) folyamatát az analóg mintájára digitalizálásnak hívják, pedig ekkor már rég digitális a jel. A DV kártyával a letöltés kisebb erőforrást igényel, kisebb az esélye, hogy kiesnek képkockák. A folyamat lényege, hogy a szalagon tárolt adatot, merevlemezen lévő AVI állományba másoljuk. A normál DV körülbelül 3,5 MB-ot foglal másodpercenként, plusz a hang, így kb. 3,7MB lesz. Ez igen sok. Sajnos az AVI szabványnak vannak korlátai. A régebbi AVI szabvány csupán legfeljebb 2GB-os fileméretet lett lehetővé (sokáig nem is léteztek ekkora tárolók, amikor már rég használták az AVI formátumot). A 2GB mindessze körülbelül 9,5 perc DV anyag. Az újabb AVI már 4 GB-ot is lehetővé tesz, de ez még mindig kevés. Sőt, fontos, hogy a FAT32 fájlrendszer is csupán legfeljebb 4GB-os fájlok tárolását teszi lehetővé. Ha ennél nagyobbra van szükség, használjunk NTFS-t. A kompatibilitást részben megtartva ma már NTFS-sel lehetséges bármilyen hosszú AVI tárolása. Ez úgy történik, hogy amint a 2/4 GB-os blokk véget ér, újat indít, mintha egy új AVI file következne. Korábban nem lehetett egyben 9 percnél hosszabb anyagot leszedni. Aztán a Canopus cég kidolgozott saját eszközeihez ún. Reference Avi-t. Ez olyan, hogy az AVI-ban tárolja a hangot, és hivatkozásokat a videó képkockáira, melyek .000, .001... file-okban vannak (4 GB-onként daraboltak). Így nagyon hosszú videókat lehet egyben tárolni, és kompatibilis minden szerkesztővel. Az OHCI-s oldal is fejlődött, ma már nagyon sok program automatikusan szétdarabolja 4 (v.2) GB-os darabokra leszedés közben a videót. De ez nem olyan jó megoldás. Fontos még, hogy ha OHCI-n keresztül szedünk le videót, akkor az nem lesz teljesen szabványos. Az AVI-kban van egy rész az elején, az ún. FourCC (four character code, négy karakter kód). Ez határozza meg, hogy milyen kitömörítő codec-et használjon a lejátszó a kitömörítéshez. Pl. "DIVX"=DivX, "CDVC"=Canopus DV Codec, "HFYU"=HuffYUV, "MJPG"=MJPEG... Ha OHCI-s kártyával szedünk le, akkor Microsoft DV formátumba kerül. A fourCC-je DVSD, amihez nics valódi codec (kitömörítő), csak megfelelő programok (pl. videószerkesztők)tudják értelmezni.Ellentétben, pl. a Canopuskártyák CDVCfourCC-s AVI-kat mentenek és feltelepült hozzá Canopus DV codec is. Ez az igazán elegáns módszer. De tölthetők le internetről DV codecek, így megkerülhető a probléma. De sajnos mindegyik DV codec kicsit másmilyen képet tömörít ki, nem ugyanolyan minőségőek. Ha egy DVSD-s AVI fourCC-jét átítjuk pl. CDVC-re, akkor ezután úgy videlkedik, mintha valódi Canopus AVI lenne. Ez is bizonyítja, hogy áttöltéskor a kamerától érkező jelet csak egy AVI "keretbe" kell foglalni, semmilyen módosítás nem történik a DV adattal. Némely DV codec-ek megzavarhatják a videószerkesztők működését, nem lehet ezután DV videókat szerkeszteni. Ezért nem ajánlom ilyenek telepítését, legfőképp pedig a codecpack-októl kell távolságot tartani.

Tömörítés

Miért kell tömöríteni? A digitális videónak irtózatosan nagy a tárhelyigénye. A fent vázolt DV tömörítés kb. 10-edére csökkenti a videó méretét a tömörítetlenhez képest, de még így is nagy a tárhelyigénye. Egy órányi tömörítetlen DV felbontású videó (3*720*576*25*60*60/1024/1024/1024) 104GB tárhelyet foglalna! A 0,5GB elfogadhatóbbnak tűnik.

A legjobb hatásfokú tömörítést a DivX-szel lehet elérni. Ez egy Mpeg4 alapú codec. Nagyon népszerű a nyílt forráskódú XviD is, de a legújabb változatai már eltértek az Mpeg4 szabványtól. Ha a korábbi változataival készített videók fourCC-ját átírjuk DIVX-re, akkor a DivX hibátlanul lejátsza, mivel mindkettő mpeg4 szabványú. Az újabbakkal ez nem teljesen működik (fentebb említettem, hogy ugyanígy el lehet járni a DV codec-ekkel is).

A bitráta azt jelenti, hogy egy másodpercnyi tömörített videó mennyi helyet foglalhat. Ezt leggyakrabban kbps (b=bit, B=Byte, ezt nagyon sokszor összekeverik!) (kilobit per second, ezer bit másodpercenként) -ben kell megadni. Mpeg 2-ben DV-hez jó minőséget lehet elérni 5-6 Mbps (5000 kbps) felett, DivX-nél 2 Mbps, 3Mbps felett. Bár ekkora DivX-hez megfelelően gyors számítógép szükséges (Pentium 4). Bitráta kalkulátor programokkal nagyon precízen ki lehet számolni a szükséges bitrátát, amit a DivXcodec hibátlanulbe is tart. ezeknek a programoknak a videó hosszát és a kívánt fileméretet kell megadni. Figyelni kell a hangra is, ennek is van mérete, illetve maga az AVI kicsit nagyobb, mint tisztán a hang és mozgókép adatfolyam méretének összege.

Léteznek Intra és Delta alapú tömörítők. Az I-frame (Intra) alapúaknál minden képkocka egyértelműen meghatározott, visszaállítható. Ellenben a delta alapúvaol. ott bizonyos időnként vannak kulcsframe-ek (kulcs képkocka), ezek I frame-ek, a többi delta frame. A delta frame-ek kitömörítéséhez szükség van pl. az előtte lévő kulcsframe-re, esetleg néhány többi deltaframe-re is. Ez az eljárás lassú, hiszen 1 kép kitömörítéséhez többet is ki kell számolni. De nagyon előnyös, ha pl. 1 másodpercig egy állókép van. Akkor elég csak az elsőt letárolni, a következő 24 erre hivatkozik. Míg I alapú tömörítésnél ugyanez durván 25-szörös tárhelyet foglal! A DivX delta alapú, az Mpeg 1,2, MJPEG lehet I és delta alapú is. Az I alapúakat könnyű vágni, mert bárhol megszakítható és folytatható, míg a delta alapúaknál rosszabb esetben a vágás körüli részeket újra kell tömöríteni minőségromlással együtt. A delta képkockának két alfajuk létezik. A "P" (predictive) és "B" (bidirectional). A "P" előremutató, az előtte lévő kell a kiszámolásához, a "B" kétirányú, az előtte és mögötte lévő képkocka is szükséges a kiszámolásához. A "B" sokkal számolásigényesebb, ám jóval tömörebb, jó minőséget ad.

Érdemes áttekinteni, hogy milyen tömörítési módok léteznek:

Gyakorlat

Szükséges programok - Letöltés  

DV capture program: pl. DVIO, WinDV, DVApp
Videó tömörítő: pl. Virtualdub, VirtualDubMod
AVISynth
Hang tömörítő: Lame, RazorLame
Videó codec: DivX(, esetleg DV decoder codec)
Bitráta kalkulátor: pl. a saját Bitráta kalkulátorom (letöltések/programjaim)
Hang-kép összerakó: AVIMux, vagy VirtualDubMod

Áttöltés

Először is próbáljuk meg csatlakoztatni a DV kábel egyik végét a kamerához, a másikat a számítógéphez, és a kamerát bekapcsolni. Ha sikerült, akkor jó úton járunk.

Ha OHCI kártya van a számítógépben, akkor nagyon sokféle programmal lehet elvégezni az áttöltést (capture), mivel szabványos capture eszközként jelenik meg a kamera, mint pl. egy digitalizáló kártya. Ingyenes áttöltő pl. a WinDV, DVIO, DVApp. Az első kettőnél nem lehet a kamerát vezérelni, ekkor a kamera vagy annak távirányítójának gombjait kell használni. Mindkét program tud AVI-t visszaírni is, ami akkor hasznos, ha a megszerkesztett anyagot TV-n akarjuk megnézni, és VHS-re is át lehet másolni. Ilyenkor nem érdemes deinterlace-elni. A DVIO nem mutat képet, csak egy rögzítés és kiküldés gomb van, valamint lehetőség van AVI filenevet megadni. A WinDV többet tud, mutat előnézet képet, megadhatók az AVI "darabolásának" paraméterei, hány kép után kezdjen új file-t... A DVApp is tud mutatni előnézetet (kikapcsolható). Ez a program valójában egy Microsoft mintaprogram. De ezeken kívül számtalan program kezeli az ilyen úton csatlakoztatott kamerákat. A videószerkesztők (Adobe Premiere, Pinnacle, Ulead...) és a manapság divatos DVD szerkesztők. A VirtualDub Capture módja inkább analóg forrásokhoz, digitalizálókhoz való.

Egyéb kártya (DV) esetén a hozzá adott szoftvereket érdemes használni. Ilyen kártyákkal nem működnek a fenti programok, mert nem szabványos capture eszközként jelenítik meg a rá csatlakoztatott kamerát, általában sehogy sem. Ezek zártabb rendszerek, de stabilabb is. Nagyobb videószerkesztő programokhoz (pl. Adobe Premiere) vannak beépülő-modulok (plug-in), így azok is ki tudják használni eme kártyák tudását, lehet áttölteni is velük.

A tömörítés menete

A hangot és a képet külön menetben érdemes tömöríteni. Ezért szét kell választani a kettőt. A hangot egy MP3 tömörítővel kell tömöríteni, a képet lehet pl. Virtualdubbal. Ezután a kettőt újra össz kell illeszteni.

Vágás

Fentebb említettem, hogy az OHCI kártyán keresztül áttöltött AVI-k nem teljesen szabványosak. A VirtualDub(Mod) nem tudja önmagában megnyitni. Ezért két lehetőség van: Codec-et letölteni hozzá, vagy a Microsoft DV codecet használni AVISynth-en keresztül. A második eset igényel némi magyarázatot. Kell készíteni egy szövegfile-t, .AVS kiterjesztéssel. Ebbe a következőt kell írni:

DirectShowSource("filenev.avi")

(A "filenev.avi" helyére a videó nevét kell írni. Célszírű az AVS-t az AVI-val egy könyvtárba helyezni.) Ekkor DirectShow API-n keresztül nyitja meg az AVI-t, nem a régebbi VfW-n (Video for Windows) felületen. Directshow-t használják az új lejátszóprogramok (pl. Windows Media Player, BSplayer...). Csak DirectShow-n keresztül érhető el a Microsoft DV "codec". A DirectShow környezet sokkal rugalmasabb. Míg VfW rendszerben "igazi" codec-ek voltak, tehát a folyamat úgy nézett ki, hogy meg kell nyitni az AVI-t, kiválasztani a Codec-et, majd kitömöríteni. A DS sokkal univerzálisabb lett. Mindenre szűrők vannak. Van file-beolvasó, AVI szétválasztó (hangra, képre), dekódoló (pl. DivX), majd megjelenítők pl. Teljesképernyős videómegjelenítő és hasonló hangra. De közbe lehet ékelni egyéb szűrőket, amik megváltoztatják pl. a hangot (pl. bal-jobb csatorna csere...). Ezekre nem volt lehetőség a VfW rendszerben, továbbá a programozók dolga egyszerűsödött, mégis jobb programokat lehet írni. A Graphedit nevő ilyen szűrőket kézzel is össze lehet illesztgetni. A lenti példát "elindítva" egy kis ablakban megjelenik a videó.

Külön letölthető DV codec segítségével ez a lépés kihagyható, bár nem javasolt.

Ezután lehet szerkeszteni az anyagot. Kivágni a nem megfelelő részeket, feliratok, átmenetek... és végtelenül sok haszontalan effekttel lehet teljesen tönkrevágni videóinkat. Ezekre itt nem térek ki.

Az egyszerűség kedvéért most csak a nemkellő részek kivágására és a tömörítésre térek ki, a kép tömörítésére vonatkozó beállítások más programokból is használhatók, nem csak VirtualDub-ból. Pl. Videószerkesztőkből.

Próbáljuk meg megnyitni a videót VirtualDubban (az AVS-t, ha ilyen készült). Ha sikerült, utána a Home és End billentyűk segítségével lehet kijelölni részeket, majd a Del billentyűvel törölni. A File menü "Save processing settings..." menüponttal ki lehet menteni a vágásokat és más a videóra vonatkozó módosításokat (ekkor nem hajtódnak végre, csak jól jöhet, ha sok részt kellett kivágni és kellemetlen lenne néhányszor valami hiba folytán újból egyenként megcsinálni).

A hang

Az audio menüben lehet választani "Direct stream copy" és "Full processing mode" között. Az előbbi azt jelenti, hogy semmiféle módosítás nem történik a hanggal. A "Full processing mode" kiválasztásával már lehet tömöríteni a hangot, de a jobb minőség érdekében inkább külső (MP3) tömörítést javaslok. Érdemes a Direct stream copy-t kiválasztani. Ezután a File menüből a Save WAV... menüpontot. Adjunk meg egy filenevet, ebbe kerül a tömörítetlen hang. Ha nem működne rendesen, akkor a Full processing mode-dal próbálkozzunk, és fontos, hogy a compression-nél PCM (Uncompressed) legyen kiválasztva.

Ezután kell egy MP3 tömörítő program (pl. Lame és RazorLame), amivel MP3-má lehet alakítani az imént kimentett hangot. Általában a házi videókoz elég a 128Kbps, de ha jobb minőség kell, el lehet menni 160-192-re is. Nagyobb bitráta felesleges. Mindenképp CBR-t javaslok, a VBR-rel felmerülhetnek "hang elcsúszási" problémák.

A kép

Miközben tömörödik a hang, lehet beállítani a videót. Be kell állítani a Deinterlace szűrőt (ld. Leírások), aztán leméretezést, ha kell. Leméretezésnél fontos, hogy ún. szűrőzött (filtered) algoritmust kell használni. Ilyen pl. Bilinear, Bicubic, Precise Bilinear, Precise Bicubic, és a Lanczos3. Ezeket resample (újramintavételezős) eljárásoknak hívják, míg a sima, Nearest neighbor az resize (átméretező). Az előbbiek előnye, hogy az átméretezett kép képpontjainak előállításához felhasználja az eredeti kép összes képpontját, ezekből számolja ki az új képpontokat, az utóbbi "csak kiveszi" azokat a sorokat és oszlopokat, amik nem kellenek. Ennek eredménye, hogy az élek nagyon recéssé válhatnak.

Az első kép Nearest neighbor eljárással lett leméretezve, a második Precise Bilinearral: Teljes kép itt 
Nearest neighborPrecise bilinear
A nagyításnál is jól megmutatkozik a különbség. A Nearest neighbor módszer csak többszörözi a meglévő képpontokat, a Lanczos3 újakat állít elő. De az információtartalma mindegyiknek ugyanannyi. (1. Eredeti, 2. Nearest neighbor, 3. Lanczos3)
EredetiNearest neighborLanczos3

VirtualDubban a szűrőket a következő módon kell alkalmazni: Video/Filters. Add gomb után lehet választani szűrőket (pl. resize, deinterlace-ek...). OK. Bekerült a korábbi listába. Több szűrő esetén fentről lefelé hajtódnak végre.

Mivel a DV képpontképaránya nem 1:1, mint fentebb említettem, ezt figyelembe kell venni átméretezéskor. A teljes felbontás 768x576 lenne, de én általában nem szoktam erre átméretezni, ezt majd a lejátszó megteszi. Ám ha nem archiválás céljából tömörítek, hanem ha mással is megosztom a videót, akkor kevésbé erőforrásigényes, fele felbontású mozgóképeket szoktam gyártani. Kétlépesben kell ilyenkor leméretezni: 1. 720x288-ra Nearest neighbor-rel, gyakorlatilag eldobja az egyik félképet, majd 384x288-ra. Ekkor pedig a helyes képarány áll elő. Egymenetben azért nem jó, mert akkor összemosódnak a félképek, és jeletősen rontja a képminőséget. Ez a módszer nagyon gyors. De deinterlace-elés után lehet pl. 512x384-re is méretezni, ez az olvasóra van bízva. (Jóval lassabb.)

Kivágni is lehet: null processing filter-t kell berakni, majd a szűrő listás ablakon a croppingra kattintva lehet beállítani kivágást.

Tömörítés: Virtualdubban válasszuk ki a Video menü Compression menüpontját. A bal oldali listában a DivX-et válasszuk ki, majd jobb oldalon a configure gombra kell kattintani. Szükség lesz egy Bitráta kalkulátor programra az egyszerűség kedvéért (DivX 5.2.0-ba be van építve). Erre a célra megfelel a saját programom, letölthető a programjimnál. Ebbe be kell írni a tömörítendő videó hosszát, a hanghoz használt bitrátát. (Ha elkészült a hang, akár ki is lehet választani, hogy a méretét pontosan megállapíthassa a számoló program). Továbbá meg kell adni a kívánt zeljes fileméretet. Ez lehet 700MB (695, vagy még kicsit kevesebb pl. Cedeceknek, lejátszóprogramnak is kellhet hely), hogy 1 CD-re férjen el. Ekkor a zöld mezőben megjelenik a bitráta, amivel tömöríteni kell. Érdemes általában 5-öt, 10-et levonni, biztos, ami biztos alapon. A program azt is figyelembe veszi, hogy az AVI nagyobb, mint a tiszta hang és videó adat. Teljes 720x576-os videóhoz minimum 2500kbps-ot javaslok, 384x288 (fele)-hez minimum 1500-at. Nagyon magasra (4000 fölé) nem érdemes menni, ekkor már nagyon gyors gép kell a lejátszáshoz. Tehát a configure gomb megnyomása után egy hasonló ablak tárulhat a felhasználó szeme elé:


DivX 5.2.0 Pro, már beépített bitráta kalkulátora van

Encode Performance: minőség vagy sebesség. Érdemes standard-en hagyni, a slow az túlságosan is lassú.
Average bitrate: ide kell írni a kiszámolt bitrátát.
Max bitrate: meg lehet adni a maximálisat, mivel alapból változó bitrátával tömörít a DivX. Azért van értelme, megadni maximálisat, mivel ha a kész tömörítvény CD-re kerül, onnan lejátszáskor nem tudja akármilyen gyorsan olvasni a meghajtó. 10000-nél följebb ritkán érdemes menni.
Encode mode: itt lehet egymenetes (1-pass) és többmenetes (multi-pass) között választani. A többmenetes 2 részből áll: első menet és többi menet (n.-ik). A többmenetes a következőképp működik: ki kell választani hogy multi-pass 1st pass (első menet). A bal alsó sarokban meg kell adni egy file-t, amibe az adatokat gyűjti. Ez egy átmeneti file. Ki kell menteni az AVI-t, visszajönni ide, kiválasztani 2. menetet, majd újra betömöríteni (kimenteni) az AVI-t. Lentebb erről bővebben.
DivX Certified Profile: ha be van kapcsolva, akkor minden bizonnyal lejátszák az asztil DivX-es DVD lejátszók. Ám ekkor nem lehet GMC- és Quarter Pixel minőségjavító eljárást, mondván az ezzel készült DivX-eket nem tudják lejátszani. Én mindig kikapcsolom a DivX profilokat, és mindig bekapcsolom a Bidirectional encoding-ot (kétirányú deltaframek), és a GMC-t (kis lassulás árán). És mégis lejátszotta egy asztali lejátszó. A Bidirectional-t mindenképpen érdemes bekapcsolni.
A Video fülön lehet választani, hogy a forrás váltottsoros-e, vagy progresszív, esetleg deinterlace-elje (sima összemosós). Lehet beállítani átméretezést és kivágást. Előfeldolgozást (PreProcessing), ha nagyon rossz minőségű a forrás, akkor lehet használni, hogy előkészítse, hogy jobb legyen a tömörítés. Scene detection threshold: mennyire legyen érzékeny a vágásokra, ide teszi a kulcsframe-eket. Max keyframe interval: érdmes 250-re állítani, tehát maximum 10s-onként tehet be kulcsframeket. Ha több, akkor lassú lehet az ugrálgatás a videóban. Meg egyéb beállítások. Az itt felsorolt beállítások egy részét nem tartalmazza a "sima" DivX codec, csak a Pro. Utóbbi fizetős, reklámos, vagy 6 hónapos próbaváltozat lehet, míg az előbbi teljesen ingyenes.

Egymenetes tömörítés: ha kész a bitráta beállítás, le kell okézni a párbeszédablakokat. Az audio menüben ki kell választani a "No audio"-t, hogy csak a képpel foglalkozzon. Majd File/Save AVI és mehet is a tömörítés. A párbeszédablakban a "Don't run this job now..."-t beikszelve nem indul el a tömörítés, csak bekerül várólistára. File/Job control-lal lehet a várólistát előtüntetni, itt starttal indul a lista végrehajtása.

Többmenetes tömörítés: először a Multipass 1st pass-t kell kiválasztani, majd megadni a bitrátát majd a log-filet (bal alsó sarok). Ezután leokézni, File/Save AVI és beikszelni alul a "Don't run this job..."-t. OK. Újra vissza a DivX beállításokhoz, most a multipass - Nth pass-t kell kiválasztani. Meg lehet adni a maximális bitrátát, ha nem tervezünk 2-nél több menet tömörítését (minek?) akkor az Update-logfile-t ki lehet kapcsolni. OK. File/Save AVI... Don't run this job... OK. Ezután File/Job control (F4). És végül start. Így egyben lefuttatja a két menetet, nem kell kivárni az elsőt, hogy kézzel kelljen indítani a másodikat. Különösen előnyös többórás tömörítéseknél és éjszaka.

Hang+kép

Ha kész mind a hang, mind a kép tömörítése, a kettőt össze kell illeszteni. Erre lehet használni pl. a VirtualDubMod-ot, vagy az AVIMux-ot (Mux=Multiplex, egyesítés).

VirtualDubMod: A program a "sima" VirtualDub átdolgozott változata. Nem csak AVI-t, és MPEG1-et, hanem akár MPEG2-t is meg tud nyitni. Nem csak WAV hangot, hanem az OGG, és MP3-at is kitűnően kezeli. Itt az Audio menü helyett egy Streams menü van, a Stream list hatására egy lista jelenik meg, mivel több hangsávot is tud kezelni (sőt felirat sávot és fejezeteket is tud). A listába lehet beilleszteni, törölni, kiszedni. Egy elemre jobb billenytűvel kattintva jelenik meg a "Virtualdub-os" audio menü. Itt lehet választani Direct stream copy/Full processing mode között... Egy elemre dupla kattintással le lehet tiltani, tehát a kimenetben nem fog megjelenni. Az Add gombbal be kell tölteni a korábban készített MP3-at, majd leokézni. A Video menüben ki kell választani a Direct Stream Copy-t. A File/Save AVI menüponttal pedig ki lehet menteni az immáron hangos videót. És kész.

A Virtualdub helyett lehet használni tömörítésre ugyanúgy a VirtualDubMod-ot is. A második menetben már akár be is lehet tölteni a hangot, így nem kell külön hozzárakni, hanem amint elkészül a videó tömörítés, már tartalmazni fogja a hangot is.

AVIMux: Egyszerűbb és mégis bonyolultabb program. Több beállítás van, ami akár el is ronthatja a végeredményt. Ha mégis ezzel szeretnénk összerakni, akkor a következőképp lehet eljárni. A felső listára kell ráhúzni az elkészült AVI-t és MP3-at (vagy jobb gombbal a listára kattintva, Add, majd kiválasztani az AVI-t és MP3-at). Ezután ki kell jelölni az AVI-t, majd rákattintani a "Generate data source from files" gombra, rögtön a lista alatt. Ezután a Start gombra, majd megadni a cél AVI-t. A settings-nél (beállítások) nagyon sok beállítás van, főleg hozzáértőknek. A program nem csak AVI-ba, hanem pl. Matroska konténer formátumba tud menteni. Ez annyival több, mint az AVI, hogy támogatja a feliratokat, fejezet pozíciókat, hangsávoknak meg lehet adni, hogy milyen nyelvű... Továbbá nincsenek meg az AVI hibái. Hasonló az OGM is. De kevés program ismeri, ezért nem javaslom használatukat. A VirtualDubMod ismeri mind a Matroska-t (MKV) és az OGM-et. Az OGM jellemzően OGG formátumú hangot tartalmaz, ami majdnem kétszer tömörebb az MP3-nál hasonló minőség mellett, valamint teljesen ingyenes és nyílt formátum. Támogatja a többcsatornás (több, mint 2) hangot is.

A hang és kép összemásolása nem csak annyiból áll, hogy az egyiket a másik után kell másolni egy AVI file-ba. Ha pl. CD-ről játszanánk le egy ilyen videót, akkor az olvasófejnek ide-oda kellene ugrálni. Ezért jobb megoldás, ha a kettő össze van "fésülve" (interleave). Tehát van egy ki videó adat, majd egy kis audió felváltva. Így fizikailag folyamatosan lehet olvasni, ami kíméletesebb mind az olvasónak, mind a fülnek. Meg lehet adni ezredmásodpercben, ill. hány képkockánként fésüljön, illetve mennyivel előre töltse be a hangot. Ezek nagyon fontosak, rossz beállításokkal nem lehet folyamatosan akadás nélkül lejátszani a videót. A VirtualDub audió menüjében az Interleaveing menüpontnál lehet beállítani. (Tehát VDubMod-ban a Streams listben egy elemen jobb kattintás után az Interleaving menüpontot választva). Itt 500ms az előre töltés (preload), és képkockánként rakja őssze (tehát 40ms). Au AVIMux-ban 100kB-onként rak össze alapértelmezésként, a preload 200ms. Tehát némely gépeken másként játszhatja le "ugyanazt" a videót (csak ez a két érték tér el). Pl. elcsúszhat a hang... A videót betöltve, megváltoztatva a két értéket újra kimentve megjavulhat a videó.

Copyright LSMaker 2005.