2012-05-30 4 views
6

Получил это из примера кодирования в ffmpeg. Я могу несколько последовать примеру авторов для кодирования аудио, но я считаю себя озадаченный, глядя на код C (я комментировал в номера блоков, чтобы помочь мне ссылаться на то, что я говорю) ...Понимание кодирования видео FFMPEG

static void video_encode_example(const char *filename) 
{ 
AVCodec *codec; 
AVCodecContext *c= NULL; 
int i, out_size, size, x, y, outbuf_size; 
FILE *f; 
AVFrame *picture; 
uint8_t *outbuf, *picture_buf;    //BLOCK ONE 
printf("Video encoding\n"); 

/* find the mpeg1 video encoder */ 
codec = avcodec_find_encoder(CODEC_ID_MPEG1VIDEO); 
if (!codec) { 
    fprintf(stderr, "codec not found\n"); 
    exit(1);        //BLOCK TWO 
} 

c= avcodec_alloc_context(); 
picture= avcodec_alloc_frame(); 
/* put sample parameters */ 
c->bit_rate = 400000; 
/* resolution must be a multiple of two */ 
c->width = 352; 
c->height = 288; 
/* frames per second */ 
c->time_base= (AVRational){1,25}; 
c->gop_size = 10; /* emit one intra frame every ten frames */ 
c->max_b_frames=1; 
c->pix_fmt = PIX_FMT_YUV420P;     //BLOCK THREE 

/* open it */ 
if (avcodec_open(c, codec) < 0) { 
    fprintf(stderr, "could not open codec\n"); 
    exit(1); 
} 
f = fopen(filename, "wb"); 
if (!f) { 
    fprintf(stderr, "could not open %s\n", filename); 
    exit(1); 
}            //BLOCK FOUR 

/* alloc image and output buffer */ 
outbuf_size = 100000; 
outbuf = malloc(outbuf_size); 
size = c->width * c->height; 
picture_buf = malloc((size * 3)/2); /* size for YUV 420 */ 
picture->data[0] = picture_buf; 
picture->data[1] = picture->data[0] + size; 
picture->data[2] = picture->data[1] + size/4; 
picture->linesize[0] = c->width; 
picture->linesize[1] = c->width/2; 
picture->linesize[2] = c->width/2;    //BLOCK FIVE 

/* encode 1 second of video */ 
for(i=0;i<25;i++) { 
    fflush(stdout); 
    /* prepare a dummy image */ 
    /* Y */ 
    for(y=0;y<c->height;y++) { 
     for(x=0;x<c->width;x++) { 
      picture->data[0][y * picture->linesize[0] + x] = x + y + i * 3; 
     } 
    }           //BLOCK SIX 

    /* Cb and Cr */ 
    for(y=0;y<c->height/2;y++) { 
     for(x=0;x<c->width/2;x++) { 
      picture->data[1][y * picture->linesize[1] + x] = 128 + y + i * 2; 
      picture->data[2][y * picture->linesize[2] + x] = 64 + x + i * 5; 
     } 
    }           //BLOCK SEVEN 

    /* encode the image */ 
    out_size = avcodec_encode_video(c, outbuf, outbuf_size, picture); 
    printf("encoding frame %3d (size=%5d)\n", i, out_size); 
    fwrite(outbuf, 1, out_size, f); 
}            //BLOCK EIGHT 

/* get the delayed frames */ 
for(; out_size; i++) { 
    fflush(stdout); 
    out_size = avcodec_encode_video(c, outbuf, outbuf_size, NULL); 
    printf("write frame %3d (size=%5d)\n", i, out_size); 
    fwrite(outbuf, 1, out_size, f); 
}            //BLOCK NINE 

/* add sequence end code to have a real mpeg file */ 
outbuf[0] = 0x00; 
outbuf[1] = 0x00; 
outbuf[2] = 0x01; 
outbuf[3] = 0xb7; 
fwrite(outbuf, 1, 4, f); 
fclose(f); 
free(picture_buf); 
free(outbuf); 
avcodec_close(c); 
av_free(c); 
av_free(picture); 
}           //BLOCK TEN 

Вот что Я могу получить от блока кода кода блоком ...

BLOCK ONE: Инициализация переменных и указателей. Я не мог найти структуру AVFrame еще в исходном коде ffmpeg, поэтому я не знаю, что его ссылка

BLOCK TWO: Используется кодек из файла, если он не найден.

БЛОК ТРЕХ: Устанавливает образцы параметров видео. Единственное, чего я не понимаю, это размер gop. Я читал о внутренних кадрах, и я до сих пор не понимаю, что они собой представляют.

БЛОК ЧЕТВЕРТЫЙ: Открыть файл для записи ...

BLOCK ПЯТЫЙ: Вот, где они действительно начинают терять меня. Часть, вероятно, потому, что я точно не знаю, что такое AVFrame, но почему они используют только 3/2 размера изображения?

BLOCK SIX & СЕМЬ: Я не понимаю, чего они пытаются достичь с помощью этой математики.

BLOCK ВОСЕМЬ: Похоже, что avcodec функция делает всю работу здесь, не заинтересованную в том, что на данный момент ..

BLOCK NINE: Так как это за пределами 25 кадра для цикла я предполагаю, что он получает пережиток кадры?

BLOCK TEN: Закрыть, бесплатно мем, и т.д ...

Я знаю, что это большой блок кода следует путать с любой вход будет полезным. Я получил работу над головой. Заранее спасибо.

+0

Я провел много времени этим утром, глядя на блоки шесть и семь когда математика делается на многомерном массиве, и я должен сказать, что я так же застрял, как вчера был, оставив работу :( – SetSlapShot

+0

Что таинственно с шестым и седьмым блоками? Комментарий '/ * подготовить фиктивный образ */'должен предоставить вам всю необходимую вам информацию. Все, что нужно сделать, это генерировать некоторые пиксельные данные, которые в конечном итоге окажутся как некоторый градиент, который изменяется с помощью индекса кадра. – HonkyTonk

+0

Голосование, чтобы закрыть как слишком широкий. Пожалуйста, сосредоточьтесь на одной точке на вопрос. –

ответ

3

Как уже сказал HonkyTonk, в комментариях написано: подготовьте фиктивное изображение. Я предполагаю, что вас может смутить точно , как создается фиктивное изображение, особенно если вы не знакомы с цветовым пространством YUV/YCbCr. Read the Wikipedia treatment for the basics.

Многие видеокодеки работают в цветовом пространстве YUV. Это часто путает программистов, которые используются только для работы в RGB. Исполнительное резюме состоит в том, что для этого варианта (YUV 4: 2: 0 planar) каждый пиксель на изображении получает образец Y (обратите внимание, что цикл Y итерации по каждой (x, y) паре), а 2x2 пиксельных квадрата каждый поделиться образцом U/Cb и образцом V/Cr (уведомление в седьмом месяце, что итерация имеет ширину/2 и высоту/2).

Похоже, что сгенерированный шаблон является своего рода градиентом. Если вы хотите произвести известное изменение, установите Y/Cb/Cr равным 0, а фиктивное изображение будет зеленым. Установите Cb и Cr на 128 и установите Y в 255 и получите белый кадр; сдвиньте Y до 0, чтобы увидеть черный; установите Y в любое значение между ними, удерживая Cb и Cr на 128, чтобы увидеть оттенки серого.

4

Я поделился своим пониманием [Тихо поздно ответить!]

YUV420p:

YUV 420P или YCbCr, является альтернативой RGB repersetation, и он содержит 3

самолетов, а именно: Y (яркостной составляющей) U (Y, Cb) & В (Y, Cr) компоненты. [ans Y-Cb-Cr-Cg =

Константа, нам не нужно хранить компонент Cg, поскольку он обычно может быть вычислен.] Так же, как RGB888, для которого требуется 3 байта в пиксель, YUV420 требует 1,5 байта a pixel [@Find (

)

12 бит используются для того, что соответствует в каком отношении) Здесь P -строки для прогрессивных, что означает, что кадры прогрессивные, что означает, что V следует за U, U следует за Y и YUV Frame это массив байтов, просто !! Другим является I -уровень для чередования, означает, что УФ-плоские данные чередуются между данными плоскости Y определенным образом [@Find (Каким образом)]

Смежные вопросы