Uygulamanız için doğru kare sayısını seçiyor olmak önemlidir ancak ne zaman 10,15,20,30,hatta 60 kare seçilmeli bunu anlamakta oldukça önemlidir.
Bu bölümde ele alacak olduğumuz başlıklar :
- Frame kavramı
- Enstantane hızı ve Kare Hızı: Bu ikisi nasıl ilişkilidir?
- Bant genişliği vs kare hızı : kare hızının artışına bağlı olarak bant genişliği nasıl artar ?
- Ortalama kullanılan kare hızları : endüstri ortalaması nedir ?
Frame Kavramı ve doğru frame seçimi :
Obje ne kadar hızlıysa, hareketi kaçırmak o kadar muhtemeldir. Güvenilir bir yakalama için kaç frame gereklidir ?
20 metre genişlikte FOV,
60Km/s hızla giden araç olduğunu düşünelim.
Kameramız saniyede 8.3 fps yakalayabiliyor olsun. Bu durumda bu aracı kaç karede görebiliriz ? Aslında frame değerini belirlerken yaklaşımımız senaryomuza göre olmalıdır.
60 Km/s = 16.6 m/s
Bu araç 20 metre genişlikteki FOV’u V=X/t formülüne göre;
t=1.2 sn
20 metre genişlikteki FOV, 60Km/saat hızla giden araç tarafından 1.2 saniye içinde tamamlanacaktır.
Bu alan içinde araç kaç frame’de görüntülenir sorusunun yanıtını arayalım.
Kamera 1 saniyede 8.3 frame yakalayabiliyorsa, 1 frame’i 0.12 saniyede yakalar.
= 1.2 / 0.12 ~= 10 frame’de görüntülenir.
Not : Ancak görüş açısı daraldığında aynı zamanda fps değeri düşükse, kısa mesafeden görüş yapılan uygulamalarda fov değeri azalacağından, obje görüleceği kare sayısı da azalacaktır.
Eğer 30 Frame ile izleme yapıyor olsaydık,
Kamera 1 saniyede 30 frame yakalayabiliyorsa, 1 frame’i 0.03 saniyede yakalar.
= 1.2 / 0.03 ~= 40 frame’de görüntülenir.
Standart bir insan ortalama 5km/saat hızla yürür. Bu hızı m/sn cinsine dönüştürürsek, 1.38 m/sn sonucu çıkar.
Yaklaşık 7.2 saniyede FOV’dan çıkmış olur.
217 frame elde edilecektir.
https://everysecond.io/frames-per-second adresinde saniyede yakalanan kare hızlarına göre animasyon bulunuyor.
Bu yakalama işlemi esnasında I frame değeri, shutter speed gibi parametreler frame’in kalitesi ile doğrudan etkili faktörlerdir.
Yüz yakalama ve FPS ilişkisi :
Insan vücudunda kafa bölümü en hareketli kısımlardan birisidir. Düşük kare sayısı, doğru yüz resminin elde edilmesini zorlaştıracaktır. En iyi yüzün yakalanabilmesi için kare sayısı ne kadar çok olursa, yüz o kadar çok kare içinde detect,grading,selecting yapılacaktır.
Shutter speed vs Kare sayısı :
Frame değeri bulanıklığa sebep olmaz. Bu yanlış bir düşüncedir. Kameranın otomatik shutter hızı kontrol eder.
Eğer bulanıklık/blur problemi varsa, shutter speed konfigürasyon problemidir. Frame değeri ile ilgili değildir.
Öte yandan, bazen kullanıcılar veya kamera üreticileri varsayılan olarak maksimum shutter’I, kare hızından daha düşük bir hıza ayarlamak isterler (örneğin, 1/30s kamera için 1/4s deklanşör). Bu sadece hareketli nesnelerin bulanıklaşmasına neden olmakla kalmaz, aynı zamanda kareleri de kaybedersiniz.
Saniyedeki kare hızı hiçbir zaman saniyedeki poz sayısından yüksek olamaz. 1/4s’lik bir shutter varsa, shutter/ pozlama yalnızca saniyede 4 kez açılır ve kapanır (yani, 1/4s + 1/4s + 1/4s + 1/4s = 1s). Bu sadece 4 kez olduğu için, o saniyede sadece 4 kareye sahip olabilirsiniz.
Bazı üreticiler fake frame yaparlar. Aynı frame’I tekrar tekrar kopyalar.
Bant genişliği vs Frame:
Frame değeri, bant genişliğini etkiler. Modern kodekler için H.264,H.265 gibi lineer değildir tam olarak. Örneğin frame değerini 1’den 10’a çıkardığınızda, bant genişliğindeki artış muhtemelen daha 10 kat olmayacak daha az olacaktır.
Bunun nedeni, kareler arasında aynı kalan sahne bölümleri için bant genişliği ihtiyaçlarını azaltan kareler arası sıkıştırmadır. (inter-frame compression)
Yaygın olarak kullanılan Frame değerleri :
Endüstri ortalaması saniyede 15 karedir. Bu değer hem storage maliyetlerini azaltırken, yeterli kareyi de yakalıyor.
I frame, P frame, B frame Kavramları :
I frame : en az sıkıştırılmış olan karelerdir, ancak kodun çözülmesi için başka video karelerini gerektirmez.
P frame : sıkıştırmayı açmak için önceki karelerdeki verileri kullanabilir ve I-karelerden daha fazla sıkıştırılabilir.
B frame: En yüksek miktarda veri sıkıştırmak için veri referansı için önceki ve sonraki karelerin her ikisinide kullanır.
Bir I frame (Intra coded frame), eksiksiz bir görüntüdür, JPG veya BMP gibi bir görüntü dosyasıdır. P ve B frame’ler görüntü bilgilerinin yalnızca bir kısmını (kareler arasında değişen kısım) tutar, dolayısıyla çıktı dosyasında bir I frame’den daha az alana ihtiyaç duyar.
Bir P-kare (Öngörülen resim), yalnızca önceki kareden görüntüdeki değişiklikleri tutar. Örneğin, bir arabanın sabit bir arka planda hareket ettiği bir sahnede, yalnızca arabanın hareketlerinin kodlanması gerekir. Kodlayıcının, değişmeyen arka plan piksellerini P-çerçevesinde saklaması gerekmez, böylece alandan tasarruf edilir. P-kareler aynı zamanda delta-kareler olarak da bilinir.
Bir B karesi (Çift yönlü tahmin edilen resim), içeriğini belirtmek için geçerli kare ile önceki ve sonraki kareler arasındaki farkları kullanarak daha da fazla alan kazandırır.