2021年04月23日

【動画エンコード】ビットレート配分とマクロブロックと心理的エンハンストの基本理解

↓2)記稿.2021/04/23

 ‥動画エンコードの説明では
 Iフレーム、Pフレーム、Bフレームに分解する説明だけはよくされている
 だが、圧縮の品質に付いての説明は、それだけでは不十分なのに
 なぜか、そこから先の説明に関しては、口を濁して自信喪失している記事が多い


 ‥圧縮の品質を上げるには
 ビットレートを増やす事が最重要ではあるにしても
 折角増やしたビットレートが、どのように割り振られているかを理解しておく必要がある


> まず、映像の一枚一枚を
> ピクセル単位からマクロブロック単位に置き換える
> (是により、マクロブロック単位で割り切れない端数すぎる解像度を使用できない)


 最終的にビットレートの配分は、マクロブロック単位へと切り分けられる(QP)
 この時、特定のマクロブロック単位へのビットレート配分が少なすぎていると
 問答無用で、所々で形を有していないピンボケ状態の格子に堕ちる

 でもだからといって
 全体により多くのビットレートの割り振りをするのは非効率である
 ということから、マクロブロック単位内での再度割り振りをやらかす仕組みが(AQ)だ

 これはどんなにビットレートを割り振ろうと
 それぞれのマクロブロック内でピッタリとした細かさの構成は難しいのだから
 過不足の発生はやむを得ないのだから、AQをオフにしては損だとしたアルゴリズム理解だ


> この時、平均的なQP配分だけに縛られていると
> AQ内割り振りの段階で、無駄に多すぎるパターンが発生しがちのままになる
> そこで、この無駄とされる部分を如何に減らして
> その分をより必要とする動きや複雑さにビットレート配分を回せるか‥
> とした技術的な課題が付きまとう


 ‥一見これの理屈にどハマりすると
 AQ効果をより発生させずにQP配分を器用にやらかしたい
 とした問答に映らなくもないのだが‥
 (始めっからそんなの無理、それが非可逆圧縮だ)

(そこで存在していたのが2パスの立ち位置だったということになるらしい‥)

(だが庶民の視覚能力はスカポンタンだったのでそうにはならなかった‥)
(というか技術者側の生活保護にも黙りを決め込んでいたオチだろう)
(技術者が自分たちの生活保護のために技術公開を黙秘しすぎるのは問題がある)



1-2)1

 ‥そもそものAQ効果には
 不足しがちなビットレート内で、どのように品質を保つのか?としたアイデアが求められている
 そこで持ち上げられた方向性が「心理的エンハンスト」とした表現だ
 心理的に見て劣化の不足を感じられない状態とは何か?としたブラックボックスだ

 (エンコーダがアップデートするとしたら、そういう部分ということになる)


 ‥そうであるなら、前提とした解像度×ビットレート量があってしかるべきであり
 そこから外れていた場合の効果は、非推奨×非効率的と思っておくのが筋である

(どんな技術者だって、すべてのエンコード設定を想定しているわけでは無い)
(自由に調整できるのは実験的に下調べするための措置であって、自由度の提案では無い)
(ここを勘違いしたままでいると、間違った視覚感覚を自分の感性に刷り込んで洗脳する事になる)


> だがしかし、技術者の多くは
> 揃いも揃って、時にはとんでもない勘違いをやらかしたりする


 ‥そもそもが、QPとAQに基づいた調整で
 それの配分をどうするのかとした様々な見解があるというのに
 その上、適切なビットレートとした見解はケースバイケースだしするから
 検討不十分で経験的でしかない範疇であるにもかかわらず

 なぜか何気に、量子化済みの映像に対しても同じ設定で大丈夫だと信じ込んでいたりする

 マスター映像から量子化するのに、調整された基本的な設定で十分だとしても
 量子化された映像(非可逆化済み映像)を同じ設定で再エンコードしてしまえば
 同じ率での劣化の入れ子式になるのだから、どんどん劣化していくのが流れだ



1-2)2

> ‥とくに重要な要素だけを選り分けるとしたそれに対して
> それを選り分けるための調整を繰り返して、同じように出るわけが無い


 人間で言えば、選び抜かれたメンバーから、さらに間引いたチーム編成をする行為に等しい
 それで同じような活躍ができるとは誰も予想しないのにエンコードなら大丈夫とかキチガイだ
 (もとい、メンバーの数で無く、給料の額に置き換えたって良い)
 (AIなら問答無用でやってくれちゃたりするからって、それに呑まれてるようでは人間失格だ)


 ‥そこで投資家は、次のような思考をする事になる
 エンコーダーが同じままなのは、監督が同じままに等しい
 規格の想定が同じままに新しいアイデアを盛り込んでも、監督の采配はさほど変わらない
 ならば、パワーアップさせた規格にそって作り直そう
 (つまり、監督の交代‥ここでは工業規格の革新に沿わせた流れ)
 (野球で言えば、有能選手が大リーガーに行こうとしたりする)
 (俺の活躍の場はもっと上にあるとか何とか‥)


> すると、どんどん複雑に見えてきて、誰もが基本を見落とし始める


 ‥だが、やらかしている基本は
 解像度が変われば、想定されてきた心理的エンハンストの期待解釈も変わらざるを得ず‥
 まぁ確かにだからこそ、規格に沿った解像度やらビットレートやらの水準が求められる


 とはいえ、同じエンコーダーで再エンコードする場合の多くは
 より多くのビットレートの追加ぐらいしないと、同じ設定のままで上手く行くわけが無い

 例えば、カット&ペーストを基にした‥できる限り非可逆リップのそれの注入箇所の端数駒を
 数枚のIフレーム群で調整していたりするのが相場だろう
 (これは、再エンコード時にビットレートを追加するのと同じことだ)


 ‥ビットレートの不足は、そのままにより細かいマクロブロックの使用を端折るに等しい
 逆に言えば、マスター映像のエンコード時に用いられたマクロブロック数を下回るような
 再エンコードともなると品質の劣化はより激しくなる

 とくにバンディングやらカクつきの発生箇所では、マクロブロック数の不足が決定的だ
 不足がちなマクロブロックにどんなにビットレートを盛り込んでも
 マクロブロック一つ当たりの分解演算が複雑になりすぎ
 誤差でまくりですっきりとしないのがオチである


> どちら寄りのこだわりor妥協をするかの選択の自由があるだけで、自在とは限らない
> (規格の段階でそれはすでに始まっている)



posted by 木田舎滝ゆる里 at 15:09 | Comment(0) | 月下涙焉 | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。