2020年02月02日

【心理的エンハンス】やり繰りタイプと増量タイプのそこんところ

↓2)記稿.2020/02/02

> 心理的エンハンス:やり繰りタイプ(AQモードとAQ強度)
> 心理的エンハンス:増量タイプ(Psy-RD強度とPsy-Trellis強度)


‥やり繰りタイプとは、マクロブロックに割り振られたビットレート内で
 高周波部分(細かい箇所)と低周波部分(平板な箇所)で、QP値の配分を変えるアイデア

 見かけ上の品質が向上したように見えるが、やり繰りだけでしかないので
 実質的にはボリュームを欠いたままに仕上がる、基本はビットレートを上げるのが筋である

 ゆえに、AQ強度の値の変更は
 ビットレートを上げたくない低画質向けの無理矢理な用途向けに欠かせなくなるが
 通常においても、見映えの基準に則した強度で機能している


‥増量タイプは、割り振られたCRF値を全体の平板さの基点として捉え
 所々の高周波部分で不十分と判断されれば、増量を厭わずに低いQP値を盛り付けて画質を上げる

 一般にボケるし、増量するし、効果が分かりにくいことから
 AVCエンコードにおける嫌われ者、又は出来損ないの扱いにあるが
 設定のバランスさえ良ければ、それの効果を十分に得ることが可能だった

 (効果を十分に得るには、各項目設定でのバランスが欠かせない)


 ‥一般に、CRF値を下げると演算負荷が増大するに比例して処理時間も増加するが
 効果が伴うと
 キッチリに演算負荷を増やさずとも、それより−3程度低いCRF値印象を与えることができる
 結果、より少ない時間で且つそれほどに増量もせずに想定する同等の画質を得ることが可能となる


> これを、ここではTRANS-AM(トランザム)効果と呼んでおこう


 ‥トランザム効果を得るには
 psy_rd(1.00:0.00)→ psy_rd(1.00:1.00)が機能するバランスが求められる

 ソースの質や解像度によっても、CRF値の適値が異なるらしい(調査中)



1-2)1

> 心理的エンハンスとは
> 高周波部分(細かい箇所)と低周波部分(平板な箇所)で、QP値の配分を変えるアイデア


 ‥それの操作を行うには、まず3つの要素が欠かせない
 まず全体でのぼかしの平均度合いを決める必要がある(CRF値とqcomp値による配合)
 次に、再分解の度合い(ぼかし)と再構成の度合い(忠実性)である
 (Psy-RD強度とPsy-Trellis強度(psy_rd(1.00:0.00)))


 ‥絵画的に解釈すれば
 エンコードされた画は、均等にボケているフラクタル図形に喩えることができる
 それは、CRF値とqcomp値による配合によって決まってくる
 次に、それの細部をさらに盛り付け直す為のぼかしの階調程度を決める(同じでは意味が無い)
 次に、それにどれだけ忠実度を付け足すのかを決めることが欠かせない

 当然、盛り付け直す為のぼかしの階調程度と盛り付ける忠実度は、1:1が適当だろう
 (それが理論での見方になる)


 ‥一般的にビットレート量を決める扱いのCRF値とqcomp値の間には
 見た目の美しさがどうなるかまでを織り込んでいない
 そのような均一な発想のビットレートの配分のままだと
 忠実性を要求すればするほど、多くのビットレートを要求するままに填まり込む

 だがそれだけでは、とても時間が掛かるし、精度を求めればそれだけ果てしなく増量してしまう

 そこで、高周波と低周波の違いを選び出し
 再構成の度合いを変えて組み合わせれば良いとしたのが心理的エンハンスのそもそもである


> この時、二つの考え方が生じた


 1、最終的なマクロブロック内でのビットレートの割り振りを
 高周波と低周波に分けてやり繰りする方法
 2、CRF値とqcomp値の配合を全体の平均的な平板さとして扱い
 それより多くの高周波を感知できる部分に対して、より低いQP値を割り振る方法(増量)


‥1のやり繰りタイプは
 ボケてるだろう高周波部分を宛がわれたビットレート内で再構成するだけなので
 見かけ倒しの範囲は否めない
 (規格でAQ強度の程度が決まっていると、つまみやフィルターで調整可能の扱いにしてしまえる)
 (そのような造りなら、あえて弄らないのも手だが、テレビ以外では画質を適正化処理できない)
 (だからといって無理を通すと、今度は、テレビでの美麗調整が効かなくなりかねない)
 (但し始めから、劣化ありき程度の画質での扱いならAQ強度の値の変更も選択肢とされる)

‥2の増量タイプは
 ボケてるだろう高周波部分に対して、改めてビットレートを割り振る
 ただし、単にビットレートを割り振るだけでは増量感に際限が無くなってしまうので
 それの度合いを自由に決められないのではお話にならない
 ‥それでも、どれほどに増量されるかは、基本となるCRF値でまったく異なる
 だから、比較的手頃な平板さの得られる程度のCRF値を下地に扱うことがポイントになってくる


(ただし、心理的エンハンスには、十分なビットレートを宛がっていれば無用論がついて回った)
(それでなくても、エンコード容量を削る為のアイデアが優先されていた)


 ‥機能するはずの理論だったとしても
 しかし実際にやってみるとうまく行かないケースがほとんどだったので
 増量タイプの扱いは、お蔵入り状態と化したのだろう
 結果、一般的に知られるのは、標準的なやり繰りをする上でのぼかしの程度の用意だけになった

 つまり、psy_rd(1.00:0.00)は
 ぼかしの効果だけで、細部の細かさを表現している状態だ
 だから、Psy-RD強度をあげればあげるほどに品質が劣化したようにも数値確認される


 ‥そもそものPsy-RD強度の値は
 画面サイズを問わずに安定した色合いを確保する上で欠かせない要素にある

 無理な値の変更は、そこから逸脱するだけなので変えない方が良い
(19型と26型でさえ差が生じ、比較する度に違和感が拭えなかった‥原因判明ですっきり‥)


> もう片方の値、Psy-Trellis強度が、なぜうまく機能しないできたのかというと
> 適切な平板さを確保できていなかったからだ
> それの理由として、AVC規格開発当時の一般的な処理性能がずっと低かった点があげられる


 (とどのつまり、デフォルトの推奨値の中に未成熟値が含まれていた)
 (しかしまぁ撮影用カメラ向け精度として申し分ないなら誰も疑うことをせずままだろう)


 ‥まずP4x4がうまく効いていないのではお話にならないらしい‥

 その為にも、I4x4を効かすべく、Iフレームの数をケチっていてはお話にならない
 その為にも、十分な動き推測なり、IフレームとPフレームの位置選択の精度が欠かせない
 だが誰も彼も、そこを疎かにしてきているか、若しくは的外れだったりが実際の所だろう


 ‥ちなみに、psy_rd(1.00:1.00)の適性はFHDサイズまでに思われる
 1:1を理屈とするなら‥HEVCの場合、Psy-RD強度のデフォルトは(2.00)で有ることから
 psy_rd(2.00:2.00)が適当とした予想になる

 だから、AVCで4k映像に仕立てようと思えば
 psy_rd(2.00:2.00)を、一度ぐらいは試してみるのも面白そうではある



1-2)2

> TRANS-AM(トランザム)‥ガンダム用語
> 蓄積されたGN粒子を放出して一次的に機体性能の三倍を得る
> ただし放出後は、なぜか機体性能が通常以下になり果てる
> この失速性の原理を物語りでは細かく語っていないが、ダムの放流に例えることができる
> ダムには常時、川の流れがある、しかし溜めないと使い物にならないのもダムの構造
> 一定量に溜まるまでが大事、溜まってしまえば通常使用が可能
> (ダムの安全性からも分かるが、常に限度上限まで溜めて使用するまでの意図も用も無い)


 ‥ところで蓄積されたGN粒子って、どこに溜まってんの?‥

 その辺りの尽きない謎はさておき

 TRANS-AM(トランザム)を呼称するには、何らかの要素を3倍にして盛らにゃならん
 (そこに個人的なギャグが発生していた)

 ‥0.67×3=2.01
 psy_rd(0.67:0.00)の中身の3倍値 → psy_rd(1.00:1.00)
 1+1=2≒2.01‥(ンゴwww)



posted by 木田舎滝ゆる里 at 01:20 | Comment(0) | 黄岐の果ての黄嶺 | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。