- IMAXのAbdul Rehman博士が、Large Multimodal Models(LMMs)を統合した拡張ビデオエンコーディングの初期努力の知見を共有
- 技術論文セッションでは、4つの論文がエンコーダ最適化とフィルムグレイン処理に焦点を当てている
- エンコーダ最適化の論文は、複数プロファイルビデオ配信システムでビットストレージとトランスコーディングのトレードオフを最適化する手段と、Large Modal Model(LMM)を使用してコンテンツ認識エンコーディングの決定を成功裏に改善
- フィルムグレインについては、コーデックの効率性が向上するにつれてますます課題が増えており、芸術的効果のために映画監督がフィルムを選び続ける限り、解決が難しい問題である
- VVCで使用されているFilm Grain Synthesisシステムを説明する論文と、専門家の主観的評価からモデルをトレーニングして客観的な知覚評価尺度を生み出そうとする論文がある
この技術論文は、ビデオエンコーディングとフィルムグレイン処理に関する重要なテーマに焦点を当てており、ビットストレージとトランスコーディングのトレードオフを最適化する手段や、Large Modal Model(LMM)を使用してコンテンツ認識エンコーディングの決定を改善する方法などが提案されています。また、フィルムグレインの問題については、映画監督が芸術的効果のためにフィルムを選び続ける限り、解決が難しい課題として取り上げられています。
元記事: https://www.ibc.org/video/enhanced-video-coding-with-ai/11483.article