Rate-Distortion-Optimization for Learning-Based Image

Fabian Brandfabian.brand@fau.de

Chair of Multimedia Communicationsand Signal Processing

Rate-Distortion-Optimization for Learning-Based Image Compression using Adaptive Hierarchical Autoencoders

Chair of Multimedia Communications and Signal Processing

Brand: Rate-Distortion-Optimized Learning-Based Image Compression 26.07.2021

Rate-Distortion Optimization

• Multiple decisions in traditional video coding– Block partitioning

– Prediction mode selection

– Quantization stepsize

– Many more …

• Selection according to rate distortion cost function𝐽 = 𝑅 + 𝜆𝐷

• Typically done by testing multiple settings

Adaptive Block Partitioning

• Block-based image and videocompression (e.g. HEVC, VVC)

• Block-size determines– Context for prediction

– Transform lengths

– Quantization stepsize

• Rule of thumb:– Small blocks for detailed content

– Large blocks for stationary content

• Adaptive partitioning greatlyincreases coding efficiency

Learning-Based Image Compression

• Main tool: Autoencoder

• Consists of Encoder network 𝑒(𝑥)and decoder network 𝑑(𝑧)

• Trained on equal input and output, e.g. using MSE

𝐿𝐷 = 𝑀𝑆𝐸 𝑥; 𝑥

• Entropy bottleneck betweenencoder and decoder

𝐿𝑅 = 𝐻 Ƹ𝑧

• End-to-end training possible

ǁ𝑧 = 𝑄(𝑧)

𝑧 = 𝑒 𝑥

𝑥 = 𝑑 ǁ𝑧

Rate-Distortion Optimization in E2E Compression

• Training on joint loss function𝐿 = 𝐿𝐷 + 𝜆𝐿𝑅

• „Static“ RDO

• No free parameters after training

– No possibility for „dynamic“ RDO

RDONet

• Compressive Autoencoder capable of coding at adaptive depth

• Compression after 4, 5 or 6 downsampling steps

• Decision on block-level

• Compression as whole image

• No block division

• No block artifactsSide Information per block

Brand, Fischer, Kaup: „Rate-Distortion-Optimized Image Compression using an adaptive hierarchical autoencoder with conditional hyperprior“, CVPR 2021

Latent Space Units

• Downsampling on encoder side

• Upsampling on decoder side

• Transmitting masked latent space

• Redundancy from lower LS-Unit

– Transmit conditional to previouslayer

Next LS-Unit

Conditional Hyperprior

• Compression of each latent spacewith hyperprior

– Separate autoencodertransmitting pdf for latent space

• Replace hyperprior autoencoderwith conditional autoencoder

• Reducing redundancy fromprevious latent space

Summary of Network

Coding on different levels of autoencoder possible

Level externally adjustable on block-level

Conditional coding to reduce redundancy between levels

Rate-Distortion Optimization in E2E Compression

• Training on joint loss function𝐿 = 𝐿𝐷 + 𝜆𝐿𝑅

• „Static“ RDO

• No free parameters after training

– No possibility for „dynamic“ RDO

• Externally controlled depth

• Test different depthconfigurations and pick best

RDO Search

• Initialize image coding with lowest latent space

• Test if higher latent space yields better RD-behavior

• Optimizing each 64x64 area individually– Global search not feasible

– Global optimum not found

• Solution: 2-pass RDO– Initialize with result of first pass

Experiments

Training

• Train on CLIC Intra + DIV2K + TECNICK

• Random choice of LS depth

• Train for 2000 epochs

• Train on MS-SSIM and MSE

– MSE needed for stability

𝐿train = 𝐷ms−ssim + 0.1 ⋅ 𝐷mse + 𝜆𝑡𝑅

• Evaluate on CLIC Intra test set

• Compare 1-pass and 2-pass RDO

• Compare against standard 4 layerautoencoder with hyperprior andcontext model

• MS-SSIM as distortion metric

𝐿RDO = 𝐷ms−ssim + 𝜆𝑒𝑅

Visual Example

Example Block Partitioning (Dark: Small blocks, high level)

Visual Example

𝜆𝑒 = 1 𝑟 = 0.096𝑏𝑝𝑝

Visual Example

𝜆𝑒 = 0.5 𝑟 = 0.104𝑏𝑝𝑝

Visual Example

𝜆𝑒 = 0.25 𝑟 = 0.119𝑏𝑝𝑝

Visual Example

𝜆𝑒 = 0.125 𝑟 = 0.136𝑏𝑝𝑝

Visual Example

𝜆𝑒 = 0.0625 𝑟 = 0.141𝑏𝑝𝑝

Visual Example

𝑟 = 0.141𝑏𝑝𝑝

Standard Autoencoder

Results

• Five rate-points per model

– RDO allows multiple rate points per model

– Optimal behavior if 𝜆 match in training and RDO

• Pick one rate point per modelfor final evaluation

Results

• Rate savings over compressionwithout RDO

• Additional gains by 2-pass RDO

• 7.7% rate saving on average

• Up to 22.5% for single imagesBD-Rates for entire CLIC validation set

1-pass 2-pass

Worst Case +7,5% +3.5%

Best Case -18.8% -22.5%

Average -4.1% -7.7%

Conclusion

• RDONet enables RDO similar to adaptive block partitioning

• Saving 7.7% rate compared to standard autoencoder

• Increase visual quality by adaptive bit allocation

• Transferring concept from traditional video compression toend-to-end image coding

Rate-Distortion-Optimization for Learning-Based Image

Documents

IEEE TRANSACTIONS ON CYBERNETICS 1 Rate and …blueyetechnologies.co.in/wp-content/uploads/2017/08/Rate-and... · Rate and Distortion Optimization for Reversible Data Hiding Using

Rate-distortion optimization for progressive compression ... · using a connectivity-based Karhunen-Loeve transform and a bit plane coder for the geometry encoding. Rate-distortion

Improving the Rate-Distortion Performance in Distributed

Rate-distortion Optimization for MP3 and AAC Audio Coding with Complete Decoder Compatibility

Optimization of Angular Distortion on Weld Joints Using

Lossy compression - web.stanford.edu · Bernd Girod: EE398A Image and Video Compression Rate Distortion Theory no. 3 Rate distortion theory calculates the minimum transmission bit-rate

Rate-Distortion-Complexity Optimization of Video Encoders

Rate Distortion Theory - Home page Matematickog fakulteta

Rate, Distortion and Complexity

Joint Sampling Rate and Quantization Rate-Distortion

Rate Distortion Optimized Streaming

Characterizing Generalized Rate-Distortion Performance of

MPEG-4 and Rate-Distortion-Based Shape-Coding Techniques · MPEG-4 and Rate-Distortion-Based Shape-Coding Techniques ... rate-distortion theory, shape coding, video coding ... ventional

Lec11 rate distortion optimization

J30 DAC Transisiton Distortion, Jitter, Slew Rate

Delay-Power-Rate-Distortion Optimization of Video

Real-Time Rate Distortion Optimization of Wireless Video

Optimization of Quadtree Segmen of quadtree segmentation and hybrid... · Optimization of Quadtree Segmen tation and Hybrid 2D and 3D Motion Estimation in a Rate-Distortion F ramew

Rate-Distortion Optimization for Video Compression - …fp/cav/Additional_material/RD Optimization for... · he rate-distortion efficiency of today‘s video compression schemes is

Effect of Spray Quenching Rate on Distortion and Residual ...fluxtrol.com/...spray-quenching-rate-on-distortion-and...stresses.pdf · Effect of Spray Quenching Rate on Distortion