Publications

Detailed Information

컨텍스트 기반 산술부호화를 이용한 USAC에서의 엠펙 서라운드 모듈의 부호화 효율 개선 : Context-adaptive arithmetic coding scheme for lossless bit rate reduction of MPEG Surround in USAC

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

윤성용

Advisor
성굉모
Major
전기·컴퓨터공학부
Issue Date
2012-02
Publisher
서울대학교 대학원
Abstract
본 논문에서는 unified speech and audio coding (USAC)에서 사용되는 엠펙 서라운드 (MPEG Surround) 모듈에 대한 符號化 효율 향상 기법을 提案한다. USAC는 각각 音樂과 音聲 데이터에 대해서만 효율적인 符號化가 가능하던 기존 音樂, 音聲 코딩의 단점을 보완한 새로운 코딩 (coding) 으로서 최근에 엠펙 오디오 標準化團體에서 標準化가 진행되었다. 엠펙 서라운드는 다채널 신호를 모노 혹은 스테레오의 다운믹스 신호와 채널 간의 空間情報를 추출한 부가정보의 형태로 壓縮하여 전송, 복원하는 채널 확장 기술로서 주로 다운믹스 신호의 符號化 코덱 (codec) 과 함께 조합되어 사용된다. USAC에서 사용하는 엠펙 서라운드 모듈은 기존 엠펙 서라운드 모듈을 스테레오 입력신호에 적합하게 변경한 것으로서 채널간 레벨 差異, 채널간 相關係數, 채널간 位相 差異에 대한 空間 파라미터 데이터를 추출하여 이 데이터들의 無損失 壓縮을 위한 엔트로피 符號化 方法으로서 허프만 符號化 를 사용하고 있다.
본 논문에서는 기존에 사용하던 허프만 符號化 대신 컨텍스트 기반 算術符號化 기법을 사용하여 符號化 효율을 향상시킬 수 있음을 보인다. 먼저 사용할 컨텍스트를 決定하기 위해 空間 파라미터 데이터들에 대한 分布 특성을 分析하였고 그 결과 각각의 空間 파라미터 데이터들은 시간 축과 주파수 축에 대해 인접한 데이터들에 대해 밀접한 연관성을 가지고 있음을 확인하였다.
이 결과를 바탕으로 여러 가지 컨텍스트 決定方法 후보를 선정하고 각각의 컨텍스트 決定方法에 따른 엔트로피 比較를 통한 符號化 性能 예측을 통해 최적 컨텍스트의 후보를 決定하였다. 決定된 컨텍스트 후보 중 소요 메모리가 큰 경우에 대해서는 性能 差異가 크지 않으면서 실제 구현에 적합하도록 구현에 필요한 메모리를 줄인 變更案을 提示하였다. 각 컨텍스트 기법은 컨텍스트의 종류에 따라 사용 가능한 영역의 제약을 받는데 각 영역별 최적 컨텐스트 기법을 決定한 후 이들의 조합을 통한 性能 分析을 통해 최적의 方法을 提案하였다.
실험 결과 提案하는 方法의 符號化 壓縮效率는 空間 파라미터 데이터 基準 9.94%에서 12.16%, 엠펙 서라운드 비트列 全體 基準 8.65%에서 8.99% 정도 향상됨을 보였다. 절약된 비트는 코어 코덱 혹은 spectral band replication (SBR) 모듈 등의 다른 모듈에서 사용되므로 이를 통한 코딩 음질 향상을 기대할 수 있다.
We propose a new coding scheme for lossless bit rate reduction of the MPEG Surround module in unified speech and audio coding (USAC). MPEG Surround reconstructs multi-channel signals using mono or stereo downmix signals and spatial parameters. A modified version of MPEG Surround is also adopted as a channel expansion tool in USAC, which is in the standardization process in MPEG for consistent coding quality of both speech and audio signals at very low bit rate.
The proposed scheme is based on context-adaptive arithmetic coding for efficient bit stream composition of spatial parameters. Experimental results show that it achieves a significant lossless bit reduction of 9.94% to 12.16% for spatial parameters and 8.65% to 8.99% for the overall bit stream compared to the original scheme. Since MPEG Surround is used with a core codec which encodes and decodes downmix signals, the proposed scheme can contribute to the sound quality improvement of USAC by assigning the saved bits to the other modules in USAC.
Therefore the proposed method is expected to reinforce the performance of USAC if it is incorporated in USAC. It can also be applicable to other spatial audio codecs such as Spatial Audio Object Coding and Parametric Stereo with little modification.
Language
kor
URI
https://hdl.handle.net/10371/156642

http://dcollection.snu.ac.kr:80/jsp/common/DcLoOrgPer.jsp?sItemId=000000000661
Files in This Item:
There are no files associated with this item.
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share