MSE(Mean Square Error)
2차원으로 표현하면
말그대로 오차의 제곱의 평균
오차가 작을수록 MSE가 작고 추측한 값이 원본에 가깝다
예측값과 실제값 차이의 면적의 평균
PSNR(Peak Signal to Noise Ratio)
= (해당채널의)픽셀최댓값-픽셀최솟값
만약 8bit gray이미지라면 255가 픽셀 최댓값, 0이 최솟값이므로 =255
MSE가 작을수록 높은 값을 가지므로, 손실이 적을수록 높은 값을 가진다. 즉 값이 높을수록 복원이 잘 된 것이라고 볼 수 있겠다
PSNR도 결국 MSE를 사용하는 것인데 어떤 차이가 있을까?
MSE는 단순히 두 이미지간의 Euclidean metric을 나타내는 것이고, 이는 peak intensity나 encoding bits의 수를 모르면 의미가 없다. 상대적인 정도를 알 수 없기 때문이다.
e.g. [0 1]의 값을 가지는 이미지와 [0 255]를 가지는 이미지의 MSE가 똑같이 240이라면, 이는 같은 중요도를 가지지 않을 것이다.
따라서 PSNR에서는 peak intensity를 사용함으로써 이러한 문제를 해결하는 것이다
간단히 말해 ‘값'이 아닌 ‘비율'로써 나타내는 것이라고 이해할 수 있을 것 같다
또한 log연산으로 적은 숫자로 값을 나타낼 수 있는 것도 MSE와의 차이라고 할 수 있겠다.
RGB 이미지 ( 3채널 이미지 ) 같은 여러 채널을 가진 이미지에서 PSNR 구하기
SSIM(Structural Similarity Index Map)
수치적 에러가 아닌 인간의 시각적 화질 차이 및 유사도를 평가하기 위해 고안한 방법
사람의 시각시스템은 이미지의 구조정보 도출에 특화되어있기 때문에 구조정보의 왜곡 정도가 지각에 큰 영향을 미친다는 것이 SSIM의 핵심 가설
원본 이미지 A와 왜곡된 이미지 B가 있을 때 SSIM은 두 이미지의 휘도, 대비, 구조를 비교한다.
어떠한 이미지 x와 y를 비교할 때
: size of the range of pixels ( 8bit 이미지라면 255 )
1.
휘도(luminance) : 빛의 밝기를 나타내는 양
이미지의 픽셀값의 평균을 구해 그것을 휘도라고 생각
•
Weber’s law와 일관성이 있음
비교수식
2.
대조(contrast) : 이미지 내 빛의 밝기가 극적으로 바뀌는 성질
이미지의 표준편차 값을 이미지의 대비로 정의
표본표준편차이기에 로 나눈다
비교수식
3.
구조 ( structure ) : 픽셀들의 상대적 위치가 만들어내는 성질
이미지에서 평균 휘도를 빼고, 표준편차로 나눠 정의한다.
이러한 식으로 표현되는 이미지의 구조 간의 상관계수를 구하는 것이 A와 B의 상관계수를 구하는 것이 등가라고 판단하고 이미지 A와 B의 상관계수를 구해 구조를 비교한다
SSIM
의 default값은 1이다
globally 하게 쓰는 것 보다 ( 이미지 전체에 대해 쓰는 것보다 ) regionally하게(이미지 일부에 대해) 쓰는 것이 더 효과가 좋다고 한다
•
이미지의 통계적 특성은 ROI따라 달라지기 때문
•
이미지 왜곡의 특성이 이미지 전반에 일정하지 않기 때문
•
사람의 시각시스템도 이미지 전체가 아닌 일부에 집중하는 경향이 있기 때문
•
여러 조합의 ROI를 분석할 수 있어 더 다양한 분석이 가능함