Sonic Visualiser 음성 분석 방법
Sonic Visualiser 포렌식 분석 매뉴얼
WAV 파일 편집점 탐지 및 진정성 검증을 위한 실무 가이드
목차
1. 소프트웨어 다운로드
Sonic Visualiser 본체
| 항목 | 내용 |
|---|---|
| 공식 다운로드 | https://www.sonicvisualiser.org/download.html |
| 현재 버전 | v5.2.1 (2025년 3월 기준) |
| 지원 OS | Windows / macOS / Linux |
| 라이선스 | GNU GPL (무료) |
보조 메타데이터 분석 도구
| 도구 | 다운로드 | 용도 |
|---|---|---|
| MediaInfo | https://mediaarea.net/en/MediaInfo | 오디오 스펙, 인코딩 정보 |
| ExifTool | https://exiftool.org/ | 파일 메타데이터 전체 분석 |
2. 플러그인 다운로드 및 설치
2-1. 통합 패키지 (권장 - 먼저 설치)
| 플러그인 | 다운로드 | 포함 내용 |
|---|---|---|
| Vamp Plugin Pack | https://www.vamp-plugins.org/pack.html | QM, pYIN 등 대부분 포함 |
✅ Vamp Plugin Pack 하나만 설치해도 포렌식 분석에 필요한 플러그인 대부분이 포함됨
2-2. 개별 플러그인 (추가 필요 시)
| 플러그인 | 다운로드 | 주요 기능 |
|---|---|---|
| QM Vamp Plugins | https://code.soundsoftware.ac.uk/projects/qm-vamp-plugins | Onset Detector, Segmentino, MFCC |
| QM Plugins GitHub | https://github.com/c4dm/qm-vamp-plugins | 바이너리 직접 다운로드 |
| pYIN | https://code.soundsoftware.ac.uk/projects/pyin | 정밀 피치/주파수 추적 |
| pYIN GitHub | https://github.com/c4dm/pyin | 소스코드 및 바이너리 |
| 전체 플러그인 목록 | https://www.vamp-plugins.org/download.html | 카테고리별 검색 가능 |
2-3. 설치 경로
Windows:
C:\Program Files\Vamp Plugins\
macOS:
/Library/Audio/Plug-Ins/Vamp/
또는
~/Library/Audio/Plug-Ins/Vamp/
Linux:
/usr/lib/vamp/
또는
~/.vamp/
2-4. 설치 순서
1단계. Sonic Visualiser 설치
2단계. Vamp Plugin Pack 설치 (QM + pYIN 포함)
3단계. 부족한 플러그인 개별 설치
4단계. Sonic Visualiser 재시작
3. 플러그인 활성화 확인
3-1. 설치 인식 확인
상단 메뉴 → Transform → Information about Installed Plugins...
목록에 플러그인이 표시되면 정상 인식된 것
3-2. 플러그인이 안 보일 때
메뉴 → Edit (macOS: Preferences) → Preferences
→ Plugins 탭
→ Add path → Vamp 플러그인 폴더 수동 추가
→ Sonic Visualiser 재시작
3-3. 빠른 플러그인 검색
Transform → Find a Transform...
→ 검색창에 키워드 입력 (예: "flux", "onset", "pitch")
4. 포렌식 분석 워크플로우
4-1. 전체 흐름
[파일 열기]
↓
[전체 파형 스캔 - 이상 구간 파악]
↓
[Spectrogram 추가 - 시각적 확인]
↓
[QM Note Onset Detector 실행 - 1차 탐지]
↓
[Expressive Means Spectral Rise 실행 - 2차 탐지]
↓
[두 레이어 겹쳐서 교차 검증]
↓
[의심 구간 확대 및 청각 확인]
↓
[결과 CSV 내보내기]
↓
[메타데이터 분석 (ExifTool/MediaInfo)]
↓
[보고서 작성]
4-2. 파일 열기
File → Open → WAV 파일 선택
4-3. 스펙트로그램 추가
Layer → Add Spectrogram
-
파형 위에 주파수 색상 레이어 겹쳐짐
-
색상이 갑자기 바뀌는 수직 경계선 = 편집 의심 구간

5. 플러그인별 설정 가이드
5-1. QM Note Onset Detector (1순위 - 핵심)
실행 경로:
Transform → Analysis by Category → Time → Onsets
→ Note Onset Detector [Queen Mary, University of London]: Note Onsets
권장 파라미터 설정:
| 파라미터 | 권장값 | 이유 |
|---|---|---|
| Program | 비워두기 (기본값) | 수동 제어 |
| Onset Detection Function Type | Complex Domain | 위상+진폭 동시 분석, 편집점 탐지 최적 |
| Onset Detector Sensitivity | 35% | 확실한 불연속점만 탐지, 오탐 감소 |
| Adaptive Whitening | ✅ 체크 | 배경 잡음 변화 감지 |
Sensitivity 가이드:
2040% → 확실한 불연속점만 (포렌식 권장)
50% → 기본값
70100% → 작은 변화도 모두 탐지 (오탐 많음)
함께 실행 권장:
Note Onset Detector: Onset Detection Function
→ 탐지 신뢰도 수치 확인 가능
5-2. Expressive Means (advanced): Spectral Rise (2순위 - 교차검증)
실행 경로:
Transform → Analysis by Category → Onsets and Boundaries
→ Expressive Means (advanced): Spectral Rise Onset Detection Function
또는
Transform → Find a Transform → "spectral rise" 검색
권장 파라미터 설정 (음성 녹음 기준):
| 파라미터 | 권장값 | 이유 |
|---|---|---|
| Normalise audio | ✅ 체크 | 볼륨 차이 무시하고 분석 |
| pYIN: Yin threshold distribution | Beta (mean 0.15) | 기본값 유지 |
| Spectral detection range minimum | 300 Hz | 음성 대역 집중, 마이크 노이즈 제외 |
| Spectral detection range maximum | 3400 Hz | 음성 최대 대역으로 제한 |
| Minimum onset interval | 200 ms | 짧은 오탐 감소 |
| Moving pitch average window | 150 ms | 기본값 유지 |
| Onsets: Use pitch | ✅ 체크 | 피치 변화도 함께 탐지 |
음성 대역 설정 이유: 사람 목소리는 300~3400Hz 대역. 이 범위로 제한하면 마이크 착용/탈착 노이즈 오탐이 크게 줄어듦
5-3. Aubio Onset Detector (보조 교차검증)
실행 경로:
Transform → Analysis by Category → Time → Onsets
→ Aubio Onset Detector: Onsets
-
QM과 다른 알고리즘 기반
-
두 결과가 같은 지점을 가리키면 편집 가능성 높음
5-4. Zero Crossing Rate (보조)
실행 경로:
Transform → Analysis by Category → Low Level Features
→ Zero Crossing Rate
-
파형 특성 변화 탐지
-
Onset Detector 결과와 교차 확인용
5-5. Segmentino (구간 자동 분할)
실행 경로:
Transform → Analysis by Category → Segmentation
→ Segmentino
-
오디오를 자동으로 구간 분할
-
편집된 구간은 다른 세그먼트로 분류되는 경향
6. 결과 해석 방법
6-1. 레이어별 의미
| 레이어 | 표시 방식 | 의미 |
|---|---|---|
| 파형 (Waveform) | 파란 파형 | 원본 오디오 진폭 |
| 스펙트로그램 | 녹색/노란색 열지도 | 주파수별 에너지 분포 |
| Onset Detector | 수직 마커선 | 불연속점 위치 |
| Spectral Rise Function | 점/그래프 | 스펙트럼 급변 수치 |
6-2. 스펙트로그램 색상 해석
| 색상 | 의미 |
|---|---|
| 빨강/주황 | 에너지 강한 저주파 |
| 노랑/녹색 | 중간 에너지 중주파 |
| 파랑/검정 | 에너지 약한 고주파 또는 무음 |
6-3. 편집점 신뢰도 판단
QM Onset 마커 + Spectral Rise 마커가 같은 지점 → 높은 신뢰도
한쪽만 마커 → 낮은 신뢰도 (단순 음량 변화 가능성)
마커 없이 스펙트로그램 색상만 변화 → 크로스페이드 편집 의심
7. 편집점 의심 패턴
7-1. 스펙트로그램에서 보이는 패턴
| 패턴 | 의미 |
|---|---|
| 수직으로 색이 급변하는 경계선 | 가장 명확한 편집점 |
| 고주파 성분이 갑자기 사라지거나 생김 | 다른 마이크/환경 녹음 이어붙임 |
| 전체적인 밝기(에너지)가 갑자기 달라짐 | 볼륨 조작 또는 편집 |
| 배경 노이즈 색상/패턴이 바뀜 | 다른 환경에서 녹음된 구간 삽입 |
7-2. 파형에서 보이는 패턴
| 패턴 | 의미 |
|---|---|
| 진폭이 갑자기 달라지는 지점 | 다른 녹음 구간 이어붙임 |
| 무음 구간 후 갑자기 신호 시작 | 무음 삽입 또는 편집 경계 |
| Onset 마커 간격이 갑자기 바뀜 | 다른 화자/환경 구간 |
7-3. 자연스러운 변화와 구별법
| 자연스러운 변화 | 편집 의심 |
|---|---|
| 화자 침묵 후 재개 | 말이 이어지는데 스펙트럼 급변 |
| 말 속도/톤 변화 | 배경 노이즈 패턴이 달라짐 |
| 마이크 착용/탈착 노이즈 | 두 플러그인 모두 같은 지점 마킹 |
주의: 전문 편집 툴(Adobe Audition, Logic Pro 등)로 크로스페이드 처리된 경우 귀로는 구분 불가능. 스펙트럼 분석 필수.
8. 결과 내보내기
8-1. 타임스탬프 CSV 추출
File → Export Annotation Layer
→ CSV 형식으로 저장
→ 편집 의심 타임스탬프 목록 추출
8-2. 스크린샷 저장
의심 구간 확대 후
File → Export Image (또는 화면 캡처)
→ 보고서 첨부용
9. 보조 도구 활용
9-1. MediaInfo - 오디오 스펙 확인
mediainfo 파일명.wav
확인 항목:
-
샘플 레이트 (표준: 44100Hz 또는 48000Hz)
-
비트 뎁스
-
인코딩 소프트웨어
9-2. ExifTool - 메타데이터 분석
exiftool 파일명.wav
확인 항목:
-
파일 생성/수정 시간 일치 여부
-
녹음 기기 정보
-
소프트웨어 정보
9-3. RIFF 청크 구조 분석 (Python)
with open('파일명.wav', 'rb') as f:
data = f.read(200)
print(data[:128])
확인 항목:
-
fact 청크 존재 여부 (순수 PCM이면 보통 없음)
-
청크 내용이 0x00으로 비어있는지 여부
-
비정상적인 청크 순서
9-4. 편집점 의심 지점 메타데이터 이상 체크리스트
| 항목 | 정상 | 이상 |
|---|---|---|
| 생성 시간 vs 수정 시간 | 생성 ≤ 수정 | 생성 > 수정 (역전) |
| 샘플 레이트 | 44100 / 48000 Hz | 16000 Hz 등 비표준 |
| RIFF INFO 메타데이터 | 기기/소프트웨어 정보 있음 | 완전 부재 |
| fact 청크 | 없거나 정상 값 | 있지만 0x00으로 비어있음 |
| BWF bext 청크 | 방송용 장비면 존재 | 전문 기기인데 없음 |
10. 포렌식 보고서 작성 기준
10-1. 편집 의심 판단 기준
높은 신뢰도 (복수 근거 일치)
-
QM Onset Detector + Spectral Rise 동일 지점 마킹
-
스펙트로그램 색상 급변 + 파형 진폭 급변 일치
-
메타데이터 이상 + 스펙트럼 이상 동시 존재
중간 신뢰도 (단일 근거)
-
플러그인 한 곳만 마킹
-
스펙트로그램 미세 변화만 존재
낮은 신뢰도 (자연스러운 원인 가능)
-
화자 움직임, 마이크 노이즈
-
말 속도/톤 자연스러운 변화
10-2. 보고서 필수 포함 항목
1. 파일 해시값 (MD5, SHA-1, SHA-256)
2. 오디오 스펙 (샘플레이트, 비트뎁스, 재생시간)
3. 메타데이터 이상 여부
4. 편집 의심 타임스탬프 목록 (CSV 첨부)
5. 스펙트로그램 스크린샷 (의심 구간)
6. 사용 분석 도구 및 플러그인 버전
7. 종합 판단 의견
10-3. 주의사항
스펙트럼 분석 결과만으로 편집 여부를 단정하지 않음
복수의 분석 방법으로 교차 검증 필수
마이크 착용/탈착, 화자 이동 등 자연적 노이즈와 구별 필요
전문 편집 툴의 크로스페이드 처리는 청각적으로 탐지 불가
최종 판단은 기술적 근거 + 내용적 맥락을 종합해서 판단
본 매뉴얼은 Sonic Visualiser v5.2.1 / Vamp Plugin Pack 기준으로 작성되었습니다.
작성일: 2026-03-05
| 파일명 | SHA256 | 크기 |
|---|---|---|
| Sonic.Visualiser.5.2.1.dmg | bb86819411875cc8 | 39.4 MB |
| 파일명 | SHA256 | 크기 |
|---|---|---|
| qm-vamp-plugins-master.zip | 7372245a0bfd549d | 11.9 MB |
| 파일명 | SHA256 | 크기 |
|---|---|---|
| pyin-default.zip | 3d9defcf55020d92 | 4.3 MB |