오디오 처리 Audio Processing

แชร์
ฝัง
  • เผยแพร่เมื่อ 18 ก.ย. 2024
  • 오디오 음성 처리 Audio Speech Processing
    오디오 처리 Audio Processing
    위상, Phase, 진폭, Amplitude, 주파수, Frequency, 샘플링, Sampling, Normalization, Quantization, Mu-Law Encoding, 오디오 표현, Audio Representation, Waveform, 정현파, Sinusoid, 푸리에 변환, Fourier Transform, 이산 푸리에 변환, Discrete Fourer Transform, DFT, Short-Time Fourier Transform, STFT, 스펙트로그램, Spectrogram, 멜 스케일, Mel Scale, 이산 코사인 변환, Discrete Cosine Transform, DCT, 오디오 특징, Audio Featrue, 스펙트럼, Spectral, Mel-Frequency Cepstral Coefficients, MFCC, 크로마그램, Chromagram
    Colab: colab.research...
    이수안 컴퓨터 연구소 (SuanLab)
    www.suanlab.com

ความคิดเห็น • 25

  • @KungYaTube
    @KungYaTube 3 หลายเดือนก่อน +2

    1:15:31초
    S = librosa.feature.melspectrogram(y=audio_np, sr=sr, n_mels=128)

  • @powermaxx2256
    @powermaxx2256 ปีที่แล้ว +1

    좋은 영상 감사합니다!

  • @Ambaelee
    @Ambaelee 2 ปีที่แล้ว +2

    영상 감사합니다. 2차 프로젝트를 진행하며 찾아오게 되었습니다. librosa 버전이 업데이트 되면서 일부 함수가 변경되었나 봅니다.
    코랩, '오디오 필터' 란에서 에러가 납니다.
    1. w, h =scipy.signal.freqz(b, a, worN=8000) 영상 01:44:32 부근입니다. 어째서인지 a에 1/13같은 수치를 입력하면 실행됩니다.
    2. y = butter_filter(audio_np, cutoff, fs, 'lowpass', order) 영상 01:46:47 부근입니다.

    • @suanlab
      @suanlab  2 ปีที่แล้ว

      저도 다시 한번 확인해 봐야겠네요.

  • @sw-ln1hh
    @sw-ln1hh 3 ปีที่แล้ว +2

    항상 잘보고 있습니다. ^^

    • @suanlab
      @suanlab  3 ปีที่แล้ว

      넵 감사합니다 ^^

  • @KungYaTube
    @KungYaTube 3 หลายเดือนก่อน +2

    19:58
    y_8k = librosa.resample(y=audio_np, orig_sr=sr, target_sr=sr//2)
    으로 쓰세요.

  • @KungYaTube
    @KungYaTube 3 หลายเดือนก่อน +1

    1:25:15
    librosa.display.waveshow(y=audio_np,sr=sr, alpha=0.4)

  • @iiilll7418
    @iiilll7418 3 ปีที่แล้ว +2

    좋은 수업 감사합니다!

    • @suanlab
      @suanlab  3 ปีที่แล้ว

      넵, 감사합니다. ^^

  • @ftcooky7118
    @ftcooky7118 3 ปีที่แล้ว +1

    최고!

    • @suanlab
      @suanlab  3 ปีที่แล้ว

      감사합니다. ^^

  • @브실골브금실력은골드
    @브실골브금실력은골드 2 ปีที่แล้ว +2

    교수님 질문이 있는데요 음악에서의 크로마그램의 경우엔 키 구분하는거에만 유용한게 아닌가요? 따로 장르 분류할때도 사용할 수 있는 건가요?

    • @suanlab
      @suanlab  ปีที่แล้ว

      네, 크로마그램은 키 구분 뿐만 아니라 장르나 곡 검색에도 활용가능한 훌륭한 특징 중에 하나죠 ^^

  • @yj_1128
    @yj_1128 9 หลายเดือนก่อน

    librosa.display.waveplot(complexwav[0:1000], sr=sr); 코드에서 에러가 발생합니다.
    librosa.display.waveshow(complexwav[0:1000], sr=sr); 코드로 변경해서 진행했습니다.
    **librosa 버전업이 되면서 waveshow로 대체된것으로 보입니다.

  • @user-fq6rx9du9i
    @user-fq6rx9du9i 2 ปีที่แล้ว +3

    안녕하세요 좋은 영상감사드립니다.
    Rolloff와 스펙트럼대역폭 등등을 구할때 audio_np에 0.01을 더해주는 이유가 궁금합니다.
    또한 각각의 특징 추출법이 어떤 경우에 각각 사용되는지 알 수 있는 출처가 있을지요?

  • @GukBab_Lover
    @GukBab_Lover 11 หลายเดือนก่อน

    안녕하세요. 영상 항살 잘 보면서 너무 좋은 도움 받고있습니다 ㅎㅎㅎ
    혹시 quantization을 하는 이유가 있을까요?!

  • @하르브종
    @하르브종 3 ปีที่แล้ว +2

    선생님 영상 아주잘 보고 있습니다.
    15초 wav 파일이 있다면
    1초의 헤르츠와 데시벨
    2초의 헤르츠와 데시벨
    3초의 해르츠와 데시벨

    15초의 헤르츠와데시벨 를 추출 하고싶은데
    또는 실시간 음성에대한 헤르츠와 데시벨
    값 출력이 librosa 라이브러리로 가능한가요???

    • @suanlab
      @suanlab  3 ปีที่แล้ว

      넵 가능합니다 ^^

  • @racraciak8206
    @racraciak8206 3 ปีที่แล้ว +1

    유익한 영상 감사드립니다. 질문이 한가지 있습니다. 제가 잔향시간(Reverberation Time)을 조작하고 싶은데 혹시 관련된 코딩이 있을까요?? 임펄스리스펀스가 있는 음향파일에 있어 잔향시간을 제거하고 싶은데 관련된 코딩을 잘 몰라서 여기에 질문 남겨봅니다.

    • @suanlab
      @suanlab  3 ปีที่แล้ว

      저한테는 없지만, 검색하면 꽤 나오는 것 같아요.
      start-up.house/en/blog/articles/reverberation-time-sound-analysis-python

  • @herarmisnice
    @herarmisnice 2 ปีที่แล้ว +1

    train dataset 다운로드 할때, colab을 킬때마다 다운로드해야되는건가요?

    • @suanlab
      @suanlab  ปีที่แล้ว +1

      네, colab은 매번 새롭게 생성되는 클라우드 환경입니다...

  • @조현지-d5x
    @조현지-d5x ปีที่แล้ว

    plt.show()를 할 때 자꾸 AttributeError: module 'matplotlib' has no attribute 'pyplot' 에러가 뜨는데 이유를 아실까요?
    찾아보니 matplotlib 설치가 안되어있거나, import matplot.pyplot as plt를 안해서 그렇다는데 전 둘다 했는데도 에러가 뜨네요 ㅠㅠ

  • @herarmisnice
    @herarmisnice 2 ปีที่แล้ว

    hop size 는 윈도우가 겹쳐지지않는 사이즈 인것같네요