본문 바로가기

전체 글

(39)

CNN 예제 from keras.datasets import cifar10 from keras.models import Model from keras.layers import Dense, Flatten, Input from keras.layers import Conv2D, MaxPooling2D # 데이터 로드 (x_train, y_train), (x_test, y_test) = cifar10.load_data() # 데이터 정규화 x_train = x_train.astype('float32') / 255 x_test = x_test.astype('float32') / 255 # CNN 모델 생성 inputs = Input(shape=x_train.shape[1:]) conv1 = Conv2D(32, (3, 3), ..

[OpenCV] C#의 OpenCV OpenCvsharp 환경 설정 C# Form 프로그램에서 OpenCV를 사용해야하는데, C++ 버젼을 DLL로 만들어야할지 고민이 좀 있었음. 2017년도? 이쯤만 해도 EmguCV가 있어서 그걸 사용했었는데, 설정도 번거롭고 C++ version과 문법도 좀 달라서 고민을 했음. 그래서 혹시 뭔가 새로운게 있나 싶어 검색을 해보니 opencvsharp이라는게 있고, emgucv랑은 다른 듯했다. 그리고 환경설정을 할 수 있는 법을 찾아보니 바로 아래 블로그를 찾았고 자세하게 설명되어 있었음 https://luckygg.tistory.com/331 [OpenCV] C#에서 OpenCVSharp4 환경 구성 및 사용 방법 (예제 포함) OpenCVSharp이란? OpenCV는 Computer Vision 라이브러리를 무료로 사용할 수 ..

오디오 마스터(?)를 향하여 맡고 있는 프로젝트가 Sound기반인데, 관련 지식이 전무하다보니 인터넷과 책에서 이것저것 긁어와서 블로그에 담아두고 있는중.. Time Series를 공부하면서 신호처리를 깔짝 공부했었지만, 오디오는 또 다른 영역인듯함... 재밌기도 하고 어렵기도하고... 영상처리쪽도 마이너하다고 생각했는데 오디오는 알고리즘이랑 자료 찾기가 더 힘듬...

SDR (Signal-to-Distortion Ratio) SDR(Signal-to-Distortion Ratio) : 오디오 또는 신호 처리 및 통신 분야에서 일반적으로 사용되는 성능평가 지표임. 노이즈 또는 오류 신호와 같은 원치 않는 구성 요소 또는 왜곡의 전력과 관련하여 원하는 신호의 전력 측정값을 제공함. SDR은 수신하는 신호 중 "실제" 또는 "원하는" 신호의 양과 왜곡 또는 간섭의 양을 평가함. 반적으로 데시벨(dB)로 표시되며 값이 높을수록 신호 품질이 높음. https://jin-choi.tistory.com/34 Noise Suppression 상대방과 통화를 하던 중에 자신 또는 상대방이 시끄러운 곳에 있어서 서로의 목소리가 잘 들리지 않았던 경험, 한번 쯤 있으실텐데요. 옆 집 공사 소리, 길거리 소음, 카페 음악 소리 등 다양한 jin-..

Audio/Sound 데이터의 드럼비트 kick, snare, hi-hat Kick, snare, hi-hat은 일반적으로 드럼비트를 구성하는 요소로 드럼 비트를 형성하는 중요한 요소이며, 음악 장르에 따라 다양한 소리와 패턴으로 사용됨. 1. kick (베이스드럼) : 40-80Hz에서 저음을 강조하고 2-4kHz에서 고음을 강조하여 킥 드럼의 템포와 힘을 부각 저음 주파수를 가진 깊은 소리로서, 주로 리듬의 박자와 강조를 담당합니다. 주로 낮은 음 또는 중저음 영역의 소리로 표현됩니다. 전형적으로 4/4 박자에서 첫 번째 박자에 강조되어 사용됩니다. 예시: "Boom", "Thump", "Bass" 2. Snare (스네어 드럼) :100-250Hz에서 저음을 강조하고, 2-4kHz에서 고음을 강조하여 스네어의 공격감과 힘을 부각시킵니다. 높은 음 또는 고음 영역의 "타악기..

MFCC(Mel Frequency Cepstral Coefficient) MFCC란? Mel Frequency : 우리의 귀가 작동하는 것과 유사한 소리를 측정하는 방법임. 피아노에서 두 개의 높은 음이 두 개의 낮은 음보다 더 가깝게 들리는 것처럼 Mel Frequency는 사운드를 측정하기 위해 특별한 '스케일'을 사용함. Cepstral Coefficients : 소리의 '성분'을 찾고 있는 방법. 소리의 고음, 저음, 중간음등 MFCC의 특징 음성 인식, 음악의 장르 분석, 감정 인식 등 다양한 분야에서 MFCC를 활용합니다. 예를 들어 음성을 인식해야 하는데 목소리가 높은 사람이 높은 음으로 '가나다라~' 하는거랑 낮은 목소리로 '가나다라~' 하는거랑 같게 인식이 되어야 하겠죠? 그러니 MFCC는 적합한 특징값이죠. 반대로 음악에서 악기를 연주하면 그 악기의 음표를 ..

음성데이터 샘플링 (Audio Data Sampling) 샘플링은 아날로그 신호를 디지털화 하는 과정중 하나로, 샘플링 주파수에 따라 1초에 몇 번 디지털화 되어있는 데이터를 생성하는지를 의미함. ex) 샘플링 주파수가 44100Hz라면, 1초에 44100샘플링 한것이며 1초의 데이터는 44100 Size에 담아줘야함. → Spectogram 영상을 만들어야하는데, 시간축인 Width를 정하기 위해서는 샘플링 주파수와 사운드 데이터 길이를 알아야함. ex) 샘플링 주파수 13000Hz인 사운드 데이터가 1분이 있다면, 시간축 길이는 780,000로 설정해줘야함. https://analysisbugs.tistory.com/270 음성 데이터 (Audio Data) Audio Data를 컴퓨터에서 처리하기 위해서는 일반적으로 두 가지 Process가 진행된다. ..

닷넷 디컴파일툴 .Net Reflector, reflexil Reflector 다운로드 https://www.red-gate.com/products/dotnet-development/reflector/ .NET Decompiler: Decompile Any .NET Code | .NET ReflectorFind and fix bugs fast Decompile, understand, and fix any .NET code, even if you don't have the source Download free trialwww.red-gate.com reflexilhttps://github.com/sailro/Reflexil/releases Releases · sailro/ReflexilThe .NET Assembly Editor. Contribute to sail..

이전 1 2 3 4 5 다음

티스토리툴바