본문 바로가기
728x90

AI16

[ML] 머신 러닝의 성능 저하 요인 이번 글에서는 머신 러닝의 성능을 저하시킬 수 있는 요인들, 머신 러닝의 Main Challenges에 대해서 설명하겠습니다. 문제가 될 수 있는 요인들은 크게 두가지로, 1) Bad Data와 2) Bad Model입니다. 1) Bad Data먼저 다룰 상황은, 주어진 데이터셋이 문제를 가지고 있는 경우입니다.- 부족한 Training 데이터의 양인간과 달리 머신 러닝은 제대로 작동하기 위해서 많은 양의 데이터가 필요합니다. 단순한 문제를 해결하기 위해서도 1000개 이상의 데이터가 필요한 경우가 대부분이고, 이미지, 음성 분석과 같이 문제가 복잡해질 수록 필요한 양의 데이터는 매우 커집니다.  또한 2009년에 발표된 논문 에서는 모델이 어떻게 설계되었는지에 따라서 성능의 차이가 있지만, 데이터의 .. 2024. 7. 24.
[ML] 머신 러닝 유형 머신 러닝은 크게 3가지의 기준으로 분류를 할 수 있습니다. 각 기준에 따라 머신 러닝의 특징을 붙일 수 있습니다. 1. Supervision 유형 기준2. 실시간으로 새롭게 들어오는 데이터 접근 방식3. 모델의 추론 방식  1) Training Supervision학습 과정에서 머신 러닝 시스템이 어떻게 관리되는지에 따라 다르게 구분할 수 있습니다.  - Supervised Learning (지도학습)알고리즘에 문제와 정답(라벨)을 모두 제공하는 것은 지도학습에 속하게 됩니다. 지도학습을 사용하는 대표적인 경우는 1) 어떠한 카테고리에 속하는지를 결정하는 classification 문제와, 2) 주어진 특징(features)들을 바탕으로 값을 추론해내는 regression 문제가 있습니다. * 값을 기.. 2024. 7. 23.
[ML] 머신 러닝 소개 머신러닝 정의Machine learning is the science (and art) of programming computers so they can learn from data.머신 러닝은 컴퓨터가 데이터로부터 학습할 수 있게 만드는 것입니다. 머신 러닝을 활용한 대표적인 예시로 스팸 필터가 있습니다.스팸 필터를 만약 머신러닝 없이 하드코딩한다면 스팸에 자주 나오는 단어들을 찾아보고 규칙을 정의해서 필터링하게 해야 합니다. 이 경우에는 만약 스팸에 기존의 스팸 메일에 자주 나왔던 키워드들이 변형되면(스팸 메일을 보내는 사람이 규칙을 알아채거나, 사용되는 단어의 트렌드가 바뀔 수도 있기 때문), 규칙을 일일이 업데이트해야 되기 때문에 비효율적이고 어렵습니다 하지만 머신 러닝은 스스로 데이터를 보고 학.. 2024. 7. 21.
[논문 리뷰] Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis 0. AbstractPose-Guided Person Image Synthesis(PGPIS)를 위해서 Diffusion model을 활용한 기존의 시도들은 source person image의 high-level semantic 정보를 잘 추출하지 못했기 때문에 overfitting에 취약하다는 한계가 있었다. 정보가 부족한 상태에서 target pose에 단순히 맞추기만 하면, 왜곡이 생기거나 생성된 이미지가 부자연스러울 수 있다는 문제가 있다. CFLD에서는 perception-refined decoder를 통해서 사람 이미지의 semantic 정보를 얻고 학습 가능한 query들을 조정함으로써 overfitting을 줄인다. 그리고 hybrid-granularity attention 모듈을 통해 .. 2024. 7. 17.
반응형