2022 하계 모각코 16

최종 회고

Computer Vision을 공부하며 기본적인 이미지 다루는 방법에 대해 시간을 들여 알아볼 수 있어 좋았다. 코드를 짜다보면 생각보다 오류가 많이 생기는데 이를 해결하는 재미도 있었다고 생각한다. 이전 학기에서 공부한 AI 파트는 원래 기존 kaggle에 있는 코드를 분석하는 식으로 공부했었는데 이번 모각코를 통해서 같은 데이터셋에 대해 직접 모델을 짜보고 학습시켜보면서 의미 있는 경험이 되었다. 지금까지 해온 혹은 하고 싶은 공부에 대해 충분히 시간을 들여 공부하고, 공부한 내용을 정리해 블로그에 포스팅하면서 공부한 내용을 확실히 머리 속에 각인시킬 수 있는 시간이었다.

[6회차] AI - Regression

[AI] 기계 학습(Machinge Learning)은 컴퓨터 프로그램이 데이터와 처리 경험을 이용한 학습을 통해 정보 처리 능력을 향상시키는 것을 말한다. 이런 기계 학습에는 지도 학습과 비지도 학습이 있는데, Regression은 지도 학습에 해당한다. 지도 학습(Supervised Learning)은 기계 학습 중 컴퓨터가 입력값과 그에 따른 출력값이 있는 데이터를 이용하여 주어진 입력에 맞는 출력을 찾는 학습 방법이다. Regression Regression은 회귀라는 뜻으로 지도 학습의 한 종류로서 데이터 간에 함수 관계를 파악하여 통계적으로 추론하는 과정이다. 여기서 평균을 구하는 함수를 '회귀 모델'이라고 한다. 얼마나 큰지, 많은지 등 숫자로 표현할 수 있는 데이터를 양적 데이터라고 하고,..

[5회차] AI - Classification

[AI] 기계 학습(Machine Learning)은 컴퓨터 프로그램이 데이터와 처리 경험을 이용한 학습을 통해 정보 처리 능력을 향상시키는 것을 말한다. 이런 기계 학습에는 지도 학습과 비지도 학습이 있는데, Classification은 지도 학습에 해당한다. 지도 학습(Supervised Learning)은 기계 학습 중 컴퓨터가 입력값과 그에 따른 출력값이 있는 데이터를 이용하여 주어진 입력에 맞는 출력을 찾는 학습 방법이다. Classification Classification은 분류라는 뜻으로 지도 학습의 한 종류로서 데이터의 범주를 파악하고 새로운 데이터의 범주를 스스로 판별하는 과정이다. 얼마나 큰지, 많은지 등 숫자로 표현할 수 있는 데이터를 양적 데이터라고 하고, 이름 등 단어로 표현할 ..

[4회차] Deep Learning - AutoEncoder

[Deep Learning] 인코딩(Encoding) - "문자(문자열)를 바이트 형식으로 변환" 컴퓨터에서 인코딩은 동영상이나 문자 인코딩 뿐만 아니라 사람이 인지할 수 있는 형태의 데이터를 약속된 규칙에 의해 컴퓨터가 사용하는 0과 1로 변환하는 과정을 통틀어 말한다. 쉽게 말해 사람이 이해할 수 있는 데이터를 컴퓨터가 이해할 수 있도록 바꿔주는 것이다. 그 예시로 'ASCII', 'URL 인코딩', 'HTML 인코딩', 'Base64 인코딩' 등이 존재한다. 디코딩(Decoding) - "바이트 형식을 문자(문자열)로 변환" 디코딩은 인코딩의 반대로 컴퓨터가 이해할 수 있는 데이터를 사람이 이해할 수 있도록 바꿔주는 것이다. Autoencoder Autoencoder는 입력을 출력으로 복사하는 신경..

[4회차] Deep Learning - MLP(Multi-Layer Perceptron)

[Deep Learning] Perceptron 퍼셉트론(perceptron)은 인공신경망의 한 종류로서, 초기 신경망 분야의 연구에 큰 영향을 미쳤다. 퍼셉트론은 수용층, 연합층, 반응층의 세 부분으로 구성되어 있다. 수용층은 외부 자극을 받아들이고, 연합층은 수용층의 가중 압력을 받아 반응층으로 전달하며, 반응층은 최종 출력을 내보내는 기능을 한다. 이런 퍼셉트론은 연결 강도를 조정하기 위해 반복적 학습 방법을 사용한다. 특히 퍼셉트론 학습법은 특정 목적에 맞는 정확한 연결 강도에 수렴한다고 입증되었다. 퍼셉트론은 두 개의 뉴런(노드)이 있을 경우, 두 개의 노드가 각각 들어가야 하는 위치인 입력치와 그를 가중하는 가중치, 이를 통해 계산하여 나온 결과인 출력 값으로 이루어져 있다. 가중치와 입력치를..

[3회차] Computer Vision - Rotation

[Computer Vision] Rotation 어떤 한 점의 좌표값 (X, Y)는 아래와 같다. $$ X = rcos\theta $$ $$ Y = rsin\theta $$ Rotation은 이 점을 원하는 각도만큼 회전하는 것으로 이미지를 돌릴 때 사용한다. (X, Y) 좌표에 위치한 점을 회전했을 때 좌표를 (X`, Y`)라 하면 X`과 Y`의 값은 아래와 같다. $$ \theta : 현재\,점의\,각도\quad \theta_2 : 회전할\,각도 $$ $$ X^` = rcos(\theta+\theta_2) = r({cos\theta}{cos\theta_2} - {sin\theta}{sin\theta_2}) = Xcos\theta_2 - Ysin\theta_2 $$ $$ Y^` = rsin(\theta..

[3회차] Computer Vision - Gaussian blur, mean filtering, median filtering

[Computer Vision] 오늘의 Computer Vision에 사용한 원본 이미지는 아래와 같다. Gaussian blur Gaussian blur는 가우시안 함수를 사용해 이미지를 흐리게 하는 것이다. 이미지 노이즈를 줄이고 디테일을 줄이기 위해 그래픽 소프트웨어에서 널리 사용되는 효과다. Gaussain blur는 이미지의 각 픽셀에 적용할 변환을 계산하기 위해 가우시안 함수를 사용하는 이미지 흐림 필터 유형이다. 1차원에서 가우스 함수의 공식은 다음과 같다. $$ G(x) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{x^2}{2\sigma^2}} $$ 2차원에서 가우스 함수의 공식은 다음과 같다. $$ G(x, y) = \frac{1}{2\pi\sigma^2}e^..