전체 글
-
[ML개념] binary classification / logistic regression머신러닝 || 딥러닝 2022. 8. 11. 10:16
hypothesis to classify binary category (e.g. 0 or 1), we need a losistic function => 어떠한 실수값 (-inf, inf)을 넣어도 0과 1사이에서 분류가 가능하다 :)) => linear regression에서 sigmoid 함수를 씌운 형태 Cost function => MSE로 정의하면 saddle point가 많아서 gradient descent 알고리즘을 쓰기 어렵다 => cross-entropy loss ! (difference between two probability distribution) 컨셉을 이용하자 => 잘예측하면 값이 작고, 예측값과멀어질수록 값이 커지는 (오차가 커짐) 경향을 잘 반영함 출처: https://git..
-
[ML개념] Linear regression머신러닝 || 딥러닝 2022. 8. 11. 09:28
regression : 예측하는 문제를 풀고 싶다 Linear : hypothesis => 우리가 예측하는 문제가 선형의 트렌드를 따를것으로 예측하자. 즉, y = Wx+b 에서 데이터의 경향을 잘보여주는 W와 b를 찾는 문제로 볼 수 있다. so how can we find a W and b ? => W와 b 값이 데이터를 잘 표현하고 있다는 것을 정량화해줄 도구가 필요하다 ==> cost function ! : 예측한 함수와 실제데이터 사이의 오차를 계산 ==> 즉 좋은 예측 모델이란 !? cost function값을 작게 만드는 예측모델 파라미터(W,b)를 찾는 과정 !! How to minimize the cost function? == find a local minima ! (optimizati..
-
[ML개념] ML problem 정의머신러닝 || 딥러닝 2022. 8. 11. 09:05
* Supervised learning은 x(데이터),y(타겟) 값이 주어져야한다 * classification의 경우 decision boundary를 찾는 문제로 볼 수 있다. * clustering의 경우 각 데이터의 similarity(distance)를 어떻게 계산할것인가 하는 문제로 볼 수 있다. * Dimensionality reduction의 경우 feature를 줄이기위해 다른 알고리즘 적용전 선행되는 경우가 많다. 출처 : https://github.com/heartcored98/Standalone-DeepLearning/blob/master/Lec1/Lec1-B.pdf
-
-
[에러/예외처리] Error handling🐍 파이썬/파이썬 기본 문법 2022. 8. 9. 12:15
Python Built-in Exceptions IndexError: list index out of range ValueError: invalid literal for (e.g. int("a")) NameError: name is not defined ZeroDivisionError: division by zero KeyError: a dictionary key is not found Raising Exceptions def do_something_with_number(n): if n < 0 : raise ValueError("negative number is given") Handling Exception : try / exception statement Code that can cause an ex..
-
[JSONiq] practice JSONiq in RumbleDB📚 데이터베이스/빅데이터 2022. 8. 8. 06:47
https://colab.research.google.com/github/RumbleDB/rumble/blob/master/RumbleSandbox.ipynb#scrollTo=nkuOUsukRBQb RumbleSandbox.ipynb Run, share, and edit Python notebooks colab.research.google.com official docs for JSONiq : https://www.jsoniq.org/docs/JSONiq/webhelp/index.html
-
[자료구조] How to analyze performance of data structure?카테고리 없음 2022. 8. 6. 23:39
Data structures refer to how data is organized. Data doesn’t just matter for organization’s sake, but can significantly impact how fast your code runs. Depending on how you choose to organize your data, your program may run faster or slower by orders of magnitude. To understand the performance of any data structure, we need to analyze the common ways our code might interact with that data struct..