전체 글 84

머신러닝with파이썬7(2)_군집(클러스터링)

군집 (Clustering) 이번 시간에는 군집(클러스터링)에 대해서 설명 드리도록 하겠습니다. 이번 시간 정리 군집(Clustering) 군집분석은 유사성이 높은 대상의 집단을 분류하는 분석 방법 계층적 군집분석과 비계층적 군집분석 으로 구분함 전통적인 계층적 군집분석은 군집의 개수를 나중에 선정함 비계층적 군집분석인 K-means는 군집의 수를 가장 먼저 선정함 K-mean 군집분석은 초기 중심 값은 임의로 선정하며, 중심 값이 이동함 군집분석의 평가지표 Silhouette(실루엣), Dunn Index 등 활용 1. 비계층적 군집분석 대표적인 방법 K-means K-평균군집(centroid), 임의의 지점 K개를 선택해 해당 중심에서 가까운 데이터를 군집화 하는 기법 n_clusters 하이퍼파라미..

카테고리 없음 2024.03.23

머신러닝with파이썬7(1)_차원축소,

차원축소 이번 시간에는 차원축소의 대표적인 기법인 PCA에 대해 설명드리도록 하겠습니다. 이번 시간 정리 차원축소 feature가 많을수록 데이터의 차원이 커지게 되는데, 데이터셋의 크기에 비해 feature가 많아질 경우 이를 표현하기 위한 변수가 많아져 모델의 복잡성이 증가되고 과적합 문제가 발생되기도 합니다. 이러한 문제를 해결하기 위해 차원 축소 방법이 사용되고 있습니다. *용어: 차원이란? 데이터 포인트를 공간에 표현하기 위해 필요한 최소한의 축의 개수 PCA(Principal Component Analysis) 차원 축소 기법 중 대표적인 기법 고차원에서 저차원으로 축소하는 선형 투영 기법 데이터의 차원이 증가할 수록 거리가 증가하고, 오버피팅 가능성이 커짐 PCA 단계 데이터에서 분산이 최대..

카테고리 없음 2024.03.22

인공지능 개론(2) 딥러닝의 종류

1.정의: 딥러닝이란? 신경뇌구조망 촘촘히 쌓아 최적의 모델결과물 2. 원리 딥러닝 원리-경사하강법(로스값 최소화) ex) 손글씨 분류하기: 특정한 가로 세로 사이즈의 이미지내에서 각 픽셀 위치별로 컬러값, 밝기 가지는 픽셀값. 각각의 숫자이미지는 14바이14 이차원 배열-> 딥러닝 모델의 입력 데이터 -> 모두 곱하고, 더하는 식으로 ... 정답에 가까운 결과값을 낼 수 있도록! 0또는 1이 나와야. 1이라는 숫자로 나타날 확률; 80퍼 확률-> 좋은 가중치 5라는 숫자로 나타날 확률: 70퍼 확률 -> 나쁜 가중치 : 틀린답 확률 높음 줄이는 과정: 경사하강법 가중치 수정 할때 ->경사하강법 딥러닝 모델 가중치에 임의의 값 부여해서 주어진 입력 이미지 에서의 정답과 해당 모델의 결과값간의 그 차이에 ..

카테고리 없음 2024.03.21

Chapter.01 파이썬 프로그래밍-05. OOP,CLASS

💡 OOP : Object-Oriented Programming의 약자로 객체(Object)를 기반으로 프로그램을 만드는 방법론입니다. Source : https://velog.io/@gil0127/Object-Oriented-Programming-in-Javascript velog velog.io OOP는 실제 세상을 표현하고 있는, 여러가지 개념들을 프로그램으로 옮겨서 구현할 수 있기 위한 컨셉의 프로그래밍 패러다임(paradigm)입니다. → 개념의 추상화(abstraction) 객체(object)라는 개념은 실제 사물 하나하나를 의미할 수 있고, 이러한 사물들이 공유하는 속성을 정의한 것을 클래스(Class)라고 합니다. 기존 방식은 데이터(변수, variable)와 데이터를 처리하는 기능(함수,..

카테고리 없음 2024.03.20

Chapter.01 파이썬 프로그래밍04- 함수,I/O

Chapter.01 파이썬 프로그래밍04-함수,I/O 💡 함수(Function) : 한 가지의 기능을 하는 코드 묶음. Input을 받아서 처리하고 Output을 돌려주는 코드. Source : https://ko.wikipedia.org/wiki/함수#/media/파일:Function_machine2.svg 함수(function)는 기능(function)을 의미합니다. 함수의 input을 parameter(또는 argument)라고 합니다. 함수는 input을 받아서 주어진 기능대로 처리한 뒤, output을 return합니다. 정의한 함수를 사용하는 것을 function call이라고 합니다. # function definition syntax example def function1(a, b): so..

카테고리 없음 2024.03.19

Chapter.01 파이썬 프로그래밍-03. IF, FOR, WHILE조건문

💡 IF : 조건에 따라 다른 명령을 수행하는 statement. (조건문, conditional statement) Source : https://ko.wikipedia.org/wiki/순서도#/media/파일:LampFlowchart_ko.svg # if statement syntax example if condition: ... elif condition: ... else: ... python에서는 조건문을 if statement로 다룹니다. 프로그래밍에서 조건에 따른 명령을 수행하는 건 굉장히 중요합니다. 프로그램의 규칙은 모두 조건에 따른 분기(branch)에 따라 결정됩니다. Key Points if문을 사용할 땐, :사용에 주의합니다. 조건문을 이용한 프로그래밍을 한다는건, 의사결정(deci..

카테고리 없음 2024.03.18

Chapter.01 파이썬 프로그래밍-02. Python 소개/03. Data Type

💡 Python : 데이터 분석, 프로토타입 개발 등에 쓰이는 인기 있는 인터프리터 기반 프로그래밍 언어. Python Welcome to Python.org 1991년에 네덜란드의 프로그래머 귀도 반 로섬(Guido Van Rossum)가 만든 고급 프로그래밍 언어이다. Interpreter-based, OOP, dynamic type binding을 지원한다. 이름은 귀도가 좋아하는 *“Monty Python’s Flying Circus”*에서 따왔다. (실제 python은 뱀이라는 의미) 예시 코드를 보면서 파이썬의 특징에 대해서 좀 더 이야기를 해보자. def say_welcome(name): print(f"Hello World! {name}!") my_name = "yongdam" say_wel..

언어/파이썬 2024.03.17

Chapter.01 파이썬 프로그래밍-01. 프로그래밍이란?

프로그래밍 : 컴퓨터에게 일련의 명령을 수행하는 프로그램을 만드는 과정. 프로그래밍(Programming); 컴퓨터에게 일을 시키자 컴퓨터에게 일을 시키기 위해서는 소통 수단 프로그래밍 언어(Programming Language)가 필요하다. 프로그래밍 언어를 통해서 일을 어떻게 하면 되는지 컴퓨터에게 알려준다. 이 과정 전반을 프로그래밍 또는 코딩(Coding)이라고 합니다. 즉, 컴퓨터 공학은 컴퓨터 일을 잘 시키는 걸 배우는 분야 프로그 래밍의 구성 요소 코드 (Code) - 특정 프로그래밍 언어로 기술되는 텍스트. def say_welcome(name): print(f"Hello World! {name}!") say_welcome("Yongdam") 언어이기 때문에, 문법(Syntax)과 의미론(..

언어/파이썬 2024.03.16

머신러닝with파이썬6강(3)_랜덤포레스트&XGBoost, 하이퍼파라미터 튜닝

랜덤포레스트 & XGBoost 이전 시간에 지도학습(분류) 중 랜덤포레스트 & XGBoost를 다뤄봤는데요. 분류뿐만 아니라 회귀에서도 자주 활용됩니다. 이제 실습을 함께 진행해 보도록 하겠습니다. 이번 시간 정리 [리마인드] 랜덤포레스트 VS XGBoost 1. 랜덤포레스트 여러 개의 의사결정 트리로 구성 앙상블 방법 중 배깅(bagging) 방식 부트스트랩 샘플링 (데이터셋 중복 허용) 최종 다수결 투표 2. XGBoost 트리 앙상블 중 성능이 좋은 알고리즘 eXtreme Gradient Boosting을 줄여서 XGBoost라고 한다. 약한 학습기가 계속해서 업데이트를 하며 좋은 모델을 만들어 간다. 1) 랜덤포레스트 # 랜덤포레스트 from sklearn.ensemble import Random..

언어/파이썬 2024.03.15

머신러닝with파이썬6강(2)_라쏘회귀,엘라스틱넷회귀

라쏘 회귀 이번 시간에는 라쏘 회귀(Lasso regression) 모델에 대해 살펴보도록 하겠습니다. 이번 시간 정리 1. 라쏘 회귀 오버피팅 문제로 규제(regularization)를 적용한 모델 규제 방식: L1 규제 (중요한 피처만 선택하는 특성) L2에 비해 회귀 계수를 급격히 감소시켜 중요하다고 생각하는 피처만 선택하고 나머지는 0으로 만듦 [리마인드] 규제 방식 비교 릿지 회귀 : L2 규제 방식 라쏘 회귀 : L1 규제 방식 (중요한 피처만 선택하는 특성) 1) 라쏘 회귀 # 라쏘 회귀 from sklearn.linear_model import Lasso model = Lasso(alpha=1) model.fit(X_train, y_train) pred = model.predict(X_te..

언어/파이썬 2024.03.14