보스턴 집값 예측

학교/인공지능 2024. 6. 8. 16:29

import tensorflow as tf

import pandas as pd

# 과거 데이터 준비

filepath = '/content/sample_data/boston.csv'

boston = pd.read_csv(filepath)

print(boston.columns)

boston.head()

# 독립

independent = boston[['crim', 'zn', 'indus', 'chas', 'nox', 'rm', 'age', 'dis', 'rad', 'tax', 'ptratio', 'b', 'lstat']]

# 종속

dependent = boston[['medv']]

print(independent.shape, dependent.shape)

# 2. 모델 구조 생성

X = tf.keras.layers.Input(shape=[13])

Y = tf.keras.layers.Dense(1)(X)

model = tf.keras.models.Model(X, Y)

model.compile(loss='mse')

# 3. 모델 학습(FIT)

model.fit(independent, dependent, epochs=1000, verbose=0)

model.fit(independent, dependent, epochs=10)

# 4. 모델 이용(예측)

print(model.predict(independent[5:10]))

# 종속 변수 확인

print(dependent[5:10])

# 모델 수식 확인

print(model.get_weights())

1. 데이터 준비

import tensorflow as tf
import pandas as pd

# 과거 데이터 준비
filepath = '/content/sample_data/boston.csv'
boston = pd.read_csv(filepath)
print(boston.columns)
boston.head()

import tensorflow as tf: TensorFlow 라이브러리를 tf라는 이름으로 임포트합니다. TensorFlow는 딥러닝 및 머신러닝 모델을 만들고 훈련시키기 위한 라이브러리입니다.
import pandas as pd: Pandas 라이브러리를 pd라는 이름으로 임포트합니다. Pandas는 데이터 조작과 분석을 위한 Python 라이브러리입니다.
filepath = '/content/sample_data/boston.csv': CSV 파일의 경로를 지정합니다.
boston = pd.read_csv(filepath): Pandas를 사용하여 CSV 파일을 데이터프레임으로 읽어옵니다.
print(boston.columns): 데이터프레임의 열 이름을 출력합니다.
boston.head(): 데이터프레임의 첫 5개 행을 출력합니다.

2. 독립 변수와 종속 변수 분리

# 독립
independent = boston[['crim', 'zn', 'indus', 'chas', 'nox', 'rm', 'age', 'dis', 'rad', 'tax', 'ptratio', 'b', 'lstat']]

# 종속
dependent = boston[['medv']]
print(independent.shape, dependent.shape)

독립 변수(입력 데이터)와 종속 변수(목표 데이터)를 분리합니다.
independent: 예측에 사용되는 입력 데이터입니다. 이 코드에서는 보스턴 주택 데이터셋의 여러 피처를 선택합니다. (crim, zn, indus, chas, nox, rm, age, dis, rad, tax, ptratio, b, lstat)
dependent: 예측하고자 하는 목표 데이터입니다. 여기서는 주택의 중앙값(medv)을 예측합니다.
print(independent.shape, dependent.shape): 독립 변수와 종속 변수의 크기를 출력합니다.

3. 모델 구조 생성

# 2. 모델 구조 생성
X = tf.keras.layers.Input(shape=[13])
Y = tf.keras.layers.Dense(1)(X)
model = tf.keras.models.Model(X, Y)
model.compile(loss='mse')

X = tf.keras.layers.Input(shape=[13]): 입력 레이어를 정의합니다. 여기서 입력 데이터의 형태는 13개의 피처를 가지는 1차원 벡터입니다.
Y = tf.keras.layers.Dense(1)(X): 출력 레이어를 정의합니다. 여기서 Dense 레이어는 1개의 뉴런을 가지며, 입력 레이어 X로부터 값을 받아서 선형 결합을 수행합니다.
model = tf.keras.models.Model(X, Y): 입력 레이어 X와 출력 레이어 Y를 연결하여 모델을 만듭니다.
model.compile(loss='mse'): 모델을 컴파일합니다. 손실 함수로 평균 제곱 오차(MSE)를 사용합니다.

4. 모델 학습(FIT)

# 3. 모델 학습(FIT)
model.fit(independent, dependent, epochs=1000, verbose=0)
model.fit(independent, dependent, epochs=10)

model.fit(independent, dependent, epochs=1000, verbose=0): 모델을 학습시킵니다. 독립 변수 independent와 종속 변수 dependent를 사용하여 1000번의 에포크 동안 학습합니다. verbose=0은 학습 중 출력되는 로그를 생략합니다.
model.fit(independent, dependent, epochs=10): 추가로 10번의 에포크 동안 모델을 학습합니다. 이번에는 verbose를 생략하여 기본값(1)을 사용합니다.

5. 모델 이용(예측)

# 4. 모델 이용(예측)
print(model.predict(independent[5:10]))

# 종속 변수 확인
print(dependent[5:10])

model.predict(independent[5:10]): 학습된 모델을 사용하여 독립 변수의 일부 데이터를 입력으로 주고 예측을 수행합니다. 여기서는 5번째부터 9번째까지의 데이터를 예측합니다.
print(dependent[5:10]): 실제 종속 변수 값을 출력하여 예측 값과 비교합니다.

6. 모델 수식 확인

# 모델 수식 확인
print(model.get_weights())

model.get_weights(): 모델의 가중치(Weights)와 편향(Biases)을 출력합니다. 이 값들은 학습 과정에서 최적화된 값들로, 학습된 모델의 수식을 나타냅니다.

'학교 > 인공지능' 카테고리의 다른 글

Multi-Layer로 확장 (보스톤 집값) (1)	2024.06.08
IRIS 분류 (0)	2024.06.08
5_인공지능개론 (1)	2024.06.08
4_인공지능개론 (0)	2024.06.06
3_인공지능개론 (1)	2024.04.21

ABOUT ME

seoyun seoyun

1. 데이터 준비

2. 독립 변수와 종속 변수 분리

3. 모델 구조 생성

4. 모델 학습(FIT)

5. 모델 이용(예측)

6. 모델 수식 확인

'학교 > 인공지능' 카테고리의 다른 글

티스토리툴바

ABOUT ME

1. 데이터 준비

2. 독립 변수와 종속 변수 분리

3. 모델 구조 생성

4. 모델 학습(FIT)

5. 모델 이용(예측)

6. 모델 수식 확인

'학교 > 인공지능' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바