전체 스터디
내 스터디
- 스터디에 참여해보세요!
이종욱 리더
데이터사이언스 12시간 입문기
온라인
클래스 자세히 보기
import pandas as pd
df=pd.read_csv('data/review.csv')
review_data= df.drop(['이름', '성별'], axis=1)
x_train=df[['나이', '학점', '키']]
y_train = df['토익점수']
from sklearn.linear_model import LinearRegression
lr = LinearRegression().fit(x_train, y_train)
print('train set accuracy', lr.score(x_train, y_train))
df_test = pd.read_csv('data/review_test.csv')
x_test = df_test[['나이', '학점', '키']]
prediction = lr.predict(x_test)
prediction
lr.predict([(24,3.7,170)])
comparison = pd.DataFrame(y_train)
y_test = lr.predict(x_train)
comparison['나의 예측']=y_test
comparison
참여자 데이터사이언스 12시간 입문기