[매일10분 데이터 분석] 파이썬 머신러닝 맛보기 2탄 (Scikit Learn 사용해보기)

แชร์
ฝัง
  • เผยแพร่เมื่อ 22 ม.ค. 2025

ความคิดเห็น • 14

  • @data_dreamer
    @data_dreamer 2 ปีที่แล้ว +1

    간단 명료한 설명 너무 좋아요~

  • @스캇-n5j
    @스캇-n5j 3 ปีที่แล้ว +1

    감사합니다. 아시는 것ㄷ많으시고 설명도 이해 쏙쏙 잘되게 잘 하시네요.

  • @ryan_choi24
    @ryan_choi24 3 ปีที่แล้ว +1

    판다스 최고의 선생님이십니다 ^^

  • @TheDotteddotted
    @TheDotteddotted 2 ปีที่แล้ว +1

    get_dummies 할때 연령, 총구매금액, 총구매수량은 더미변수화되지 않는 이유가 뭔가요?

    • @data_station
      @data_station  2 ปีที่แล้ว +1

      답변늦어 죄송합니다. 근래 컨설팅일정이 많아 이제 확인했네요.
      질문 주신 get dummies 함수는 문자데이터를 컴퓨터가 이해하는 형태로 변환해 학습하기 위해 사용되는 함수입니다.
      따라서 질문주신 연령,구매금액,수량은 이미 숫자데이터로 컴퓨터가 인식을 하고 있어, 더미화 하지 않습니다!

  • @namjin__
    @namjin__ 3 ปีที่แล้ว +1

    6.18 머신러닝 맛보기(2/3) 학습완료

  • @kanghokim7756
    @kanghokim7756 3 ปีที่แล้ว

    강의 잘듣고 있습니다. 늘 감사 드립니다. 기회가 된다면 오프라인 강의도 수강하고 싶습니다.

    • @data_station
      @data_station  3 ปีที่แล้ว

      하반기에 공개강의를 진행하려고 계획중에 있습니다
      일정잡히면 공지하겠습니다 감사합니다

  • @kanghokim7756
    @kanghokim7756 3 ปีที่แล้ว

    질문 하나 드리면요, X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=2020)
    첫번재 질문 X_train, X_test, Y_train, Y_test 의 변수이름은 임의로 지정하신건가요? 입력변수의 트레인과/테스트, 출력변수의 트레인과 테스트 이렇게 맞춰서 4개로 지정해야 되나요?
    두번째 질문 train_test_split(X, Y, test_size=0.3)에서 0.3의 의미가 가지고 있는 데이타에서 30%만 추출해서 트레인 셋과 테스트 셋을 만드는 것이라고 하셨는데 X와 Y를 각각 다른 값으로 입력 할수 있나요? 그렇게 분석 하기도 하나요?

    • @data_station
      @data_station  3 ปีที่แล้ว

      네 임의로 정해진 변수 명입니다
      그리고 테스트 셋과 학습 세트를 랜덤하지 않게 따로 추출하는 경우도 있습니다
      그러나 데이터 마이닝의 기본 철학이 데이터가 모든 집단 자체를 일반화 한다는 전제가 있기에, 랜덤 추출을 통해 학습데이터와 테스트데이터를 구성합니다

  • @김종현-g3y
    @김종현-g3y 3 ปีที่แล้ว +1

    수업 잘듣고 있습니다 ㅎㅎ선생님 혹시 스크립트가 열리지 않는데 해결방법이 있을가요??

    • @data_station
      @data_station  3 ปีที่แล้ว

      답변 늦어 죄송합니다
      해결 하셨나요??
      보통 스크립트는 주피터 노트북으로 열어야합니다!