Chae Data

  • 홈
  • 태그
  • 방명록

성향점수 1

[인과추론] 데이터의 편향 제거하기; Propensity Score란?

검색어와 문서에 대한 유저 피드백 데이터를 사용해 특정 검색어로 노출되는 문서의 품질을 알기 위해 클릭율을 예측한다고 가정해 봅시다. 상위에 노출된 문서는 유저가 더 많이 클릭하기 때문에 클릭율이 좋다고 착각할 수 있습니다. 하지만 클릭 데이터에는 위치 편향(Position Bias)이 내포되어 있습니다. 사용자는 상단에 노출된 문서를 더 자주 보게 되고, 그만큼 더 클릭하며, 실제 품질보다 높은 클릭 전환율을 보일 가능성이 있습니다. 이런 편향을 제거하지 않으면 문서 품질에 대한 정확한 평가가 어렵습니다. 우리의 목표는 위치 편향을 보정하여 문서 자체 품질의 순수한 평가를 수행하는 것입니다. 본 글은 이를 해결하기 위해 인과추론 분야에서 주로 사용되는 Propensity Score 개념을 중심으로 한 ..

데이터 분석 (DA) 2024.11.24
이전
1
다음
더보기
프로필사진

Chae Data

데이터 사이언티스트가 되는 과정의 기록

  • 전체 글 (39)
    • 검색 (Search) (7)
      • Elasticsearch (7)
    • ML & AI (6)
      • LLM (1)
      • Data Engineering (3)
      • MLOps (2)
    • 데이터 분석 (DA) (4)
    • Coder (15)
      • Python (1)
      • SQL (1)
      • 알고리즘 (13)
    • Activities (7)
      • 리뷰 (2)
      • 회고 (5)

Tag

파이썬, 검색엔진, 성향점수, 엘라스틱, 회고, 상반기회고, 데이터과학자원칙, rowiterator, mappings, 데이터사이언티스트, mlops, elasticsearch, 인과추론, 엘라스틱서치, 글또10기, index, bigquery, 빅쿼리, es, 글또8기,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바