-
[주간학습 정리] Week 9Naver AI Tech 2024. 10. 18. 18:35
3줄 요약
가설을 하나씩 확인해보자
서울은 얼마나 클까?
지구는 둥굴다프로젝트의 가설 중 하나로
아파트들의 위치(위도,경도)의 중앙(median)은 수도권의 중심을 의미한다.
수도권 중심의 아파트 전세가는 외곽의 아파트보다 비싸다.라는 가설 아래서 가설을 검증하고 이를 이용해서 feature를 생성하는 작업을 진행했다.
아파트의 위도, 경도, 전세가 데이터를 이용하여 Scatter Plot을 그려보니 해당 가설의 가능성이 더 보였고 실제로 거리 측정 및 feature 생성을 진행하였다.
하버사인(Harversine)
아래는 이러한 위도, 경도를 이용한 거리 측정과 관련하여 사용한 하버사인(Harversine)에 대한 내용이다.
일반적인 평면에서 두 점(A, B)사이의 거리를 구하는 방법은 피타고라스의 정리를 사용하는 것이다
- 피타고라스 정리: a^2 + b^2 = c^2
지구는 둥굴다
그래서 위도와 경도를 이용해서 평면에서 처럼 거리를 계산하면 오차가 발생한다
매우 짧은 거리는 상관 없지만 길이가 길수록 지구 곡률의 영향을 받는다
즉, 둥근 지구에서는 두 점이 호 모양이므로 평면처럼 거리를 계산하면 안된다
- 호(arc): 수학 특히 기하학 및 도형에서 원둘레 또는 기타 곡선 위의 두 점에 의하여 한정된 부분을 가리킨다
이러한 경우 거리를 구하는 방법이 하버사인(Haversine) 공식 이다
하버사인 공식 (Haversine Formula)은 제외함
Python에서 하버사인 사용하기
참고: https://github.com/mapado/haversine
'Naver AI Tech' 카테고리의 다른 글
[주간학습 정리] Week10 (0) 2024.10.25 [주간학습 정리] Week 8 (3) 2024.10.11 [주간학습 정리] Week 7 (1) 2024.09.27 [주간학습 정리] Week 6 (2) 2024.09.13 [주간학습 정리] Week 5 (1) 2024.09.06