목록수학/통계 (2)
jm_p_op
p의 확률을 n번 실행될때 x번 실행될 확률(f)은 이항분호를 따른다. 기댓값 : np 분산 : np(1-p) f(x) = f(x) = factorial(n) * p^x * (1-p)^(n-x) / factorial(x)factorial (x-k) 이항분포의 n을 극한으로 보낸다면 포아송 분포를 따른다 p의 확률을 n번 실행될때 평균적으로 x번 실행될 확률(f)은 포아송분포를 따른다. 기댓값 : λ=np 분산 : λ=np f(x) = λ^x * e^(- λ ) / factorial(x) λ가 충분히 크다면 정규분포를 따름 기댓값 : μ = np 분산: λ = σ^2 f(x)=e^(-(x- μ )^2 / 2 σ ^2) / σ route(2*pie)
과거 프로젝트를 보았을때 데이터를 때려 넣어서 분석을 진행하였다. 초기 목적이 주거 지구와 성업 지구가 구별되는 뚜렷한 경향성이 였지만, 지금 통계 데이터를 보니 많은 것들을 놓치고 있었다. 뚜렷한 차이가 없다는것은 역으로 말하자면 비슷한 경향을 가지고 있다는것이고, 4지역중에서 강북구 외로는 3지역이 비슷한 상황을 가지고 있다. 가해운전자 연령 cctv 유무 cctv 유무에 대한 데이터 넣고 왜 안쓴거야...., 수집했던 데이터가 아까웠나......, 또한 가해 운전자 연령 분포를 보면 나이별 비율이 비슷함을 알수가 있다. 만약 나이별 운전자수를 알수 있다면 비율적으로 어디가 높은지또한 알수 있었을것이다. 거의 4년 (공익 -2년) 된 과제지만 이력서를 쓰면서 부족했던 내자신을 되돌아 본다.