본문 바로가기

분류 전체보기17

파이썬 - 정규표현식 정규표현식 문자열의 규칙을 찾아서 어떤거와 일치하는 것을 뭐로 바꿔라~ --> 이런 문제를 처리할때 주로 사용 match import re p=re.compile('[a-z]+') # a부터 z까지의 문자열이 한번이상 반복되는 표현식을 찾아라 m = p.match('python') print(m) # match가 된다 m2=p.match('3 python') print(m2) # 3은 p에 들어있는 표현이 아니므로 매치가 되지 않는다 match가 되는 경우는 이러한 문구가 나오고 match가 되지 않는 경우는 None 이라고 나온다 search s=p.search('3 python') print(s) 하지만 search의 경우 3이 들어있더라도 그 뒤의 python은 p와 매치가 되기 때문에 값이 나온다.. 2021. 1. 20.
크롤리 통계 - 4.1 분산 복습 분산 분산(variance) : 샘플 평균에서 벗어난 정도 Bias : 평균이 정답에서 얼마나 벗어났는가 모집단 Y의 평균 - Y 각각의 값 --> 결과가 음수가 나올 수 있다. 결과가 음수가 나왔을 때의 대안 1. 절댓값 왼쪽의 그림은 y=x^2 의 그래프이다. 이 그림은 미분이 가능하며 미분을 한다는건 기울기를 그릴 수 있다는 것 이고, 최솟값을 구하는 방법이다. 하지만 절댓값이 들어간 y=|x| 의 그래프를 보면 미분이 불가능하다는 것을 볼 수 있다. 따라서 분산을 구하고자 할 때 확실한 대안은 될 수 없다. 2. 제곱합 값을 추정하는데 이론적 전개를 위해 사용 분산을 구하고자 할 때 확실한 대안이 될 수 있다. 분산 식이 어떻게 만들어졌을까?? σ^2 은 모집단의 분산을 뜻하며 S^2 은 samp.. 2021. 1. 19.
크롤리 통계 - 4. 분산 분산 변량들이 퍼져있는 정도, 분산이 크면 들죽날죽 불안정하다는 의미 데이터의 퍼져 잇는 양상을 봐보자 -평균을 계산하고 그 평균과 데이터 사이의 거리(잔차;residual , 편차;deviation)를 보자 y 어떤 값을 이용할 것인가 for(i in 1:11) lines(c(i,i),c(mean(y),y[i]),col="red") # 데이터 값으로부터 평균까지의 길이를 그려줌 빨간선이 길수록 데이터의 변동선이 크다고 할 수 있다. (-) 경우는 어떻게 계산을 할까?? --> 잔차의 제곱을 이용한다. (절댓값을 이용한 경우에는 미분이 불가능한 부분이 생길 수 있기 때문에) --> 이것을 제곱합(sum of squares)라고 한다. 이렇게 제곱합을 구했는데... 데이터가 추가된다면?? 제곱합은 커지게 .. 2021. 1. 18.
프로그래머스 - 코딩테스트(완주하지 못한 선수) 문제 설명 수많은 마라톤 선수들이 마라톤에 참여하였습니다. 단 한 명의 선수를 제외하고는 모든 선수가 마라톤을 완주하였습니다. 마라톤에 참여한 선수들의 이름이 담긴 배열 participant와 완주한 선수들의 이름이 담긴 배열 completion이 주어질 때, 완주하지 못한 선수의 이름을 return 하도록 solution 함수를 작성해주세요. 제한사항 마라톤 경기에 참여한 선수의 수는 1명 이상 100,000명 이하입니다. completion의 길이는 participant의 길이보다 1 작습니다. 참가자의 이름은 1개 이상 20개 이하의 알파벳 소문자로 이루어져 있습니다. 참가자 중에는 동명이인이 있을 수 있습니다. 입출력 예 participant completion return [leo, kiki, .. 2021. 1. 14.