파이썬 자료구조
-
[Python] Counters를 이용한 IIS 웹 로그 IP주소 빈도 수 추출Python/Python for Windows 2018. 4. 13. 22:55
xxx.xxx.xxx.xxx IP 패턴을 가장 많은 10개 추출 IIS로그 1.3G를 샘플로 실행해 보았다. 정규식을 이용하여 원하는 데이터를 출력 import collections import re from datetime import datetime def timecheck(): return datetime.today().strftime('%X') print(timecheck()) words = re.findall(r'\d{,3}[.]+\d{,3}[.]+\d{,3}[.]+\d{,3}[.]',open(파일, errors='replace').read().lower()) print(collections.Counter(words).most_common(10)) print(timecheck()) -------..
-
[Python] collections - Counter 객체Python/Data Struc & algo 2018. 4. 13. 22:01
collections : 파이썬의 표준 라이브러리 dict, tuple, list, set을 대체제공하는 컨테이너 데이터타입 Counter 객체 : 해시 가능 객체를 계산하기위한 dict 서브 클래스. 편리하고 빠른 성능을 제공 리스트의 단어들의 갯수 import collections cnt = collections.Counter() for word in ['A', 'B', 'C', 'C', 'D', 'D']: cnt[word] += 1 print(cnt) ---------------------------------------------- Counter({'C': 2, 'D': 2, 'B': 1, 'A': 1}) 특정 파일에서 가장 많이 사용하는 단어. (정규식 사용) import collections ..