스토리지를 관리하다 보면 급격히 늘어나는 용량 때문에 증설 및 교체을 고민할 때가 있다.
용량 얼마나 필요한 것인가?
도입하면 몇 년을 사용할 수 있을 것인가?
디렉토리와 파일을 DB화 할 수 있다면, 데이터를 근거로 하여 합리적인 의사 결정을 할 수 있다.
파이썬 프로그래밍을 이용하여 데이터 분석을 해보자.
실제 파일을 읽으면서 디스크 I/O가 발생할 수 있으니 되도록 백업본이 있다면 백업 파일시스템에서 활용하도록 하자
아래의 모듈을 활용하여 디렉토리와 파일을 정보를 수집하고, DataFrame을 만든다
모듈 | 수집 데이터 |
os.path.getmtime | 파일의 수정시간 |
os.path.getsize | 파일 용량 (Byte) |
os.walk | 파일경로와 파일명 수집 |
pandas | 디렉토리와 파일 정보를 DataFrame |
샘플 파일시스템은 약 파일 수가 약 21만개
pandas를 이용하여 생성일자를 기준으로 시계열로 분석이 가능
연 단위 용량 합
월 단위 용량 합
주 단위 용량 합
이 처럼 데이터를 근거로 하여 스토리지가 용량이 어떻게 사용되고 있는지 데이터에 근거하여 알 수 있고, 향후 증설 등을 고려할 때, 참고할 수 있는 정확한 지표로 사용할 수 있다.
'Lecture' 카테고리의 다른 글
[강의Lab] 예제를 통한 python csv 모듈 활용하기 (0) | 2020.12.05 |
---|---|
[강의자료] 집계 내장함수를 사용하지 않고, 반복문을 이용한 리스트 숫자 요소 총합과 평균 구하기 (0) | 2020.06.05 |
[파이썬 강의 문제풀이] 2진수를 10진수로 변환하기 (0) | 2020.06.04 |
[강의자료] Python을 이용한 간단한 마을버스 요금 계산기 (0) | 2020.05.15 |
[파이썬 강의 문제풀이] 초를 입력하면 일, 시간, 분, 초 형태로 나타내기 (0) | 2020.05.14 |
[파이썬 강의 문제풀이] 숫자로 구성된 튜플 / 리스트에서 최대 빈도 요소 구하기 (0) | 2020.05.12 |
[파이썬 강의 문제풀이] 10진수를 2진수로 변환 (0) | 2020.05.12 |