분류 전체보기
-
[Python] random 함수Python/Python Programming 2020. 5. 13. 19:39
random.choice : 문자열, 리스트, 튜플과 같은 순서가 있는 반복개체에서 임의 요소를 리턴 # list A = [1,2,3,4,5,6,7,8] print(random.choice(A)) 4 # Strings A = '12345678' print(random.choice(A)) 3 # Tuple A = (1,2,3,4,5,6,7,8) print(random.choice(A)) 6 random.shuffle : 순서 섞기 from random import shuffle lst = [1,2,3] shuffle(lst) lst [3, 1, 2]
-
[파이썬 강의 문제풀이] 숫자로 구성된 튜플 / 리스트에서 최대 빈도 요소 구하기Lecture 2020. 5. 12. 16:04
숫자로 구성된 튜플 / 리스트에서 최대 빈도 요소 구하기 a = (1, 1, 2, 4, 5, 2, 1, 8, 9) maxvalue = 0 maxelement = 0 for i in set(a): if a.count(i) > maxvalue: maxelement, maxvalue = i, a.count(i) print('제일 큰 요소는 %d, 빈도는 %d 입니다' %(maxelement,maxvalue)) 제일 큰 요소는 1, 빈도는 3 입니다 숫자로 구성된 튜플 / 리스트에서 최대 빈도 요소 구하기. (2개 이상일 때) a = (1, 1, 2, 4, 5, 2, 1, 8, 9, 2) maxvalue = 0 maxelement = 0 for i in set(a): if a.count(i) > maxvalue..
-
mariadb remote backup python script using mysqldumpMysql, Maria DB 2020. 5. 11. 13:04
import pymysql from os import system from datetime import datetime host = ' ' dbuser = ' ' password = ' ' dbname = ' ' # get tables name conn = pymysql.connect(host=host, user=dbuser, password=password,db=dbname) c = conn.cursor() c.execute('SHOW TABLES') tablelist = [ x[0] for x in c.fetchall() ] c.close() conn.close() # mysqldump.exe backup (prefix_date) prefix_date = str(datetime.today().date..
-
mysqldump를 이용한 mariadb backupMysql, Maria DB 2020. 5. 8. 18:36
1. 전체 데이터베이스 백업 mysqldump --user=유저명 --password='암호' -A > backup.sql or mysqldump --all-databases --user=유저명 --password='암호' --all-databases > backup.sql 2. 데이터베이스 지정하여 백업하기 mysqldump --user=유저명 --password='암호' -B DB1 > backup.sql or mysqldump --user=유저명 --password='암호' --databases DB1 > backup.sql # 한 개의 데이터베이스만을 백업할 시 (-B / --databases) 옵션은 생략가능 mysqldump --user=유저명 --password='암호' -B DB1 DB2 ..
-
[Python] pandas 중복값 처리 (duplicates, drop_duplicates)Python/Python For Analytics 2020. 4. 8. 01:12
데이터 분석을 하다보면 특정 컬럼의 중복값을 제거해야 할 때가 있는데, pandas의 duplicates, drop_duplicates 메소드를 사용할 수 있다. duplicates( [ 'column' ], keep='first | last | False' ) : [ 'column' ] 에 대해서 중복이 있는지 확인 drop_duplicates( ['column'] , keep='first | last | False') : [ 'column' ] 중복값 처리 예제) 일자별 품목에 대한 금액 변동 DataFrame product = [['2020-01-01','T10001', 20000, 'BLACK'], ['2020-01-01','S10001', 10000, 'WHITE'], ['2020-01-01',..
-
[강의Lab] 파이썬을 이용한 데이터 기반 합리적 의사 결정 - 스토리지 시계열 용량분석Lecture 2020. 4. 1. 17:03
스토리지를 관리하다 보면 급격히 늘어나는 용량 때문에 증설 및 교체을 고민할 때가 있다. 용량 얼마나 필요한 것인가? 도입하면 몇 년을 사용할 수 있을 것인가? 디렉토리와 파일을 DB화 할 수 있다면, 데이터를 근거로 하여 합리적인 의사 결정을 할 수 있다. 파이썬 프로그래밍을 이용하여 데이터 분석을 해보자. 실제 파일을 읽으면서 디스크 I/O가 발생할 수 있으니 되도록 백업본이 있다면 백업 파일시스템에서 활용하도록 하자 아래의 모듈을 활용하여 디렉토리와 파일을 정보를 수집하고, DataFrame을 만든다 모듈 수집 데이터 os.path.getmtime 파일의 수정시간 os.path.getsize 파일 용량 (Byte) os.walk 파일경로와 파일명 수집 pandas 디렉토리와 파일 정보를 DataFr..
-
[CentOS] timezone 변경하기Linux/RedHat, CentOS, ubuntu 2020. 3. 24. 12:38
리눅스 타임 시간이 계속 맞지 않아서 date로 확인을 해보니 EDT (뉴욕이었다.) 수동으로 한국시간으로 변경해도 도루묵이다. 이 때는 타임존을 변경해주어야 한다. # date Tue Mar 24 12:16:48 EDT 2020 [ Asia/Seoul로 변경 ] # ln -sf /usr/share/zoneinfo/Asia/Seoul /etc/localtime # date Wed Mar 25 01:17:36 KST 2020