본문 바로가기

통계

(96)
[개념] Python Numpy에 대해 이해해보자 3 (array 데이터자료형, 자료형 지정, 형식 변환, 기본 자료형과 Numpy 자료형의 차이) rfriend.tistory.com/285?category=675917 [Python NumPy] ndarray 데이터 형태 지정 및 변경 (Data Types for ndarrays) 이번 포스팅에서는 Python의 NumPy 모듈을 사용해서 - 데이터 형태 지정 (assign data type) : - 데이터 형태 확인 (check data type) - 데이터 형태 변경 (convert data type) 하는 방법을 소개하겠습니다.. rfriend.tistory.com (오늘의 공부내용은 위 블로그의 내용을 그대로 참고했습니다.) Numpy 패키지는 수치해석을 위한 라이브러리인만큼 숫자형 자료형을 더욱 자세히 나누어 놓은 자료형이 존재한다. 같은 int형이지만 뒤에 bit 단위가 붙게 되는데 예를..
[개념] Python Numpy에 대해 이해해보자 2 (seed지정, size옵션, 이산형, 연속형 확률분포에서 무작위 난수 생성, 간단한 히스토그램 만들기) Python Numpy에 대해 이해해보자 1 [개념] Python Numpy 패키지에 대해 이해해보자 1 (array 생성, 배열, 차원, dtype 확인, .zeros, .ones, .empty, numpy.org/devdocs/user/quickstart.html Quickstart tutorial — NumPy v1.20.dev0 Manual NumPy provides familiar mathematical functions such as sin, cos, and exp. In NumPy, these are called “universal.. stat-thon.tistory.com 이전에 Numpy 패키지의 Array 클래스에 관해 공부했다. 오늘은 생각보다 자주 활용되는 무작위 난수 생성 모듈인 ..
[개념] Python Numpy에 대해 이해해보자 1 (array 생성, 배열, 차원, dtype 확인, .zeros, .ones, .empty, .identity, arange로 array 생성, reshape로 배열 바꾸기) numpy.org/devdocs/user/quickstart.html Quickstart tutorial — NumPy v1.20.dev0 Manual NumPy provides familiar mathematical functions such as sin, cos, and exp. In NumPy, these are called “universal functions”(ufunc). Within NumPy, these functions operate elementwise on an array, producing an array as output. See also all, any, apply_alo numpy.org 글을 쓰면서 numpy 홈페이지를 참고했다. Numpy는 파이썬에서 선형대수 계산기능을 제..
[개념] Python Pandas에 대해 이해해보자 4 (엑셀 파일 불러오기) PandasData frame 자료형 만들기Series 자료형 만들기기술통계NA값 처리엑셀 파일 불러오기 (파일 형식: xlsx, csv, Pandas_dataframe(pickle), json; txt도 가능)오늘은 엑셀 파일 불러오기를 간단히 살펴보자!5. 엑셀 파일 불러오기5.1 csv형식의 엑셀 파일 불러오기 pd.read_csv("파일경로명.파일명.csv") ※단, 경로명의 \을 전부 /로 교체해주어야 한다. #엑셀 파일 중 확장자명이 .csv인 파일 불러오기 import pandas as pd train = pd.read_csv("D:/thon/data/kaggle/titanic_ex/train.csv") train.head() 만약 여기서 주피터 노트북을 사용하고, 불러오고자 하는 데이터가 ..
[개념] Python Pandas에 대해 이해해보자 3 (기술통계, 결측값 처리, 각종 파일 형식 불러오기와 내보내기) Pandas Data frame 자료형 만들기 Series 자료형 만들기 기술통계 NA값 처리 엑셀 파일 불러오기 (파일 형식: xlsx, csv, Pandas_dataframe(pickle), json; txt도 가능) 오늘은 Pandas의 기술통계와 결측값(NA)처리에 대해 알아보자. 3. 기술통계 데이터프레임에 대한 간단한 기술통계 자료를 한 눈에 보여주는 코드 .describe() 먼저 데이터프레임을 만들어보자. #데이터프레임에 대한 간단한 요약 통계 #numpy의 random 함수로 난수를 생성해보자. import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(5, 5), columns = list('ABCDE')) df 이..
[개념] Python Pandas에 대해 이해해보자 2 (Series 자료형 생성, Series형 조회, Series형 사칙연산) 2020/08/25 - [통계] - [개념] Python PANDAS에 대해 이해해보자 1 (데이터프레임 생성, 행과 열 조회(.loc, .iloc), 새로운 칼럼 추가, 칼럼[개념] Python PANDAS에 대해 이해해보자 1 (데이터프레임 생성, 행과 열 조회(.loc, .iloc), 새로운 칼럼 (Pandas 라이브러리로 할 수 있는 일들을 조사해보고 정리하는 글입니다.) Python은 R처럼 데이터/통계 분석용으로 만들어진 프로그램이 아니라 프로그래밍용 언어이기 떄문에 일반적으로 통계분석stat-thon.tistory.com데이터 프레임에 대한 정리는 위 링크를 통해 확인PandasData frame 자료형 만들기Series 자료형 만들기기술통계NA값 처리엑셀 파일 불러오기 (파일 형식: xls..
[개념] Python Pandas에 대해 이해해보자 1 (데이터프레임 생성, 행과 열 조회(.loc, .iloc), 새로운 칼럼 추가, 칼럼 (Pandas 라이브러리로 할 수 있는 일들을 조사해보고 정리하는 글입니다.) Python은 R처럼 데이터/통계 분석용으로 만들어진 프로그램이 아니라 프로그래밍용 언어이기 떄문에 일반적으로 통계분석을 위한 라이브러리를 따로 설치하여 사용한다. 라이브러리란 개념은 파이썬에 내장되어있는 기본 함수들을 제외하고 다른 기능들을 포함해 만들어놓은 패키지라고 생각하면 될 것 같다. 라이브러리 중에서도 통계분석에 빼놓을 수 없는 패키지가 바로 Pandas다. Pandas Data frame 자료형 만들기 Series 자료형 만들기 기술통계 NA값 처리 엑셀 파일 불러오기 (파일 형식: xlsx, csv, Pandas_dataframe(pickle), json; txt도 가능) 위의 기능들이 Pandas의 대표적인 기..
[예제] Python 조건문 심화 예제 4 (세 정수 중 가장 큰 정수 출력) [문제 출처] 창의적 프로그래밍을 위한 파이썬/생능출판사/한혁수/p.177 문제. 세 개의 양의 정수를 입력받아 가장 작은 수를 출력하는 프로그램을 작성하라. [1차 시도] #가장 큰 정수 출력 예제 #조건1. 정수 3번 입력 #조건2. 그 중 가장 큰 정수 출력 n1 = int(input("num1?")) n2 = int(input("num2?")) n3 = int(input("num3?")) if n1 = n3: print(n2) else: print(n3) else: if n1 > n3: print(n1) else: print(n3) 성공! 근데 사실 조건문을 굳이 안 쓰는게 편하다. n1 = int(input("num1? ")) n2 = int(input("num2? "))..
[예제] Python 조건문 심화 예제 3 (백화점 이벤트 예제) [문제 출처] 창의적 프로그래밍을 위한 파이썬/생능출판사/한혁수/p.172 문제. 백화점에서 이벤트를 진행한다. 고객들에게 성별, 나이별로 적립금을 다르게 지급하려 한다. 남자는 나이에 상관없이 기존 적립금의 2배, 20대 미만 여자는 1.5배, 20대 여자는 2배, 30대 이상 여자는 3배를 적립해주려 한다. 고객의 나이와 성별을 입력해서 적립금을 얼마나 더 받을 수 있는지 프로그램을 통해서 구해보자. [1차 시도] #백화점 적립금 예제 #조건1. 고객의 성별, 나이를 입력받을 것 #조건2. 남자는 나이에 상관없이 적립금 '2배'출력 #조건3. 여자는 20대 미만 '1.5배', 20대 '2배', 30대 이상 '3배' 출력 age = int(input("나이? ")) gender = input("남자 o..
[예제] Python 조건문 심화 예제 2 (if ~ elif ~ else 조건문) 그동안 소스코드 블로그 글에 첨부하는 기능을 몰라서 아쉬워하다가 드디어 알아냈다. 티스토리 플러그인 기능을 통해 아주 간단하게 코드를 첨부할 수 있게 됐다. 자 그럼 간단한 조건문 예제를 통해서 if ~ elif ~else 조건문을 배워보자. 먼저 if ~ elif ~ else 조건문을 설명하자면 if 조건1: 행동1 elif 조건2: 행동2 elif 조건3: 행동3 else: 행동4 위와 같은 형식으로 명령을 할 수 있다. 기존에 배운 조건문에서 더 세세하게 조건을 분류할 수 있는 것이다. 예를 들어, 컴퓨터의 가격이 100만원 초과면 하이엔드급, 100만원~50만원이면 메인스트림급, 50만원 미만이면 저가형 이라고 분류한다고 가정해보자. 이 경우 전에 배운 if~else문으로는 식을 다 표현할 수 없..
[예제] Python 조건문 심화 예제 1 (회원가입 예제) 조건문 심화 첫째로 If ~ elif ~ else ~ 구문을 배운다. (if-elif-else문) 두번째로 조건문 안에 조건문을 하나 더 넣는 방법을 배운다. (중첩조건문) 이 중에 적절한 조건문을 고르는 것은 조건문 알고리즘을 그려서 적절한 모형을 판단한 후에 진행하는 것이 좋다. - 회원가입 예제 조건1. id와 password 변수를 입력 받을 것 조건2. id의 길이가 10을 초과하면 '회원가입 실패: id 길이가 10을 초과' 출력 조건3. password의 길이가 10을 초과하면 '회원가입 실패: password 길이가 10을 초과' 출력 힌트. 문자길이는 len() 함수로 알 수 있음 중첩조건문을 이용해 성공적인 프로그램 코딩에 성공했다. [문제 출처] 창의적 프로그래밍을 위한 파이썬/생능출..
[기본] Python 조건문(비교 연산자, 논리 연산자, 기본조건문) 먼저 파이썬의 비교 연산자를 알아보자. 비교 연산자x==yx!=yx>yx=yx
[기초] Python 강제 형 변환(str, int, float) 자료형을 원하는 형태로 변환해줄 수 있다. 물론 문자 그 자체를 숫자형으로 바꾸는 것은 에러가 뜨지만, 숫자를 문자형으로 바꾼다던가 문자열로 설정된 숫자를 숫자형으로 바꾸는 것 등은 간단히 할 수 있다. 대표적인 형 변환 함수로는 int, float, str 이 있다. 변수명 = int(변수명) 변수명 = float(변수명) 변수명 = str(변수명) 이외에 다른 자료형들도 형변환이 가능한데 오늘은 아주 간단하게 세가지 자료형만 살펴보려고 한다. 간단히 자료형 변환을 살펴보았다. 이제 다음으로는 조건문을 봐야하는데.. 귀찮은 부분이다..
[기초] Python 입력, 출력 함수 (input, print) 입력함수 (Input) 파이썬에서 입력에 사용하는 input 함수는 쉽게 생각하면, 내가 데이터를 입력하는 것이 아니라 내가 상대방에게 질문을 했을 때 그에 대한 답을 여기에 입력해주세요~ 할 때 쓰는 함수다. 사용하는 함수는 input으로 아래와 같이 사용한다. 변수명 = input() or 변수명 = input("하고싶은 말") 예를 들어 내가 상대방의 이름을 알아내고 싶은 상황이라면 name = input("당신의 이름은 무엇인가요?") 처럼 함수를 만들어 사용한다. 이 함수를 입력하면 출력창에 "당신의 이름은 무엇인가요?" 가 뜨게 되고 그에 대한 답을 타이핑 할 수 있는 상태가 된다. 이제 이 공간에 사용자가 답변을 입력하게 되면 name 변수에 답변 데이터가 할당된다! 이렇게 Input 함수를..
[기초] Python 자료형 확인 함수 type()과 문자열(string) 연산(인덱싱, 슬라이싱, 병합, 반복, 문자길이 계산) 자료형 반환 함수 type()type() 함수로 자료형을 확인할 수 있다. string 연산문자열도 가능한 연산이 있다. string 병합 (concatenation) string 반복 (iteration) string 길이 계산 (length) string 내 문자에 순번 부여 (index) string 일부 추출 (slice)1. 문자열 병합 (string concatenation) + 를 사용해서 간단하게 문자열 두개를 합칠 수 있다. 2. 문자열 반복(string iteration) * 를 사용해 같은 문자열을 여러번 반복할 수 있다. 3. 문자열 길이 계산 (string length) len() 함수를 이용해 문자열의 글자 수를 계산할 수 있다.단, 한 칸의 공백은 문자 길이 하나로 계산된다. ..
[개념] Python의 기본자료형 개념(int, float, complex, boolean, str, list, tuple, set, dict) 프로그래밍 언어에서 자료형이 무엇인지 꼭 대략적으로라도 개념을 알아야 한다. 자료형은 컴퓨터가 자료를 인식하는 형식이다. 예를 들어 20200822라는 데이터가 주어졌다고 가정해보자. 우리는 기본적(Default)으로 이를 숫자로 인식하지만 보기에 따라 날짜라고 인식할 수도 있고, 상황에 따라 문자라고 인식할 수도 있다. 컴퓨터도 마찬가지다. 컴퓨터에 20200822라는 데이터를 입력할 때, 컴퓨터는 입력된 데이터의 형식으로 데이터를 인식한다. 이를 정수(숫자), 날짜, 문자로 인식하는 것은 사람이 입력해주기 나름이라는 것이다. 그래서 만약에 파이썬에 어떤 데이터를 불러왔는데, 숫자값이 정수형이 아닌 문자형으로 저장되어 있었다면 우리는 이 값을 이용한 연산을 할 수가 없다. 왜냐하면 우리 눈에는 숫자로 ..