반응형

pandas 3

Pandas (1) - Pandas 와 Series 다루기

Pandas Pandas의 소개 Pandas는 앞으로 가장 자주 살펴볼 라이브러리이다. 고수준의 자료구조와 파이썬에서 빠르고 쉽게 사용할 수 있는 데이터 분석 도구를 포함하고 있다. Pandas는 다른 산술 계산 도구인 NumPy와 SciPy, 분석 라이브러리인 statsmodels와 scikit-learn, 시각화 도구인 amtplotlib과 함께 사용하는 경우가 흔하다. Pandas는 for 문을 사용하지 않고 데이터를 처리한다거나 배열 기반의 함수를 제공하는 등 NumPy의 배열 기반 뎨산 스타일을 많이 차용했다. Pandas가 NumPy의 스타일을 많이 차용했지만 가장 큰 차이점은 Pandas는 표 형식의 데이터나 다양한 형태의 데이터를 다루는데 초점을 맞춰서 설계했다는 것이다. NumPy는 단일..

머신러닝/pandas 2021.10.09

NumPy의 기초(4)

배열을 이용한 배열지향 프로그래밍 NumPy 배열을 사용하면 반복문을 작성하지 않고 간결한 배열 연산을 사용해 많은 종류의 데이터 처리 작업을 할 수 있다. 배열 연산을 사용해서 반복문을 명시적으로 제거하는 기법을 흔히 벡터화라고 부르는데 일반적으로 벡터화된 배열에 대한 산술 연산은 순수 파이썬 연산에 비해 2~3배에서 많게는 수십,수백 배까지 빠르다. 처음으로 다룰 브로드캐스팅은 아주 강력한 벡터 연산 방법이다. 예를 들어 값이 놓여 있는 그리드에 sqrt(x^2 + y^2)을 계산을 한다고 하자. np.meshgrid 함수는 두 개의 1차원 배열을 받아서 가능한 모든(x,y)짝을 만들 수 있는 2차원 배열 두개를 반환한다. in : points = np.arange(-5,5,0.01) # -5부터 4..

머신러닝/numpy 2021.10.06

머신러닝에 필요한 라이브러리

모듈 정리 Numpy(Numerical Python) 파이썬 산술 계산의 주춧돌 같은 라이브러리 자료구조, 자료구조, 알고리즘 산술 데이터를 다루는 대부분의 과학 계산 애플리케이션에 필요로 하는 라이브러리를 제공한다. 빠르고 효율적인 다차원 배열 객채 ndarray 배열 원소를 다루거나 배열 간의 수학 계산을 수행하는 함수 디스크로부터 배열 기반의 데이터를 읽거나 쓸 수 있는 도구 선형대수 계산, 푸리에 변환, 난수 생성기 파이썬 확장과 C,C++ 코드에서 NumPy의 자료구조에 접근하고 계산 기능을 사용할 수 있도록 해주는 C API 고속 배열 처리 외에도 NumPy는 데이터 분석 알고리즘에 사용할 데이터 컨테이너의 역할을 한다. 수치 데이터라면 NumPy는 파이썬 내장 자료구조보다 훨씬 효율적인 방법..

머신러닝 2021.09.09
반응형