RWDR
데이터 분석 학습 일지
-
자료 구조 in R (1)
자료 구조 (1) 스칼라 벡터 리스트 (2) 행렬 배열 데이터 프레임 스칼라(scalar) 스칼라는 하나의 값만 포함하는 변수를 말합니다. 이전 글에서 생성 및 변수 할당 등을 다뤘으니 이름만 알고 갑시다. 벡터 (vector) 벡터(vector)는 1차원의 자료 구조로 하나의 데이터 타입만 허용합니다. 벡터를 생성하면서 데이터 타입 관련해서도 봅시다. 벡터의 생성 v1 <- c(1,2,3)...
-
자료 구조 in R (2)
자료 구조 (1) 스칼라 벡터 리스트 (2) 행렬 배열 데이터 프레임 행렬(matrix) 1. 생성 matrix(data = 1:9, # matrix 구성 데이터 nrow = 3, # 행 수 ncol = 3, # 컬럼 수 byrow = T) # 행 우선순위 여부(default F) [,1] [,2] [,3] [1,] 1 2 3 [2,] 4...
-
beautifulsoup을 이용한 웹 크롤링
웹 스크레이핑과 크롤링 urllib 이해하기 서울시 홈페이지 메인 가져오기 beautifulsoup 이해하기 네이버에서 가져오기 다음 뉴스 내용 가져오기 안티 크롤링 방지 웹 스크레이핑과 크롤링 웹 스크레이핑(scraping)은 html, css기반의 웹 페이지에서 파싱으로 필요한 정보만을 가져오는 것을 말합니다. 이런 활동을 정기적으로 하는 것을 웹 크롤링이라고 합니다. Python으로 하는 스크레이핑의 장점은 일일히 사이트 뒤져가면서...
-
변수(Variables)
변수?? 객체?? 변수 생성 형 변환 함수 변수 연속 생성 변수 확인 및 제거 NA와 NULL 사칙 연산 변수?? 객체?? 다른 언어에서 보통은 숫자, 문자 등을 담는 것을 변수라고 이야기하는데 R에서는 객체(Object)라고 합니다. 그런데 변수와 객체를 혼용해서 사용하는 경우가 많기 때문에 편의상 변수라고 하겠습니다. 변수를 만들고 값을 지정하는 과정에서 주의해야할...
-
도커(Docker)
도커(Docker란? 도커 설치하기 Visual Studio Code 설치하기 도커 사용하기 도커에 Python 설치 컨테이너 저장하기 마운트 도커란? VMWare나 VirtureBox같은 기존의 가상머신의 OS 가상화와 다른 방식인 컨테이너(Container)기반의 가상화 플랫폼입니다. 기존 OS 위에 추가로 게스트 OS를 올려야하는 OS 가상화에 비해 성능적인 면에서 우위를 점한다고 볼 수 있습니다. 도커 설치하기 먼저 도커 홈페이지에 들어가셔서...