언어/R (6) 썸네일형 리스트형 11/12 R 배운점 1. cpu 병렬처리를 위해서 doParallel이라는 라이브러리를 사용. 2. detectCores() 함수로 cpu의 개수를 저장하고 3. registerDoParallel() 함수에 cpu 개수를 집어 넣어서 해당 개수만큼의 cpu를 병렬처리 할 수 있음 4. 랜덤포레스트 돌릴 때 target 클래스를 말하는 level로 숫자를 쓰면 오류 생김. level을 숫자가 아닌 문자로 시작하도록 변경해줘야 문제가 생기지 않음. 5. 랜덤포레스트 mnist데이터로 돌리는거 생각보다 시간이 오래 걸림. 10/31 배운점과 의문점 배운점 1. R에선 for문 안에서 반복인자 i를 쓸 때, 예를들어 데이터프레임의 행과 열을 계산하는데 i인자를 쓰면 파이썬처럼 원하는대로 인덱싱, 슬라이싱이 되지 않음 2. positive defininte matrix 양정치행렬인지 묻는 것은 역행렬이 있냐 없냐 (non-singular vs singular matrix) 3. 자꾸 데이터 결측 확인 안 해서 안 돌아가는 걸 다른 것 때문에 그런줄 알고 시간 쓸데없이 오래 쓰는데 확인 잘 좀 하자. 의문점 1. vbmp 패키지에서 vbmp 함수 인자로 theta를 입력할 때, theta는 어떤 벡터인데 그 벡터 길이가 길어질수록 성능이 좋아지는 효과가 있었음. 이유는 아직 파악 못함 2. train 함수로 학습시킬때, naivebayes 방법에서 뭔가.. [R/에러] 네임스페이스 '패키지' ~.~.~는 로드되었으나 >= ~.~.~가 필요합니다 -> 이 오류는 백신 프로그램으로 인한 오류일 가능성이 높다. 위와 같은 문제로 너무 화가나서 검색을 해보니 백신프로그램이 파일을 이동시키지 못하게 막아서 생긴다고 했습니다. 제 노트북에 예전에 받아둔 안랩 세이프 트랜잭션이 있다는 걸 그때 깨닫게 되었어요. 다른 분들은 잠시 백신을 꺼두고 했던데 저는 화가난 나머지 바로 안랩을 제어판에서 삭제하고 다시 시도해보았습니다. 그 결과 업데이트가 안 되던 일부 패키지는 성공적으로 업데이트 되었습니다. 하지만 여전히 소수의 패키지가 업데이트 되지 않았는데요. 필요한 패키지는 성공적으로 작동해서 일단 넘어가기로 했습니다. 나머지 패키지들도 해결하게 되면 다시 포스팅하겠습니다. [반성] t.test의 인수로 mean을 쓰면 안된다. 나만 몰랐던 것 같아서 기록으로 남기는 멍청한 실수.. R에서 t.test 할 때 검정하고자 하는 대립가설의 평균 mu1의 인수는 mu이다. 나도 알고 있었는데 과제 중에 무의식이 mean이라고 입력을 했다. 에러가 안 뜨고 바로 되길래 그냥 그 결과를 썼다. 근데 알고보니 mean에 입력한 수를 mu로 인식하지 않았다. 그리고 검정은 Default 값인 mu = 0으로 검정이 되었다. 보통 잘못된 인수를 입력하면 에러가 뜨니까 넘어가버린 내 불찰이다. 심지어 결과 창에도 'alternative hypothesis: true mean is not equal to 0'라고 친절히 나오는데 그것도 제대로 안 보고 넘어갔다. 부끄럽기 그지없어서 기록으로 남겨본다... [설치] R studio 다운로드 R studio는 간단히 말해 사용자가 사용하기 불편하게 되어있는 R을, 시각적으로 개선해 사용자들이 편하게 코딩할 수 있도록 만들어진 R 실행 프로그램이라고 생각하면 될 것 같다.(주관적 견해) 그냥 R을 사용하면 스크립트 창이 명령프롬프트 창처럼 되어있기 때문에 코딩을 하는 데에 불편함이 따른다. 그래서 사용자 시각에서 좀 더 편리하게 이용할 수 있도록 만들어진 프로그램인 것이다. R studio를 사용하면 스크립트 입력이 편해지고, 각종 시각화에도 유리하다. 응용통계학과에서도 처음 R을 다룰 때 R script를 사용해 기본을 배우기도 하지만, 결국 시각화를 위해 R studio로 넘어가게 된다. R studio는 R을 기반으로 하기 때문에 먼저 R을 받아야 되는 것으로 알고있다. 그렇기 때문에 아.. [설치] R 다운로드 과정 2020년 8월 21일 기준으로 R 4.0.2 버전이 최신 버전이다. cran.r-project.org/bin/windows/base/ Download R-4.0.2 for Windows. The R-project for statistical computing. If you want to double-check that the package you have downloaded matches the package distributed by CRAN, you can compare the md5sum of the .exe to the fingerprint on the master server. You will need a version of md5sum for windows: both graphical and.. 이전 1 다음